除了降價,阿里雲把本年度第一波重要發布放在了「人工智慧」上

文丨龜途慢慢

昨天,阿里本年度第一次重量級的大會——雲棲大會·深圳峰會——在深圳舉行,會上,除了阿里雲總裁胡曉明直接對「馬化騰和他的團隊」表示了不滿之外,更值得注意的恐怕還是阿里雲在會上發布的幾款新產品、新戰略和新技術。

在雲計算市場本身,阿里雲宣布新開服的華北 3 數據中心降價 20%,以及 CDN 大陸地區的產品組合降價 35%,並且還發布了包括高性能計算 ECS 產品、新的數據中心,以及新的存儲產品等多款新產品。除此之外,ET 醫療大腦、ET 工業大腦,以及新的機器學習平台 PAI2.0 都是阿里雲在人工智慧方面的新舉措。從中,我們也可以看出阿里雲除了繼續鞏固自己在國內雲計算市場上的優勢地位之外,在新技術的開發與應用上也逐漸開始發力了。

(阿里雲總裁胡曉明)

ET 醫療大腦與 ET 工業大腦

首先,全場最引人關注的莫過於 ET 醫療大腦項目了。因為幾乎所有人都承認,醫療市場將會在未來爆發出極大的潛力,因此有很多大公司都在布局這個領域,比如國內的百度以及國外的 IBM 等公司。而阿里雲通過發布 ET 醫療大腦,也宣布正式進入醫療 AI 領域。

阿里雲方面表示,經過一年多的研究訓練,人工智慧 ET 已具備多項醫療能力,可在患者虛擬助理、醫學影像、精準醫療、藥效挖掘、新葯研發、健康管理等領域承擔醫生助手的角色。而它的背後則是阿里投入了大量資源,採用深度學習技術,通過海量的數據作為示例來訓練機器完成特定任務。通俗地說,就是讓計算機通過學習病例數據來提升醫術。由於可以 24 小時不睡覺,同時處理成千上萬項任務,ET 的學習進步速度大大超過人類。

阿里雲人工智慧科學家閔萬里說:「在多個病症的測試中我們意識機器不僅能夠完成任務,而且在某些方面做的和人類醫生一樣好。ET 完全有資格成為醫生的助理。」

除了能大幅提升醫生的工作效率外,ET 醫療大腦還嘗試從根本上戰勝癌症。通過和華大基因合作,ET 對大量肺腺癌病例的 DNA 序列進行分析,尋找致病的關鍵基因突變。

「我們將 ET 醫療大腦設置為一個開放的人工智慧系統。除了阿里雲的人工智慧科學家投入到研發當中,我們更希望能吸收外部精良的演算法與醫學經驗,這樣 ET 才能更快地成長為一名高級醫師。」閔萬里說。

同時,阿里雲還宣布聯合英特爾、LinkDoc 啟動天池醫療 AI 系列賽,第一季對早期肺癌診斷髮起挑戰。

此外,阿里雲也在雲棲大會深圳峰會上正式發布了 ET 工業大腦,讓工業生產線上龐大的鋼鐵軀體擁有智能大腦。阿里雲總裁胡曉明表示,我們希望利用人工智慧技術發揮「中國智造 1%」的威力。中國製造業如果提升 1% 的良品率,意味著一年可以增加上萬億的利潤。

在這個部分,阿里雲舉了蘇州能源巨頭協鑫光伏的例子。這家廠商將標準化車間所有埠的數據傳入工業大腦,隨後通過人工智慧演算法,對所有關聯參數進行深度學習計算,分析出與良品率最相關的 60 個關鍵參數,並搭建參數曲線,在生產過程中實時監測和控制變數。

據胡曉明表示,目前,通過 ET 工業大腦的幫助,協鑫光伏的生產良品率已經提升 1 個百分點,每年可節省上億元的生產成本。

閔萬里透露,目前 ET 工業大腦已經在流程製造的數據化控制、生產線的升級換代、工藝改良、設備故障預測等方面開展工作。ET 的目標是成為一個不斷吸收專業知識的「大腦」,可以指揮各種類型的工業軀體。「我們希望用 21 世紀的機器智能,幫助人類更好地指揮 20 世紀的機器」。

新的機器學習平台 PAI2.0

而另一個重要的人工智慧領域的新發布就是機器學習平台 PAI2.0。相比 1.0 版本,PAI 2.0 有多項重大更新,除增加了 100 余種演算法外,更重要的是對主流深度學習框架 TensorFlow、Caffe 和 MXNet 的全面兼容。

此次 PAI2.0 的重大升級主要包括以下方面:

1、全面擁抱開源

PAI2.0 編程介面完全兼容深度學習框架:Tensorflow、Caffe 以及 MXNet,用戶只需要將自己本地編寫的代碼文件上傳至雲端就可以執行。

Tensorflow、Caffe 和 MXNet 是目前全球主流的深度學習開源框架。Tensorflow 開源演算法和模型最豐富;Caffe 是經典的圖形領域框架,使用簡單;MXNet 分散式性能優異。

對於底層計算資源,PAI2.0 提供了強大的雲端異構計算資源,包含 CPU、GPU、FPGA。在 GPU 方面,PAI2.0 可以靈活實現多卡調度。

藉助這些框架以及強大的計算資源,用戶能非常方便地就可以將計算任務下發到對應的分散式計算機群上,實現深度學習模型訓練與預測。

2、更豐富的演算法庫

PAI2.0 提供 100 余種演算法組件,涵蓋了分類、回歸、聚類等常用場景,還針對主流的演算法應用場景,提供了偏向業務的演算法,包含文本分析、關係分析、推薦 3 種類別。

「演算法全部脫胎於阿里巴巴集團內部的業務實踐,所有演算法都經歷過 PB 級數據和複雜業務場景的錘鍊,具備成熟穩定的特點」,阿里雲首席科學家周靖人說。

3、支持更大規模的數據訓練

PAI 2.0 新增了參數伺服器(Parameter Server)架構的演算法。不僅能進行數據並行,同時還可將模型分片,把大的模型分為多個子集,每個參數伺服器只存一個子集,全部的參數伺服器聚合在一起拼湊成一個完整的模型。

其創新點還在於失敗重試的功能。在分散式系統上,成百上千個節點協同工作時,經常會出現一個或幾個節點掛掉的情況,如果沒有失敗重試機制,任務就會有一定的幾率失敗,需要重新提交任務到集群調度。PS 演算法支持千億特徵、萬億模型和萬億樣本直至 PB 級的數據訓練,適合於電商、廣告等數據規模巨大的推薦場景。

阿里雲首席科學家周靖人說,在過去的一年時間裡我們協助客戶落地了多項重大的人工智慧應用。但人工智慧要想真正成為成為普惠科技,需要一款更加通用的生產工具。PAI2.0 正是為此而生。

人工智慧綜合了多門學科的技術,對人才要求極其高,除了懂統計學中各種複雜的機器學習演算法,還要懂實現邏輯以及分散式架構理論。PAI 可以大幅的降低人工智慧的門檻以及開發成本。

從操作界面來看,PAI 沒有繁瑣的公式和複雜的代碼邏輯,用戶看到的是各種分門別類被封裝好的演算法組件。每一個實驗步驟都提供可視化的監控頁面。在深度學習黑箱透明化方面,PAI 也同時集成了各種可視化工具。

PAI 的基礎設施和計算框架建立在阿里雲飛天計算平台之上,通過雲的模式大幅降低了計算成本,支持 MR、SQL、MPI、PS、GRAPH 等多種分散式計算框架,對於底層的 CPU 和 GPU 計算機群可以靈活調用。

兩年時間裡,PAI 在阿里巴巴內部已經被廣泛使用。以淘寶搜索為例,搜索結果會基於商品和用戶的特徵進行排序。通過使用參數伺服器,淘寶可以把百億個特徵的模型,分散到數十個乃至於上百個參數伺服器上,打破了規模的瓶頸。

在阿里雲的客戶當中,廣東省氣象局對 PAI 的使用最具代表性。他們使用 PAI 對臨近預報 (0-3 小時內) 的降雨量進行建模預測。通過拖拽操作就完成了數據清洗、特徵工程,非線性機器學習演算法訓練以及結果評估的工作。

PAI 還被應用在各種前沿科技領域。華大基因聯合阿里雲科學家,正使用 PAI 對肺腺癌患者基因進行分析,試圖尋找到導致肺腺癌病發的關鍵基因突變。

原文鏈接→除了降價,阿里雲把本年度第一波重要發布放在了「人工智慧」上

推薦閱讀:

如何在阿里雲上部署私有的Docker Registry
阿里雲發布的量子分身Me2有可能實現嗎?
MaxCompute - ODPS重裝上陣 第二彈 - 新的基本數據類型與內建函數
如何用阿里雲運行tensorflow?
Docker常見故障排查指南-基於阿里雲容器服務

TAG:阿里云 | 人工智能 | 医疗 |