阿里雲升級人工智慧戰略,用大數據AI備戰新七年大考
「擁有了數據的積累,機器將替代人類的智商,我們判斷人工智慧的時代已經到來。」這是阿里雲總裁胡曉明在2016年8月10日舉辦的阿里雲棲大會·北京峰會上對外表達的觀點,他說:「我們認為人類一定會進入數據時代,我們認為人類一定會進入到人工智慧的時代。」
2016年,阿里雲正在跨越七年之癢。2009年2月,飛天正式寫下第一行代碼,由此拉開了阿里雲的歷史。七年後,德意志銀行2016年4月的研究報告指出,在中國雲計算市場,阿里的雲計算業務規模是第二名騰訊的10倍。阿里雲進入全球前三,形成「3A(AWS、Azure、Alibaba Cloud)」競爭局面。
在本次雲棲北京峰會上,阿里雲兩度「變臉」:先是全面更新了品牌Logo,再就是把原先的人工智慧機器人阿里小Ai全面升級為人工智慧「大腦」ET,阿里雲稱ET的背後為大數據AI技術。新七年中,阿里雲面臨著「從1到N」的大考,大數據AI或成為阿里雲的決勝戰略。
什麼是大數據AI
(上圖為阿里雲首席科學家周靖人)
所謂大數據AI,就是把大數據與AI技術相結合。阿里雲首席科學家周靖人表示,ET的背後使用了阿里雲多項人工智慧的技術,特別是自然語言識別、實時視頻分析、語音識別及語音合成、人機交互、知識圖譜等,但更為重要的是利用了大數據技術。
大數據與AI的關聯在於:首先,隨著大數據的發展和分散式系統計算能力的突飛猛進,不再需要對數據進行取樣或裁剪,而是可以利用成千上百的機器進行數據分析,在這個背景下再通過類似人類的神經網路無限逼近現實,最終促使人工智慧更加精準。
其次,大數據時代的到來,也意味著有各式豐富數據源從不同角度對現實進行描述,再利用人工智慧挖掘數據的關聯,從而極大提高了人工智慧的準確性。「毫不誇張地講,人工智慧和大數據是相輔相成、相互依賴、相互促進的兩個方面。」 周靖人表示。
大數據AI還把人工智慧從個體感知推進到了全局智能階段。最典型的例子就是城市全局交通狀況預測。2015年12月,浙江省交通運輸廳公布了一項新的試點項目:把歷史數據、實時數據與路網狀況結合,基於阿里雲大數據平台預測未來一小時內的路況,結果顯示實時路況監測成本下降了90%,未來路況預測準確率在91%以上。
該項目的難點在於,城市交通情況非常複雜,中間有多個路段、多個十字路口,而且十字路口、路段之間的關係也是錯綜複雜、千絲萬縷,所以整體城市交通情況預測更需要的是了解城市每一個路段、每一個十字路口的交通狀況及其相互關係。這不僅僅需要處理一個智能攝像頭,而要處理成千上萬的攝像頭,而且是實時、精準地處理。
因此,對一個城市的交通狀態做整體建模,要首先對每一個路段或十字路口都進行特殊的建模,形成成千上萬的計算模型,然後再結合全局性交通洞察,才能夠對整個城市的交通狀況進行智能預測。這已經不僅是針對單個目標進行優化的深度學習演算法,而是能夠進行全局性、多目標優化的人工智慧演算法。
阿里雲獨特的AI之路
(上圖為阿里雲新Logo )
阿里巴巴集團CTO張建鋒8月在西雅圖表示,不論是人工智慧還是其他前沿技術,都離不開高質量的數據、強大的計算平台和高效的演算法平台,只有把這三項結合在一起,才能真正取得突破。阿里雲總裁胡曉明也在雲棲大會·北京峰會上強調了同樣的觀點。
張建鋒表示,阿里巴巴將自己定位成大數據公司,是因為擁有眾多的高質量數據。阿里的數據有三個明顯的特徵:首先阿里的數據是用戶通過購買行為產生,與搜索等場景相比,數據更加真實;其次相較於社交等數據,阿里的數據高度結構化,例如淘寶上的商品描述就高達一百多個緯度;第三非常密集而且實時,阿里日常有超過1億用戶在訪問。
周靖人強調,把人工智慧加上大數據就形成了數據智能,在這個領域的創新是阿里雲區別於其它雲提供商的一個重要技術不同點。2016年3月,阿里巴巴集團宣布2016財年電商交易額(GMV)突破3萬億元人民幣。這3萬億人民幣的電商交易額背後是龐大的經濟數據,而且阿里在2015年3月就已經推出了國內首個面向政府開放的大數據產品「阿里經濟雲圖」。
正是因為有全局性的經濟數據,這使得阿里雲必須從全局數據分析和全局智能角度來思考人工智慧戰略,而不是僅僅解決一個人與機器下棋的微觀問題。可以理解為阿里雲的人工智慧思路是一個基於概率的全局性決策優化過程,在決策過程中需要多組變數輸入,其中的部分變數是通過基於人工神經網路的深度學習優化得來。從這個角度來看,ET更像是一個人工智慧大腦,而不是局部的神經元網路。
當然,阿里雲的人工智慧還是基於已經發布的大數據平台「數加」。在經歷「去IOE」之後,阿里用MySQL等開源資料庫以及OceanBase自研資料庫取代了傳統商業資料庫。數加平台的分析型資料庫Analytic DB是海量數據實時高並發在線分析雲計算服務,可在100毫秒內完成百億量級的多維查詢。在雲棲大會·北京峰會上,阿里雲還進一步開放開源了AliSQL,其中沉澱了阿里多年在MySQL領域的經驗和解決方案。
阿里雲加強了基礎設施層面的投入。在雲棲大會·北京峰會上,阿里雲宣布位於歐洲、澳洲、中東和日本數據中心將於今年第4季度開服,之前阿里雲已經在香港、新加坡、美國西部和美國東部設立有數據中心。而在2016年7月Gartner公布的2015年全球公共雲存儲服務魔力象限中,阿里雲入圍全球TOP5之列,成為首家入選的中國雲服務商。
「改變,是為了更好地出發」
(上圖為阿里雲新舊Logo對比)
阿里雲總裁胡曉明解讀新Logo的內部員工信里說:「改變,是為了更好地出發。」
改變首先就是引進人才。僅以吸引人工智慧人才為例,胡曉明強調「阿里從原來18個人做技術,到現在將近百分之四五十以上都是科技人才為主。我們這輪判斷要加大對人工智慧的投入,所以我們從全球加大了對人工智慧科學家引入的力度。」
2016年7月就有兩位世界級人工智慧科學家加入阿里雲。一位就是周靖人博士,早年畢業於中國科學技術大學,後獲得哥倫比亞大學計算機博士學位,是雲計算大數據、大規模分散式系統和資料庫等領域的國際專家,多次在頂尖國際期刊和會議上發表論文,長期擔任知名學術期刊和會議程序委員會委員或主席。
周靖人從2004年開始在微軟美國研究院工作,2008年任微軟必應搜索的架構師,負責開發雲計算架構的大規模分散式計算系統,該系統是整個必應搜索後台數據服務的基石。加入阿里雲後,周靖人主要帶領阿里雲中美兩地的研發團隊,總體負責大數據平台和人工智慧研究機構iDST的科研工作。
另一位是IEEE國際電氣與電子工程協會院士華先勝。華先勝畢業於北京大學,獲得應用數學博士學位,曾獲選美國計算機協會ACM2015年度傑出科學家、MIT TR35大獎(全球35位35歲以下的傑出青年創新人物)等,是視覺識別和搜索領域的國際級權威學者。華先勝將帶領阿里雲的視覺計算團隊,專註於視頻圖像分析、識別和搜索等領域的AI技術研發。
手機淘寶的「拍立淘」關鍵技術就是由華先勝帶領的團隊研發完成。用戶點擊手機淘寶搜索框里的「相機」圖標,對準喜歡的商品或者把商品拍成相片,淘寶就會自動識別幫助用戶尋找同款和相似商品。
除了人才引入外,更新品牌Logo是阿里雲的團隊文化煥新之舉。新的Logo從計算出發。「[ ]」來自代碼中常用的符號,代表計算;中間的「-」代表流動的數據。這其實回歸了雲計算的初心,就是代碼加上數據。特別的,作為現代社會基礎設施的計算和數據,隨時隨地處於運行狀態,因此阿里雲的新Logo也是動態的。
新的Logo摒棄了之前的中文字「雲」,而代之以代碼常用符號,這還因為代碼是無國界的通用語言,新Logo 即代表著阿里雲從服務中國到服務全世界新路徑。特別設計為黑白色的新Logo,則表達了阿里雲希望與所有客戶一起計算出一個多彩繽紛的世界。
今天的阿里雲已經成為了正在成為阿里巴巴集團的「第三級火箭」。國際上,阿里雲開始與亞馬遜、微軟的雲計算並肩。然而,胡曉明在內部員工信里說,不應該忘記過去七年的艱苦歷程。「我們不會忘記,客戶將故障通知的電話鈴聲設置成孩子的哭泣聲。我們不會忘記,『不靠譜』的阿里雲,曾一度差點被解散。我們不會忘記,2012年雙11,阿里雲經歷的生死之戰。」
「7年,孤獨的、寂寞的堅持,成就了今天的阿里雲。今天,雲計算成為被整個市場追逐的『潮流』。鮮花盛開的背後,是曾經的荊棘滿地。」展望未來七年之路,阿里雲仍然面臨不小的考驗,「從0到1」固然艱難,「從1到N」也不容易,而且「從1到N」需要更高的技術與經驗。
大數據AI,是阿里雲給出的未來七年之路。(文/寧川)
【更多精彩內容 盡在《雲科技時代》微信號:CloudTechTime】
推薦閱讀:
※對象存儲OSS控制台—圖片處理
※阿里雲數據傳輸服務低價不低質,服務再升級
※Firmament:Fast, Centralized Cluster Scheduling at Scale(OSDI 2016)
※一鍵清理網站木馬文件,從此網站擁有專屬保鏢 ——阿里雲虛擬主機推出木馬查殺功能
※互聯網巨頭湧向金融雲,僅靠體量就能取勝嗎?