|清華大學教授:鄧志東——如何跑贏人工智慧新賽道
鄧志東 現為清華大學智能技術與系統國家重點實驗室教授、博士生導師。研究方向為計算智能、機器人控制與模擬、虛擬現實技術、非同步自學習控制、模糊神經網路與再勵學習機制及網路非線性動力學等。近10年來,主持或參加包括"973"子項目、國家自然科學基金項目、國家「九五"重點科技相關項目以及國家863項目等在內的20餘項國家重點科研項目。1997年獲首屆"清華大學優秀博士後"獎,連續3年獲"清華之友--優秀教師獎"。參加專著2部,發表論文60餘篇。
編者按:十九大報告提出,要加快建設製造強國,加快發展先進位造業,推動互聯網、大數據、人工智慧和實體經濟深度融合,在中高端消費、創新引領、綠色低碳、共享經濟、現代供應鏈、人力資本服務等領域培育新增長點、形成新動能。人工智慧已然成為時下最熱門的關鍵詞之一,人工智慧的發展備受關注。
自1956以來,在經歷了「兩起兩落」的波浪起伏之後,以深度學習為主要標誌的人工智慧正迎來第三次復興。新一輪人工智慧熱潮的興起,源於時代的進步,亦可謂歷史的巧合。互聯網、移動互聯網及雲平台的高速發展,使得標籤大數據洪流不斷湧現。摩爾定律的長期作用與視頻遊戲的超常發展,人工智慧硬體加速器得到迅猛發展,計算能力對大規模神經網路模型的支撐,躍升到了歷史新高度。2012年10月,大數據、大計算與深度卷積神經網路演算法的結合,似乎產生了「蝶變」。改變至此開始,在短短5年多的時間裡,以深度卷積神經網路和深度強化學習為代表的弱人工智慧,在計算機視覺、語音識別、自然語言處理、自動駕駛與大數據分析等垂直領域,取得了重大進展,在各個細分賽道日益呈現出媲美人類水平(human level)的成功,並成為主流方法。人工智慧已成為賦能產品、重塑企業與社會的利器。人工智慧初創企業不斷湧現。弱人工智慧應用成果捷報頻傳。大數據深度學習開始佔據人工智慧的舞台中心。人工智慧再次從兩次失落中走出,逐漸成為第四次產業革命的導火索及當之無愧的主角之一。
人工智慧技術在垂直細分領域媲美人類水平
· 有別於傳統模型,大數據與大計算支撐的深度卷積神經網路,在包括ImageNet視覺物體識別、LFW人臉識別、GTSRB交通標誌識別與DeepMind的唇語視讀等多項國際著名的公開評測比賽中,超過人類的識別能力;在場景語義分割、像素級實例分割、藝術作品風格提取、用戶畫像、語音輸入、語音速記、語音助手、語音聊天、真實感語音合成、文本分類、神經機器翻譯等諸多方面,已大幅度接近於人類水平。
· 結合深度卷積神經網路與蒙特卡洛樹搜索的深度強化學習,在屬於認知智能範疇的特定博弈類決策問題上,達到並超過人類職業玩家的水平。遊戲人工智慧程序DQN在49種Atari像素遊戲中,29種達到乃至超過人類職業選手的水平;AlphaGo及其升級版「大師」,橫掃人類職業冠軍,成為「圍棋上帝」;2017年10月推出的AlphaGo Zero,「無師自通」,僅通過3天的自我對弈訓練,就以100:0擊敗與李世乭對弈時的AlphaGo;2017年12月推出的通用棋類人工智慧AlphaZero,同樣無需人類任何歷史棋譜,只需3天的自弈學習,不僅可以打敗「超九段」的AlphaGo Zero,還可以同時擊敗超人類水平的國際象棋程序(Stockfish)和日本將棋程序(Elmo),表現出某些通用人工智慧的特徵。目前深度強化學習已在無限注德州撲克賽中戰勝人類職業高手,正進軍「星際爭霸」和「星際爭霸2」等戰略類遊戲以及預測蛋白質與RNA的摺疊結構,尋找新葯與新材料,甚至發現新的物理原理等。人工智慧的新戰場不斷開闢,邊界持續拓展,或會持續給人類帶來更多的驚喜和震撼。
但作為新一代人工智慧基石的深度卷積神經網路,還遠不夠完美,尚存在許多不足。例如該模型過度依賴完備大數據,沒有語義理解能力,缺乏記憶、常識、認知推理與知識學習等,其內部結構與參數不具可解釋性,不能有效利用先驗經驗與知識,魯棒性差,且僅是一個全局逼近網路。換言之,包括「特徵提取+認知推理」的小數據深度學習方法,可解釋的深度學習方法,深度學習與知識圖譜、語言智能等的結合,綜合數據與知識、「能理解會思考」的認知智能方法以及具有多任務學習能力的通用人工智慧等,仍有待艱難探索。
弱人工智慧產業出現爆發性增長
人工智慧產業鏈包括基礎層、核心層和應用層。基礎層涉及大數據、人工智慧晶元、開源代碼框架和雲平台等。核心層包括視覺引擎、語音引擎和知識引擎等「操作系統」。應用層就是「人工智慧+」與「+人工智慧」。
作為基礎層的人工智慧晶元,包括英偉達的GPU,谷歌的TPU,英特爾-Movidius的 Myriad X視覺處理器,IBM、高通及HP等的類腦晶元以及其他各種基於FPGA和ASIC的深度神經網路硬體加速器。這些神經網路晶元,不僅可支持大規模深度學習模型和海量大數據,而且在強勁應用需求的驅動下,其性能正以非線性方式加速增長且成本不斷下降,呈現出新的「摩爾定律」。不同於PC時代晶元的完全受制於人,我國人工智慧晶元已湧現出諸如寒武紀、地平線、深鑒科技等初創企業,已解決了事關我國人工智慧核心基礎與安全的0到1的問題,正在進行1到N的快速迭代。
對於面嚮應用層的「人工智慧+(應用場景)」,目前深度學習正不斷向自動駕駛、服務機器人、無人零售、醫療、金融、教育、文化、法律、物流、生物、農業、旅遊、博弈類決策等眾多「關鍵性」垂直細分領域滲透,帶來了從無到有的改變。在「(應用場景)+人工智慧」,許多原有的傳統細分應用,例如圖像目標檢測/分類、場景實例語義分割/識別、刷臉、語音識別及合成、庭審速記、文本分類、廣告點擊預測、個性化新聞推送、自動問答、聊天對話、智能寫作、語言翻譯、人工智慧手機、人工智慧攝像頭、人工智慧音箱、人工智慧家電、人工智慧安防、人工智慧家居、大數據分析等,因深度學習的運用帶來性能的大幅度提升,正逐漸被人工智慧所「蠶食」。總之,人工智慧開始向全世界展現出驚人的技術能力及巨大的商業價值。無論是從亞馬遜銷量達1000餘萬台的人工智慧音箱儼然成為爭先模仿的對象,谷歌具有40種語言實時翻譯功能的Google Pixel Buds人工智慧耳塞不久前落地發布,還是從阿里的刷臉支付,亞馬遜的Amazon Go無人零售店和特斯拉的Autopilot 2.0自動駕駛汽車等,弱人工智慧的商業化落地進程明顯加快。
中國人工智慧技術與產業:短期內應走產業為先之路
2017年7月20日,國務院發布了《新一代人工智慧發展規劃》,提出到2030年,我國的人工智慧理論、技術與應用總體達到世界領先水平,成為世界主要人工智慧創新中心,實現人工智慧核心產業規模達1萬億,帶動相關產業規模超10萬億。中國人工智慧產業發展具有應用場景規模大,移動互聯網與雲計算髮展迅猛,大數據優勢明顯,商業落地速度快以及政府支持力度大等優勢。但短板是原始創新能力不足,高端基礎性人才和人工智慧工程開發人才短缺等。發展中國人工智慧應注重產業應用、商業化落地與全棧生態建設,不搞花架子。隨著《新一代人工智慧發展規劃》的啟動實施,各級政府短期內將會有大量資金投入,此時應特別注重導入市場的力量,即中國人工智慧產業的發展,應以市場為主導,以企業為主體,走產業為先之路。例如可採用以擁有大數據和人才優勢的「BAT+科大訊飛」為主的「計劃經濟」投入+其他企業的「競爭性市場經濟」資金注入模式。首先面向產業應用發展人工智慧,利用人工智慧技術賦能各行各業的產品形態、流程與服務,以便率先建成智能經濟、智能社會和智能文化,並推動軍民融合深度發展。
與此同時,為了能夠持續支撐產業發展與國家重大戰略需求,需要長期穩定地支持人工智慧前沿基礎研究。應主要以「計劃經濟」模式,對原創性基礎研究進行長期穩定支持。其實美國DARPA和國家實驗室等事關國家重大戰略意圖與重大基礎研究的科研投入,「計劃經濟」的痕迹十分明顯。目前是人工智慧歷史上發展的最好時期,也是我國面臨的難得機遇。通過與腦科學、認知科學等的交叉融合,著力突破深度學習的局限,力爭實現認知智能與通用人工智慧等人工智慧基礎理論的重大突破,為世界人工智慧的發展做出中國貢獻。
人工智慧產業的落地須結合特定應用場景
人工智慧產業發展具有四個維度,即場景、大數據、計算能力與演算法。其中大數據是基礎,計算能力是前提,演算法靠人才,應用場景最為重要。目前人工智慧已經開始滲透各行各業,早期的改變正在上演。事實上,推進特定應用場景或者垂直細分領域的人工智慧研發,通過使相應的產品、流程與服務達到與人類相當的水平,這就具有商業價值。但弱人工智慧產業的落地實踐,首要的問題還是必須結合特定的應用場景或垂直細分領域,而且要做到應用場景的細分再細分,即通過選擇一個點來進行具有耐性的縱向深耕,否則就會錯失時機,茫然而不知從何下手。
數據是基礎,人才最關鍵
私有大數據已成為弱人工智慧時代的戰略資源。在場景已經細分確定的前提下,從產業的角度來說,「人工智慧+」其實就是「大數據+」。落地應用中必須發揮工匠精神,全情專註於大數據「石油」的採集、清洗和標籤。其中採集可以利用「眾集」的互聯網思維,清洗就是脫敏或野值剔除。而標籤則需要行業頂級專家的深度「人工」參與。通過對大數據的清洗、標籤,實際就是把行業頂級專家的知識通過深度監督學習,閉環轉移給機器,從而讓人工智慧能夠站在巨人的肩膀之上。因此,大數據人工智慧在相當程度上就是「『人工』+『智能』」,即有多少的「人工」就有多少的智能,有多高水平的「人工」就有多高水平的智能。具有專家級別標籤的大數據才具有真正的商業價值。需要特別注意的是,人工智慧原型系統在一開始落地應用時,可能用戶體驗並不太好,但此時反而要大力推進應用,因為惟有通過應用中數據與演算法的不斷迭代,才能最終獲得接近於人類水平的性能迭代。
加快中國人工智慧的發展,必須大力推動實施國家大數據戰略,完善數字基礎設施與雲平台建設,破除大數據行業壟斷藩籬,實現資源整合、開放共享和安全保護,推動數字中國的建設。與此同時,應加速人才培養等人工智慧生態建設,加強理論創新、探索學科交叉和開闢新的垂直應用領域。特別是著手積極開展人工智慧對社會形態與治理、法律、倫理、就業、隱私和種族歧視等問題的研究。
技術創新本質上是體制機制創新的競爭
從某種意義上說,技術創新的競爭本質上就是體制機制創新的博弈。歷史上,我國曾錯失前三次工業革命。在第四次工業革命出現端倪之際,目前中國人工智慧發展,是第一次先知先覺,抓住機遇站在了時代的潮頭。總體而言,無論從應用場景的種類,商業落地的速度,大數據積累的規模,創新企業的活躍程度,政府的支持力度,人工智慧基礎設施的建設,我國擁有的人工智慧人才數量和發表的人工智慧論文數以及全民的關注程度等,我國的人工智慧技術與產業都屬於世界第一梯隊,全方位發力的規模與質量僅次於美國。
十九大報告提出,要加快建設製造強國,加快發展先進位造業,推動互聯網、大數據、人工智慧和實體經濟深度融合。
為此,我們必須通篇謀劃中國人工智慧技術與產業的戰略布局,通過體制機制創新,全鏈設計,綜合施策,從產業鏈上游的創業孵化,中游的科技成果轉化與產品二次開發,下游的品牌發展戰略、政府採購與基礎設施建設等,注重實效,充分發揮市場、資本與政府的力量,全力護持與壯大中國的人工智慧產業。
總之,新一輪人工智慧浪潮洶湧,席捲而來。放眼世界,從ICT (信息與通訊技術)到ABC(人工智慧、大數據與雲計算),新時代創新驅動發展的步伐明顯加快,人工智慧賦能產品、流程與服務,並重塑經濟、社會的趨勢,正在快速閉環迭代。智能革命,未來已來。
清華教授鄧志東談AI金融:演算法已經成熟,垂直應用關鍵在於大數據「人工智慧產業發展有四個維度:場景、大數據、計算能力與演算法。大數據是基礎,計算能力是前提,演算法靠人才,場景的選擇最為重要。從商業化角度來說,人工智慧金融就是大數據金融。因為應用中的基礎演算法都是相對成熟的深度學習演算法,可以通過招聘人才來進行調優,計算能力可以全球購買;在場景已經細分確定的前提下,承載行業頂級專家知識的帶標籤的大數據就顯得尤為重要。」
對於外界來說,鄧志東教授更為人熟知的成就可能來自自動駕駛領域——自2009年起帶領團隊開發了三輛具有感知和自主決策功能的自動駕駛汽車。而事實上,據雷鋒網了解,在人工智慧與金融結合領域,鄧教授也頗有心得,他笑稱「關於智能金融,我已經講過六七次了。」
鄧教授認為,時代的進步造就了A(人工智慧)B(大數據)C(雲計算),而大數據、大計算與深度卷積神經網路結合起來,成就了人工智慧的偉大復興。
他表示,作為一種感知智能,深度卷積神經網路能最好地模擬生物視覺通路,在完備大數據與超強計算硬體的強力支撐下,通過多級多層特徵的自動提取,已在計算機視覺、語音識別、自然語言處理、自動駕駛、大數據分析等諸多方面,接近、達到乃至超過人類水平。
此外,以AlphaGO為代表的深度強化學習,已具有超人類水平的博弈類決策能力。未來需要探索和突破的主要研究方向,包括「特徵提取+認知推理」的小數據深度學習方法,可解釋的深度學習方法,具有語義理解的深度學習方法以及具有多任務學習能力的通用人工智慧等。
中國人工智慧發展的優勢與短板隨著AlphaGo的橫空出世,人工智慧商業化落地的速度不斷加快。鄧教授認為,在未來5到10年時間內,包括深度卷積神經網路和深度強化學習在內的深度學習演算法,將會逐漸釋放出真正的商業價值,賦能產品、企業與社會。比如,基於大數據人工智慧,LFW人臉識別率已提升到人類水平的97.6%,現在最新的人臉識別準確率已經達到99.8%,可以應用到銀行開戶、支付、取款等各種場景。此外,人工智慧在醫療、零售、會計、審計、製造業、物流、翻譯等行業都大有可為,可提高效率,降低成本,因此也有不少職業面臨被機器取代的風險。
在中國,鄧教授指出,人工智慧發展存在幾大優勢。一,應用場景規模大,且商業落地很快。二是中國「互聯網+」發展迅猛,擁有更多的海量大數據。「大數據被稱作是人工智慧新時代的原油,從這點來看,銀行本身還坐擁數據金山。」三是政府支持力度大。
而同時,我們也需要正視發展短板,主要體現在四方面:
一是中國原始創新能力不足,關鍵性基礎演算法和高端晶元缺乏;
二是AI高端人才比較稀缺;
三是投資界過於追求短線逐利,國外的AI收購幾乎都是十億美元起步,對技術與產業趨勢的把握敏銳超前;
四是體制機制障礙,國有巨頭型企業對AI的前瞻性布局不多,投入少,大部分仍在觀望之中。鄧教授類比互聯網時代巨頭或初創企業對於互聯網經濟所持的各種態度:「有不屑一顧的,有觀望的,有冷漠『理性』的,有嘲諷的,當然也有全情投入的」,「全情投入成就了BAT。相信再過三五年,一定也會有全情投入的人工智慧巨頭出現。」
演算法已經成熟,垂直應用關鍵在於大數據
具體論及人工智慧對金融的影響,鄧教授表示,「互聯網金融正在向人工智慧金融發展,因為現在互聯網金融網上消費的用戶體驗其實不算好,都是些下拉菜單,線下門店的人工服務相比更加自然親切。下一步可以利用人工智慧,改善線上的用戶體驗。此外,深度學習也會改變金融服務的產品形態與流程。」
"人工智慧產業發展有四個維度:場景、大數據、計算能力與演算法。大數據是基礎,計算能力是前提,演算法靠人才,垂直應用領域要細分,要細分到具體的問題上。」鄧教授告訴雷鋒網。
「從商業化角度來說,人工智慧金融某種意義上就是大數據金融。因為應用中的基礎演算法都是相對成熟的深度學習演算法,可以通過招聘人才來進行調優,計算能力可以全球購買;在場景已經細分確定的前提下,大數據就顯得非常重要。而這部分需要行業頂級專家的深度參與,通過大數據的清洗、標籤,實際把行業頂級專家的知識轉移給機器,從而讓人工智慧站在巨人的肩膀之上。」
他指出,金融大數據大多是結構化或半結構化的表單數據,數據質量高,並且已較早實現了大規模數字化、網路化採集與存儲,具有相對較多的大數據歷史積累,這一點與其他行業不同。
但值得注意的是,交易數據雖然很多,但是帶標籤的很少,所以「在大數據沒有標籤之前,還談不上人工智慧,一般是在利用數據挖掘等傳統方法來做大數據分析。」
數據貨幣化的戰爭數據貨幣化會成為顛覆金融業未來的八大驅動力量之一,數據流的價值將顯著提高,世界經濟論壇(WEF)今年8月發布的一份名為「金融服務顛覆式創新」的報告指出。「多種數據源的動態、靜態數據集將會愈加豐富,擁有和控制數據將成為所有利益相關者的關鍵能力。」
但獲取這種關鍵能力是一場場艱苦的戰鬥。
譬如,保險行業正在受到保險科技的崛起和客戶基礎結構轉型的挑戰,聯網設備不斷增加,但是消費者並非主動自願提供個人信息,這說明保險公司未能讓客戶相信聯網保險服務符合他們的利益。
在借貸領域,新的數據來源和分析使用方法得以覆蓋銀行客群之外的長尾客戶。但對於傳統金融機構來說,首先面臨著非金融機構的競爭威脅,國內有阿里借唄、京東白條,國外有亞馬遜商家信貸;再者獲取的弱金融屬性數據在改進成熟客戶的承銷方面的效果有限,此外這些數據通常是非結構化和孤立的,在投入使用之前,還需要轉換大量投資數據,自動化和新的分析手段。
論及借貸的關鍵環節——風控,據雷鋒網觀察,金融科技公司常宣稱自己是「人工智慧風控」,而銀行對外多提及「大數據風控」,並表示在數年前就已經開始應用類似手段,只是那時還沒有出現」大數據「這個定義。
鄧教授的觀點或許從一個側面解釋了這個現象,「這裡的所謂大數據風控可能並沒有使用標籤數據,即沒有閉環利用基於標籤的深度監督學習及由此獲得的行業頂級專家的知識。」因此,他肯定道,人工智慧風控勢必更優於大數據風控,「此外,人工智慧的研究範疇不僅限於此類,還有小數據深度學習、認知智能、通用人工智慧等。」
最後,鄧教授表示,目前人工智慧的革命性進展源於深度學習或因與深度學習的結合。人工智慧的金融產品開發與產業發展正處於爆發期。僅需利用人類視聽覺功能和簡單決策能力的規範性或工具性的金融職業與崗位,有可能被人工智慧所逐步取代。從「互聯網+」到「人工智慧+」,ABC大數據智能革命將會深刻地改變我們這個時代。
推薦閱讀: