專訪美國華為研究院Chief Architect & CTO 胡魯輝: 價值化是當前大數據和人工智慧的關鍵
由飛馬網主辦的「FMI2017國際人工智慧&大數據高峰論壇」在北京國家會議中心盛大開幕,現在距離大會開幕還有一周多的時間,飛馬網記者採訪了在大會上做重要演講的專家胡魯輝,讓我們來聽聽他對於大數據及人工智慧的看法。
胡魯輝 美國華為研究院Chief Architect & CTO
飛馬網:胡老師您好,請您簡單做下自我介紹,包括您一直關注哪些技術?
胡魯輝:我在美國華為研究院之前的過去十來年,一直在亞馬遜和微軟的總部工作。從一開始在亞馬遜做電商雲到大數據云計算,後來到微軟的大數據云服務和智能服務,到現在華為的大數據智能雲服務。我比較喜歡技術挖深,所以在帶領團隊推出多個服務產品同時,常常會深入研究一些有意義的關鍵技術點,當然我目前所關注的技術領域還是雲計算、大數據和人工智慧。
飛馬網:您之前在亞馬遜和微軟都工作過,國內外企業在對大數據挖掘與數據應用這方面有哪些不同呢?
胡魯輝:對於大數據挖掘與數據應用,之間的差別還是有一些的。主要可以體現以下幾點:
一、國外企業(主要是美國)走的相對早,從技術方面,應該領先不少,但是由於大數據有不少開源的工具,這從中幫助了不少後來的企業快速推進。當然利用開源的很難打造競爭力,而且有不少開源工具離真正商用還是有很大的距離,這是有些商家所不知的。所以亞馬遜微軟谷歌有不少是自研的,這樣一來從技術方面他們至今還是有絕對優勢的。 比例亞馬遜的Kinesis和Aurora,微軟的Data Lake和Cosmos DB,和谷歌的Spanner等等。
二、同樣由於走的比較早,國外企業應用的領域也相對比較廣泛和深入,無論是用戶數據分析、機器數據處理(主要來自雲計算和企業內部數據中心)、醫療數據洞察和基因數據計算等等。但是國內巨大的用戶量和市場,在許多方面已經具有巨大的數據,儘管數據複雜性也很大,但是潛力非常之大。特別當智能物聯網(IIOT)的到來,這裡的機會會更加巨大。
三、大數據挖掘與數據應用少不了人工智慧,儘管華人在這領域的從業人員在全球比例非常高,但是許多核心的演算法工具和平台還是來自國外,比如谷歌TensorFlow,微軟CNTK,Spark ML,R等等和它們形成的生態。當然人工智慧的演算法開源和民主化(AI Democracy)推動了快速應用和生態的形成。
飛馬網:現階段,大數據應用領域有哪些特點和困境?您又是如何看待的?
胡魯輝:當前大數據可以說已經從概念走向了應用,大家也開始接受這個新東西並且已經受益不少,但是真正達到大家所期望的大數據價值還是有不少挑戰,主要是大數據工具有很多但是使用門檻太高,數據安全和數據治理問題,大數據應用領域的複雜性等等。所以如何實現大數據的價值是我們需要思考的問題,而不只是概念理解或工具技術開發。
飛馬網:請為我們解釋一下「智能大數據應用」這個概念。
胡魯輝:這個概念比較廣,可以簡單理解為利用人工智慧挖掘大數據,使數據更加智能化和價值化。我覺得價值化是當前大數據和人工智慧的真正關鍵,是它們顛覆現有技術、能夠形成巨大產業的關鍵。
飛馬網:您認為大數據與人工智慧之間是什麼關係?
胡魯輝:我們常常把大數據和人工智慧有個區分,但是其實應用上有許多關聯,可以相互為另一方的工具,比例說通過人工智慧處理大數據或者大數據提高了人工智慧效果。更重要的是大數據下的巨大計算能力和豐富的數據使人工智慧的發展和應用成為可能,同時人工智慧可以使數據產生更大的價值。
飛馬網:對於大數據分析與大數據應用的前景,請談談您的看法。
胡魯輝:雖然我在前面提到了大數據如何價值化的挑戰,但是我對其前景還是比較樂觀的,應該是充滿著激情。我覺得許多挑戰只是在於技術本身和我們的觀念,但這些只是個時間問題,隨著數據爆髮式增長和智能物聯網(IIOT)的來臨,必將形成巨大產業。
飛馬網:有人說,數據量是做人工智慧的重要前提,您認為數據量在人工智慧研究的過程中佔據怎樣的地位?多少數據量才算是可以做人工智慧的標準?數據量小的企業該如何應對?
胡魯輝:這是有針對性的。人工智慧領域比較廣泛,對許多機器學習方法來說,數據量的要求其實不是很高的,但是對於深度學習等方法,巨大的數據和巨大的計算能力是非常關鍵的。最近幾年深度學習等發展非常振奮,是個革命性的突破,這種統計類的方法,需要豐富的數據,但不只是量,應該說數據越豐富越好。
對於數據量小的企業可能是個挑戰,技術上transfer learning和incremental learning等方法會非常有幫助。另外我覺得智能民主化(AI Democracy)不應該只極限於演算法平台,模型(model)共享和相互優化是個思路,這才是更大的平台。
飛馬網:您認為人工智慧最有可能從哪些行業或領域有所突破呢?為什麼?
胡魯輝:人工智慧本身不是新東西,但是這幾年深度學習(主要是CNN和RNN)發展取得了前未所有的突破,同時增強學習和NLP也取得了不錯成就,主要應用的領域有內容推薦,認知輔助(包括圖像識別和語音識別等),控制系統,機器翻譯,欺詐檢測等等。所以可以廣泛應用到許多行業,比例工業製造、醫療事業、電商、公安、金融、物聯網、辦公助理、企業客服等等。
▼
飛馬網(www.fmi.com.cn)致力於成為「人工智慧 (AI)時代的人才入口」,在AI時代,提供最佳的AI社區平台與技術提升方案。是AI、大數據、技術管理等人員學習交流園地,牛人們在這裡分享實踐經驗、真實案例 和技術問答,傳播行業技術的最佳實踐。站在AI、大數據、技術管理及產品運營的交匯點上,飛馬網已經擁有10萬+會員……
迄今已經組織了200多期線上/下活動,主題涵蓋AI、 大數據、雲計算、技術管理及產品運營等領域。遍布 北京、上海、廣州、深圳、杭州、天津、瀋陽等城市,惠及行業精英數萬人!
推薦閱讀:
※大數據培訓怎麼樣?
※從底層到應用,那些數據人的必備技能
※手把手 | 嫌Python太慢?並行運算Process Pools三行代碼給你4倍提速!