在人工智慧和機器學習領域中國和國外存在哪些差距?有多大?
本題已加入知乎圓桌 ?「機器學習 · 學以致用」,更多「機器學習」相關話題討論歡迎關注。
這個問題問得蠻大,工業界和學術界的情況也有所不同。我個人的從業背景對工業界會更了解一些,學術界的情況了解得會相對較少。
工業界來說,我認為在業務形態上,國內和國外的差距已經不大,在大量的業務場景里我們都已經在應用AI的方法來解決實際問題並發揮實際的商業價值,無論是搜索、廣告這樣的經典場景,還是金融風險評測、自動運維這樣的偏小眾一些的業務場景。在技術水準和領先性上,我認為國內和國外還是有一定差距的,大體上,國內follow國外的情況會更多一些,我看到的很多大的技術點還是國內向國外學習遷移的情形居多,當然這裡面有一些國內公司已經做得相當不錯了,比如友商百度在Deep Learning的某些應用場景起步還是相當早的,阿里這邊在智能安全也有著一定的身位優勢,但是從大的尺度上來看,國內向國外關注、學習、應用遷移的例子居多。
學術界的話,我認為這個差距會更大一些,這個差距並不能僅僅用所謂的頂會文章的數量來衡量,因為即便是頂級學術會議里,灌水的比例也不少,特別是從學術研究的角度來說,不同的頂會,其評審制度、質量也有所不同,其實是有不少門道的,這裡就不展開說了。總的來說,學術界的定位是要能夠發現新的,更fundamental的問題和研究方向 ,從這個角度來看,我看到的國內學術界的影響力還是會小一些,當然這裡面肯定也存在exceptional case,比如計算所陳雲霽研究組開創的機器學習加速器的研究方向就開創了這個領域的研究風氣之先,並且在多個國際頂會引領了至少兩年的研究潮流。這是好的現象,讓我們還是看到了一些新的可能性。
上面的評價可能顯得尖銳了一些,其實還是期望能夠對我們國內的現狀有一個客觀全面審慎的認識,無論從工業界還是學術界,我們能夠看到跟國外的差距在縮小,工業界依託於國內豐富的業務場景和數據規模以及人才儲備,未來應該會有越來越多的突破性的進展,學術界隨著國力的提升,整體研究氛圍的改善,相信在未來也會有更多類似於計算所寒武紀這樣的工作出現。
學術界,大部分坑都是由國外人挖的,國內人看哪個坑熱,就跳哪個坑。基礎研究國外人做得好,應用國內人做得多。
工業界,國外公司相對喜歡做一些短期看不到盈利的預研,比如谷歌、臉書和微軟等公司,創新的東西大部分都是他們搞出來的。國內公司比較喜歡短平快,看到有利可圖了才會加碼上,一時半會要是看不到盈利,立馬就停掉。
而且國外搞人工智慧的歷史比國內悠久,人才分布很廣。反觀國內,大部分人才應該是這幾年深度學習火起來才跳坑的。
但是國內也有優點,人多。機器學習核心是演算法,目前中美差異不大,工程實現和應用方面也差不多。
機器學習只是人工智慧下一個方面,簡單說,機器學習是軟體,人工智慧的硬體是機器人方向,這個中國比美國差挺多。這個問題其實很亂,又是人工智慧又是機器學習,雖然兩者關係特別密切,但要拿這兩個東西來對比國外的東西,估計寫幾本書都寫不完。所以在回答這個問題之前,我們先搞清什麼是人工智慧;什麼是機器學習。
百度百科是這麼定義這兩個概念的:
人工智慧(Artificial Intelligence),英文縮寫為AI。它是研究、開發用於模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術科學。
機器學習(Machine Learning, ML)是一門多領域交叉學科,涉及概率論、統計學、逼近論、凸分析、演算法複雜度理論等多門學科。專門研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的性能。機器學習是人工智慧的核心。
所以我們可以這麼說:如果人工智慧是一台手機,機器學習是晶元。
接下來看看中國跟外國的差別,主要其實是中美兩國的差別,因為要拿印度或者其他國家對比,意義不大,這個問題也沒法說得清楚。所以重點跟中美對比吧。
高盛前幾天發了一個報告,這個報告引用了一些資料:
關於數據:「中國現在產生的數據佔到全球產生的總數據的13%。預計到2020年,隨著中國成為全球第一大經濟體,這一比例將會上升至20%至25%。」預計中國將產生9到10澤位元組的數據,1澤位元組大約等於1萬億吉位元組,1吉位元組等於十億位元組。
關於學術能力:李開復在2017年世界經濟論壇年會上指出,2015年全球發表的頂級AI論文中,有43%的論文作者里有一名及一名以上的中國研究人員。如果按照被引用期刊的數量來計算,那麼2014年中國已經超越了美國。關於創投數據:中國AI在全球位列第二。目前,中國共有超過700多家AI相關的企業。截至2016年10月,全國在該領域共有超過1.6萬個專利。烏鎮智庫和網易科技的聯合報告顯示,2012年到2016年上半年之間,流入中國AI領域的投資共達到26億美元,位列全球第二,是美國的七分之一、英國的三倍。關於人才和研發:從人力資源比較,BAT也已經可以比肩矽谷巨頭。騰訊研發人員的比例達到51%,位居首位,阿里巴巴和百度緊隨其後,分別為45%和43%,均高於谷歌(38%)和微軟(32%)。儘管從研發成本量比較,BAT與谷歌和微軟不在一個量級上,但是比例上已經十分接近。從研發成本占營收的比例來看,百度已經達到14.4%,十分接近谷歌(15.5%)和微軟(14.5%)。
高盛通過這些數據,來預測中國的人工智慧,已經在飛速發展,不久將來會超過美國。高盛還專門談論了BAT的AI布局和26家中國的AI獨角獸企業。從各方面來看,拋開一些泡沫的東西,整個行業跟美國對比來看,如果美國的實力去到了10分的話,中國已經達到了7分,排列第二。歐洲和其他國家,預計在5分左右。原因跟數據、資金、人才有很大關係。
這個觀點我是信的,中國對科技的著迷,源於互聯網的造富運動。大批科研人員下海,以及巨大的市場吸引了大批海龜。人工智慧在B段以及發展得非常成熟,儘管新企業加入的不多,但A/B/C輪的特別多,部分研究已經跟美國相匹配。所以我們談論人工智慧跟國外的差距,其實已經不是很大,因為國外的很多技術,我們也在大量引入,已經推出了產品並開始市場化。而且國家扶持,創業者積極,資本也很活躍。當然,泡沫肯定也有不少,但在國外,泡沫也同樣存在。
接下來說說機器學習,這是個學術話題,儘管前面提到,中國人的學術能力已經很強,但不可否認的是,機器學習的實力,就跟晶元一樣,目前還是國外在壟斷。中國已經在大力的推進,但現在如果給美國打10分的話,機器學習方面,中國只有4分,還差得比較遠。這個跟美國高校的學術能力、學術氛圍有很大的關係,而且人家研究人工智慧,已經差不多有上百年的歷史了。中國在這塊基本沒有歷史,考靠的是海龜和後入,這塊的確需要時間。儘管目前世界學術論文可以共享,但有些差距,不是說共享就能解決的。
計算機學科的基礎是數學和物理,尤其是人工智慧方面。
可以說,數學和物理差了多少,再放大一些,就是差距。
全世界都用tensorflow,百度家的paddlepaddle沒人用 。
高盛在今天左右發布了報告:
說除了計算力(也就是晶元)在演算法研究,應用,資本,人才規模方面,我國均超過美國。
我認為:
演算法研究方面,我們仍是跟隨者,學生,小弟,別在乎什麼會議,期刊,論文數量,哪個牛人。。。弱是相對的,你覺得他強,那是你太弱的緣故。
應用方面,這是一個事實,我們有人口紅利,其實更是因為國內互聯網把大家的行為習慣和心理改變了,比如個人隱私保密的弱化,剛上來的新鮮玩意,縱有太多不好,還是有人去將就使用它,遷就它,把它慣的。
資本,我不懂,但我知道這是一幫很聰明的人,他們的失敗只有一種:聰明反被聰明誤。
人才規模,不解釋,但論起質量,我們產品的良率是百分之一或者千分之一左右吧。
晶元,做不出來真正屬於自己的晶元,做不到第一,前面的那些優勢都不算。別問為啥,也別質疑,問問那些手機廠商。
差距還很大,但是比十年前,二十年前,三十年前好很多。所以定期我們回過頭看一看差距,縮小了,這是應該開心的事,然後要繼續追趕,而不是停下來,嘲笑比你還差的同學。
據我不完全了解,或者記住的消息:
我國在AI上,創業公司數量比不過印度,領域也比不過,分布不均衡,佔世界7%左右,而美國則是70%左右,遍地開花。
突然想到一個可笑的情景,作為結語:
摩托羅拉公司在中國走人了,其班底出來紛紛開啟各種國產手機鋪天蓋地冒出來。。。
如果哪天,微軟離開了中國,英特爾離開了中國。。。那,,,
我們是不和美國AIh水平一樣了也說不定。
匿名了,不想和人撕逼了,累了,等到哪天知乎上有人問:在AI領域國外和中國的差距在哪裡?我再給講講哈
差距就是人,Geoffrey Hinton Demis Hassabis那樣的人中國目前(和以往)的教育是產生不了的,不做些什麼未來也沒戲。
實在受夠了人工智慧了。人工智慧根本沒有傳的那麼神乎其神。目前的人工智慧還是什麼玩意鬥不過是對隨機性有規律性的做遊戲模擬對戰階段。就是一個大數據加最優選擇而已。人工智慧就是一個包裝了的程序升級而已。真的只是升級而已。哪怕你換了一套全新的編寫程序以及運行邏輯。都跳脫不出大數據加最優選的方案。中美這方面沒什麼好比的。就像未來我要去北京做上車我說去北京就開始睡覺。不管汽車操作系統在中間換了多少方向加了幾次油,交了幾次告訴費用。這些不過是我指定目標他去完成目標的過程。中間出現的繳費加油等不過取決於我給不給他這個許可權而已。哪怕我喝多少水什麼時候尿急,他都能算個大概。也不過是程序層面的人性化設計。你搞不搞人工智慧。未來程序總要向著這個方向由。人工智慧更多是打著幌子搞程序升級擺了。
推薦閱讀:
※目前,主流的人工智慧機器翻譯團隊在近一年內主要突破和攻關的技術方向是?
※本科數學,想從事人工智慧或大數據方面的工作,該怎麼規劃?
※國際象棋和圍棋都已經進行過「人機大戰」了,之後還有什麼遊戲值得人工智慧挑戰嗎?
※身為程序員, 2017年你有什麼一定想實現的願望?
※你覺得Alpha Go 對李世石會幾比幾贏?