很多關於人工智慧的文章說,中國在人工智慧領域處於領先位置,可為什麼在學習過程中找到的資料都是國外的?

本題已加入知乎圓桌 ?「機器學習 · 學以致用」,更多「機器學習」相關話題討論歡迎關注。


這個問題跟「我國科研砸了很多錢怎麼還沒有諾貝爾獎」基本上一樣,釀成好酒不是有好糧就行,還需要時間

一些報道說國內AI水平領先,用的指標是最近兩年的論文數。從這個指標上來說,美國第一中國緊跟其後,沒有任何問題。也就是說近兩年國內的AI領域得到了飛速發展,但既然是剛發展,積累和覆蓋面都會差很多

你在學習過程中要找的資料,通常是某領域的歷史資料,自然不容易看到國內的貢獻。不過過10年20年,就不一定了


這兩個現象並不矛盾,人工智慧整個領域不了解不敢說大話,但至少在我的研究領域(深度學習+計算機視覺),作為AI的一個分支子方向,中國毫無疑問是領先梯隊的國家之一,可能就產業的角度來講應該是僅次於美國吧。

造成資料多是國外的是因為,AI起源於國外,國外開始AI研究的時候,我國的科學家們還在造核彈求生存呢,根本沒有研究AI的條件,但是當今在擁有和國外媲美的研究條件的機構中,中國還是為CVDL領域做出很多貢獻。

我們來看下中國大陸+港澳台的研究機構,以及全世界中國國籍的華人在CVDL領域取得了多少成績,在外的中國國籍的華人即使未來不回祖國,他們目前也是我們中國的一部分。

1、論文數量質量。每年CV領域中國作者貢獻的論文數不勝數,你去看下arxiv每天的論文感覺有一小半都是中國人的名字,CVPR作為質量代表,記得看到過一個統計是30-40%的論文屬於中國人,並且每年都在上漲,可能有人會說中國論文灌水,我不否認中國的學術圈會滋生論文灌水的現象,但是中國的論文=灌水的論文是不是太有色眼鏡了?09,12,16三年CVPR的best paper都是中國人,前幾天剛結束的ICLR2017的兩篇best paper有一篇也是中國人。

2、深度學習框架。中國人開發的深度學習框架目前開源的有賈揚清的Caffe,李沐的mxnet,董豪的tensorlayer,百度的paddle;商湯、曠視、騰訊等等AI公司也都有自己的框架未開源或者計劃開源;你去看下有哪個國家能像中國一樣能把官方文檔和一些教程翻譯成中文這麼全面,說實話有能力做學術研究的人更願意看英文,翻譯成中文是為了讓更多基礎差一點的也能從事研究,我記得吳恩達就曾經調侃的說過一句,任何AI領域的新成果,睡一覺第二天就能在中國看到中文版本。

3、AI企業和高校。BAT三家大公司的研究院都開到美國去搶人才了,微軟亞研院(基本等於微軟中國研究院)、港科大港中文、清華北大中科院等哪個沒有世界領域知名的AI研究員,清北很多低年級的本科生都讓我看到了很強的研究實力,讓我感覺同期的自己就是個渣渣。前幾天評選的亞洲五大AI創業公司有四個是中國的,百度開源無人車的代碼也同樣是震驚世界。

4、競賽。新聞: ImageNet 2016的結果揭曉,冠軍幾乎被中國團隊包攬:CUImage(商湯和港中文),Trimps-Soushen(公安部三所),CUvideo(商湯和港中文),HikVision(海康威視),SenseCUSceneParsing(商湯和港中文),NUIST(南京信息工程大學)分別拿下多個項目的冠軍。 再說下民間的kaggle比賽,前不久剛結束獎金額100萬美元的肺癌檢測競賽,冠軍就是土生土長土研究的中國人,kaggle比賽的排行榜里隨隨便便就可以看到中國ID。

雖然不得不承認我們AI起步略晚,也就近幾年趕時髦似的突然有了很多成果,缺乏一些代表性的原創工作,所以教程基本都是國外的,但是並不能否認我們中國在AI領域上的實力。但是比較可惜的是往往很多著名的成果雖然出自中國人,但是產地卻不是在中國,研究環境和研究資源確實國外積累的比我們要好。不過我們還是需要自信一點,和最頂尖的國家存在差距但也應該算是第一梯隊裡面,我們中國自古以來想干一件大事最後都能成功。美國,加拿大,英國德國瑞典等幾個歐洲國家、日本姑且也加個韓國,包括中國都算是領先集團里的了,不過這些國家和宇宙AI第一強國朝鮮還是有巨大差距的,畢竟人家都有百萬層的神經網路了 In Two Moves, AlphaGo an Lee Sedol Redefined the Future


跟著跑的速度很快,或者說爬行速度很快,但是站不起來。

沒有在學術鏈頂端,只能以玩別人訂下的規則玩的好自豪。

技術和浮冰一樣,九成功力在水面下,你今天駕船可以跟緊浮冰,但你不能改變它,更不要說顛覆它。

吃水太淺了。

又要拼速度。

人家不求快,但能讓你一直在後面爬。

工業上叫上下游。

就這樣吧。

應該說的很清楚了。


我一定是搞的假人工智慧..... 我的印象是:我們(依然)全面落後


不能算領先,只能說跟風的速度還可以,而且還僅限於機器學習這個方向。絕大多數好工作,即使是華人做的,也是在國外做的。


個人觀點是,中國人工智慧研究還是沒有成片地領先,很多的方向都是由歐美的科學家開闢,然後我們去很漂亮地填坑。在不少點上的確傾注了大量的精力取得了突破。科研環境是一個非常重要的因素,真正的有insight和patience並願意分享的優秀導師國內太稀缺了。

希望有更多有志於此的青年一代的參與,在不遠不近的未來去突破極限。


因為很多中國研究者都在國外工作,另外產自國內的資料也是英文的。。。畢竟術語都很新,怎麼翻都不知道。。。論文也都是投到國際上,不可能用中文。

事實上是英文就是世界級的學術語言,德法什麼的歐洲國家不少研究生項目也是全英文授課。世界上大量的科學術語只有英文名字而沒有其他。另一個高票答案也說了,翻中文很多時候是為了照顧低水平的人,翻譯質量並不高還不如去看原版,就醬。


不得不說,這個朋友提出的這個問題是一個很好的商機,國內在人工智慧學習資料這方面確實還很有潛力。我們可以從那些寫學習資料的作者這個方面思考。一個人如果可以寫學習資料,並且拿出來分享,無非要滿足兩個條件:1、有實際彙報,比如金錢。2、有時間有精力。在美國,人工智慧發展時間比較久,這一點確實是原因之一。但是我們不能拿這一點作為借口。如今在國內,每個公司都在搶著成為行業里第一個吃螃蟹的人,所以技術人員每天都在埋頭苦幹,也就沒有時間也沒精力去寫學習資料並且拿出來分享了。一般情況下,公司也不鼓勵員工分享,生怕公司的技術被別人搶走。導致在明面上的東西很少。但是在美國,技術公司把分享資源作為招攬人才的利器。那些thought leaders很多是大學教授,或是著名科技公司ai的帶頭人。他們經常組織各種分享活動,在公司eng blog上公開自己最新的成果(當然,核心技術不能公開),而且也經常鼓勵自己員工去寫eng blog,甚至把分享作為員工考核指標。Udacity更是抓住了這個商機,和各大公司合作,開闢了大量收費的人工智慧課程。如此,分享就意味著有回報,大家才有了分享的動力,也有時間去整理資料,整個產業鏈也就成熟起來。


這是遲早的事情,在人工智慧上,中國能領先和中國輕工業擊敗美帝的過程差不多。

人工智慧的研究最需要的是原始數據,在美國、歐洲原始數據的獲取和使用都是相當困難的,戰戰兢兢一不小心就是一場集體訴訟。但是在中國,尚沒有公司因為泄漏用戶數據、倒賣用戶數據而被用戶追訴的。

舉個簡單的例子,要做人臉識別的人工智慧,在歐美國家獲取研究數據那不是一般的麻煩,即使Paypal這樣的第三方支付機構也很難獲取,這還是有查明異常交易反洗錢義務的機構也難以獲得許可。但是在中國,只需要一瓶飲料或者一袋洗衣粉,最多也就是二十多塊錢的食用油,就能得到一大批人主動送上帶有身份證的人臉照片。甚至像支付寶、騰訊這種具有壟斷地位的公司一毛錢都沒給,就得到一大批中國人主動提供了身份證、學位證、機動車登記證等個人身份信息。


@羅浩.ZJU 的回答很全面,作為知乎小透明,我的回答主要是為了吐槽一下。

看到這個問題下面的回答,知乎真是要完了。不懂就不要強答,更不要裝出一副世人皆醉我獨醒的樣子來抨擊諷刺中國。自己混的差,就拿知乎這個平台發泄,什麼領先非洲國家,自欺欺人,阿q精神全出來,我有一句mmp一定要講。

回到問題。第一個問題,中國在人工智慧領域是不是領先的?答案是肯定的,領先者之一。最為火熱的,機器學習,看看國際頂會上中國學者的身影,這個問題就毫無懸念。羅浩提到的ImageNet和kaggle也是AI方面極具影響力的比賽或者網站,中國人的身影同樣活躍。

第二個問題,為什麼感覺資料是國外的。原因眾多。一是因為中國起步晚,深度學習三大神在八十年代就出來一系列成果的時候,中國這邊像樣子的計算機院系還沒建設好;IBM搞出深藍的時候,bat都還沒成立或者剛起步。二是開源平台,機器學慣用的開源平台多為美國公司開發,其中華人扮演了極為重要的角色。最後,就算是中國人寫資料看資料,也習慣用英文的。

最後,知乎開始網易新聞化了。我為啥不說知乎貼吧化呢,因為我不想侮辱貼吧


1.中國人發了很多頂會文章,但都是英文的,所以你覺得外國資料多。

2.所有主流深度學習框架,都是國外公司或者學校,機構開發的,caffe也是歸屬於伯克利。所以你學習的時候資料也是英文。

3.github上很多開源的東西,也是外國人寫的。

4.華人里學術上的大牛,好像大部分都在國外大公司。

5.國內技術強的忙著趁著熱潮創業呢,哪有時間給你寫資料。

6.開拓性工作很多都是外國人,或者留美華人。

華人強,不是中國本土強。


因為我們發文章寫博客都用英文啊


我一點代碼都不懂 就喜歡看IT新聞 中國的AI牛不牛 其實看美國的反應就知道了 從去年開始 美國的主流媒體包括紐約時報每隔一段時間就報道中國人工智慧高速發展對美國的威脅 最近甚至已經恐懼美國要被中國甩下 當時我就感覺不對勁,美國這是對中國禁運的節奏啊?果不其然 前幾天 美國政府已經決定要禁止中國公司在美國收購有關人工智慧的公司,下一步應該是要禁止意外美招攬相關人才,如果美國恐懼症進一步歇斯底里的話 最終美國可能要禁止招收大陸留學生了 大家等著瞧吧

不過無論如何 我覺得美國的歇斯底里是然並卵 人工智慧這一方面 中國應該已經發展到和美國同等階段了 就算有差距 也不是質的差距 在其他更多 需要極其深厚產業基礎 中國積累薄弱的硬體領域 美國對中國的 禁運簡直令人髮指 比如 軍事 航天 中國都已經快速趕上來了 在如火如荼 開放交流 本身中國都不落後的人工智慧產業方面 美國根本不可能中國人工智慧發展


與美國這個大平台保持交流,是中國持續進步的基石,這一點政府看得很清楚,戒驕戒躁。


在人工智慧領域中,人工領先於智能,我國在人工領域毫無疑問領先,所以這說法沒什麼問題。

我不是開玩笑。


行業概況

相關政策

?今年3月,人工智慧被首次寫入政府工作報告,連同新材料、集成電路、生物製藥以及第五代移動通信等戰略性新興產業一道上升至國家級戰略層面。

?7月底,國務院印發了《新一代人工智慧發展規劃》,提出六方面重點任務和一系列保障措施。要求到2020年人工智慧總體技術和應用與世界先進水平同步,人工智慧核心產業規模超過1500億元,帶動相關產業規模超過1萬億元;到2030年,我國人工智慧理論、技術與應用總體達到世界領先水平。

行業資訊播報

·人工智慧公司寒武紀獲1億美元A輪融資

·全國首家「人工智慧酒店」現身杭州

·浙江多家上市公司站上人工智慧風口

·2017影響力投資峰會上「人工智慧」成熱點

·京東用人工智慧撬動零售革命

·「人工智慧+移動互聯網」易華錄打造智慧交通引擎

·「未來已來」2017世界機器人大會8月23日開幕

人工智慧(Artificial Intelligence):

是指使用機器代替人類實現認知、識別、分析、決策等功能,其本質是對人的意識與思維的信息過程的模擬,是一門綜合了計算機科學、生理學、哲學的交叉學科。

作為一種基礎技術,理論上講人工智慧能夠被應用在各個基礎行業(如:AI+金融、AI+醫療、AI+傳統製造業等),同時也有像機器人這樣具體應用的行業概念。

· 發展趨勢 ·

目前,中國的人工智慧研究處於爆發期,中國人工智慧相關專利申請數從2010年開始出現持續增長,於2014年達到19197項,並於2015年開始大幅增長達到28022項。2016年,中國人工智慧相關專利年申請數為29023項。

根據烏鎮智庫發布的《全球人工智慧發展報告》數據顯示,在人工智慧專利數量方面,中國已經獲得了長足的進步,在過去三四年已經超越了美國。

2007-2016年中國人工智慧相關專利申請數統計

· 行業分類 ·

人工智慧行業主要分為基礎支撐、技術應用和方案集成這三大板塊。基礎支撐主要包括 CPU/GPU/NPU,感測器,深度學習和神經網路。

*本報告研究範圍為以上產業鏈內容。

產業鏈布局

據參照系資料庫顯示,目前全國從事人工智慧領域相關的企業共有335家。下面將從基礎技術支撐、技術應用領域、方案集成領域三方面來介紹相關企業的具體發展情況。

· 基礎技術支撐 ·

在該階段中誕生了基礎理論、基本規則和基本開發工具。在此階段,演算法和計算機對AI的發展起到主要推動作用。

現在主流應用基於多層網路神經的深度演算法,一方面不斷加強從海量資料庫中自行歸納物體特徵的能力,一方面不斷加強對新事物多層特徵提取、描述和還原的能力。對演算法來說,歸納和演繹同樣重要,最終目的是提高識別效率。

相關企業

基礎支持領域相關的企業一共有4家,分別為深圳真時科技有限公司、崑山塔米機器人有限公司、塔米智能科技(北京)有限公司和蘇州科大訊飛教育科技有限公司。

· 技術應用領域 ·

人工智慧發展的第二個階段,演算法和計算力已經基本不存在堡壘,數據將成為主要驅動力,推動人工智慧更迭。在此階段,大量結構化、可靠的數據被採集、清洗和積累,甚至變現。

自然語言處理(NLP,natural language processing):是計算機科學領域與人工智慧領域中的一個重要方向,主要研究人與計算機之間用自然語言進行有限通信的各種理論和方法,是一門融語言、計算機和數學於一體的科學。

自然語言處理大致分成自然語言理解和自然語言生成兩大部分,包括句語法義分析,信息抽取,文本挖掘,以及語音識別,語音合成和機器翻譯等技術。機器翻譯研究如何利用計算機實現自然語言之間的自動轉換,是人工智慧和自然語言處理領域的重要研究方向之一。

計算機視覺和圖像識別原理

【相關企業】

人工智慧技術應用領域相關企業有108家,下圖中列舉的5家企業為深圳碳雲智能科技有限公司、北京捷通華聲科技股份有限公司、北京星核軟體有限公司、北京艾克斯智能科技有限公司、上海海知智能科技有限公司。

(部分企業列表)

· 方案集成領域 ·

到了人工智慧發展的第三個階段,場景驅動作為主要驅動力,不僅可以針對不同用戶做個性化服務,而且可在不同場景下執行不同的決策。

相關企業

人工智慧方案集成領域相關企業達234家,以下列舉的為部分企業名稱,分別為北京盛開互動科技有限公司、北京文安智能技術股份有限公司、北京市商湯科技開發有限公司、上海經達信息科技股份有限公司。

(部分企業列表)

投資動向分析

以下將從最受機構喜愛的企業、投資機構布局、企業資本狀態分布情況和區域分布狀況這四方面來做具體的分析。

· 最受機構喜愛企業 ·

從參照系資料庫提供的數據來看,最受投資機構喜愛的企業是北京市商湯科技有限公司。機構介入數多達19家,包括IDG資本,萬達集團,華興資本,TCL創投等。其次是深圳前海達闥科技有限公司,機構介入數為12家,包括富士康、深創投等。

· 投資機構布局 ·

從投資機構的布局上看,真格基金投資的人工智慧相關企業達14家,位列第一。IDG資本投資和達晨創投分別為7家企業,紅杉資本和啟迪創投分別為6家。

· 企業資本狀態分布 ·

從企業資本狀態的分布情況來看,346家人工智慧領域相關企業中,其中15家企業為A股公開交易狀態,14家企業為新三板上市狀態。

15家A股上市企業名單

14家新三板上市企業名單

· 區域分布狀態 ·

從人工智慧行業相關企業的市級分布情況來看,布局最多的是北京市,有多達124家關聯企業。其中上海市共有47家相關領域企業。

除北京和上海外,人工智慧領域企業分布最多的是深圳市,企業數量為42家。其次為杭州市,企業數量達34家。

市級分布狀況

原文鏈接:「人工智慧」產業研究報告!(附346家關聯企業介紹)


前面很多回答都很好,我補充一下我的看法。

我本人是做計算機視覺的,我的感覺是,中國在這個領域應該講還是落後美國,但也僅落後於美國,而且是可以compare的落後。歐洲和日本感覺沒有跟上時代的步伐。

我今年7月份去夏威夷參加CVPR(計算機視覺領域國際三大頂級會議之一,但這幾年非常側重於人工智慧),感觸很深。這是我在會場門口拍的贊助商列表:

雖然說贊助會議並不一定是商業成功的表現,而更多的是一個對外宣傳的方式,但我認為仍然可以從中窺視到中國在這個領域的地位。所以說前面有的答主說中國只在水論文上厲害,產業不行,這點我不能苟同。

差距還是存在的,但是正視差距不等於妄自菲薄。


1. 首先是歷史原因,英文是AI領域主流語言。

2. 您可以看看在中國辦個學術會議有多不容易。

外國人入境審批表 / 邀請外國人來華審批表 / 申請外國人入境審批表

中國科學技術大學國際合作與交流部暨港澳台事務辦公室

舉辦國際會議的行政管理規定

國際學術會議暫定管理辦法-網站導航-蘇州大學國際合作交流處

申辦國際會議須知

【主辦、承辦國際會議請於每年 11 月25 日前報下一年度會議計劃。】

【國際會議需在開始對外承諾舉辦的前一年申報列入當年度國際會議年度計劃】


注意你這個國外,,首先我們只佔了世界五分之一不到的人口,我們在發論文寫資料那世界上剩下的人也在發論文寫資料啊,而且大家用的都是英文你不仔細看有誰會關注具體哪個國家。中國的論文發表數世界第一,但並不代表中國可以把這些人家幾十年前的概念都變成中國自己的,畢竟先到先得。支持向量機是60年代發明的,那時候中國在幹嘛?可能還不知道計算機是什麼吧;更有甚者,那些機器學習和人工智慧使用的數學理論是別人十九世紀提出來的最優化理論。中國靠這幾年的突飛猛進想在機器學習和人工智慧領域取得霸主地位是不可能的,現在充其量只能說拿別人的理論「用的很6」。


你去找外國的資料么,肯定是外文的,國內在做人工智慧的企業主要是BAT,他們又不會把成果發出來給你分享,你當然找不到中文的了,還有就是這個「領先」,也是個模糊的形容詞而已,到底是第一第二還是前十,說不清,霉體都可能說是領先,別太放心上了。


推薦閱讀:

如何評價深度學習之父Hinton發布的Capsule論文?
如何評價卡內基梅隆大學的開源項目 OpenPose?
如何評價人們對電腦在圍棋上戰勝人類的時間預測?
如何評價amd的Radeon開放計算平台直接將CUDA編譯代碼直接轉換過來。?
resnet(殘差網路)的F(x)究竟長什麼樣子?

TAG:人工智慧 | 深度學習DeepLearning |