人工智慧現在的發展前景如何?(專家推薦)
據傳說,一門新技術的產生與成熟,會經歷下面一條叫做「Gartner曲線」的過山車式發展軌跡,如下圖所示。不過,人工智慧的發展軌跡,卻比這個要銷魂地多,到目前可以說是三起三落,當然,這個第三落還沒有到來,也未必一定會到來。
我進入這個行業已經有十多年了:博士期間,我做的是語音是別的研究,畢業開始又到MSRA接著干這個。雖然我們的兩任院長——李開復老師和洪小文老師都是語音研究出身,卻絲毫不能改變當年這一項目在全院最雞肋的地位。因為在當年,各種各樣的人工智慧應用能真刀真槍上陣的並不多。更別提要是向互聯網界提起自己是做「人工智慧」的,那簡直就像在兩會會場上上偷看了毛片那樣無地自容。實際上,那個時期,正是人工智慧發展的第二落。
以史為鑒,可以知興衰。為了探討人工智慧的發展前景,我們簡單回顧一下人工智慧前面發展的三起兩落。
一、六十多年前的達特茅斯會議,提出了「Artifitial Intelligence」的課題,目的是讓逐漸成熟的計算機能夠代替人類解決一些感知、認知乃至決策的問題。這樣一個課題是如此令人神往,也迅速吸引了大量學者的眼球,相關的研究也如火如荼地開展了起來。是為第一起。
二、初,學者們解決人工智慧問題的思路,是以人為師,通過專家編製規則的方法,教機器下棋、認字乃至語音識別。在今天看來,這樣的方法是完全南轅北轍的——人類的視聽器官雖然很發達,卻並沒有能力總結提煉其中的規律。於是,人工智慧的美好憧憬中迎來了殘酷的現實,學者們發現解決問題是如此遙遠,圍觀群眾也一度認為人工智慧的學者都是騙子。是為第一落。
三、既然靠人指導不行,那就要祭出「實事求是」的法寶,從數據里統計規律。在這樣數據+統計的方法論下,諸如人臉識別、手寫識別等一些較為簡單的問題取得了重大進展,而在當時最困難的問題——大詞表連續語音識別上,統計方法也是史無前例地造就了實驗室中「基本可用」的系統。到此時,我們感覺找到了解決人工智慧問題的基本思路。是為第二起。
四、數據+統計模型的方法盛行以後,也很快遇到了瓶頸:數據量的提升並不總能帶來識別率的提高。當然,我們很早就知道「深度模型」比「淺層模型」學習數據的能力強,無奈這種模型的計算代價極高,只能望洋興嘆。拿語音識別為例,在「基本可用」到「實用」之間的鴻溝,十幾年都沒有跨過去,於是大家又轉向悲觀,覺得人工智慧還只是個夢。是為第二落。
五、第二落以來,繼續堅持在「深度神經網路」這條戰線上的學者很少,因為做這個是拿不到funding的。其中有一位老前輩Jeffrey Hinton,和他的學生Alex一起,發現用GPU算神經網路,能大幅提高速度,於是這種模型居然可能實用了。一旦實用,深度模型可以瘋狂吸收數據的優勢就發揮出來了,於是在語音識別、圖像識別等領域帶來了飛躍式的進展。是為第三起。
當然,工業界的看到的這第三起,比我們上面輕描淡寫提到的內容要波瀾壯闊得多。不過,不要太在意,因為各路大佬不論過去是做黑產、賣假貨還搞劫持的,都搖身一變成了人工智慧的忠實擁躉和業界先驅——雖然他們的數學也就是初中肄業水平。去年,當我聽到某此類上市公司老闆歇斯底里地在財報中喊出要投入數千萬美元搞人工智慧時,不由心生感慨:修腳的可以掛妙手回春的錦旗,但千萬別說自己是做精準醫療的!
雖然人工智慧的第三起確實有了質的發展,但考慮到這些沉渣泛起的為人工智慧從業者,我覺得第三落還是會來到,只不過並非對行業本身的懷疑,而是自我凈化罷了。
而人工智慧的行業發展趨勢,由於大規模數據+大規模算力的基本方法論已經成熟,今後的發展路徑是十分清楚的:在那些數據儲備充分、商業價值清晰的場景,人工智慧會迅猛發展,投身於這樣的行業中期發展會非常好;而醫療、教育這類領域,由於電子化數據的整理與積累尚需時日,可以需要一個較為漫長的發展過程。
至於人工智慧非常核心的問題,也就是關於「認知」的問題,我認為到目前為止還沒有任何方法論上的突破,也更談不上解決,不過扯到這個話題就太大了,我們找其他機會再聊。
全國人工智慧高手探討群: 556058201
唯心平台:設計獅喊話程序猿(RDmatrix)
推薦閱讀:
※桔子互動|use interval in Wechaty to overcome web-wechat API limitations
※MINIEYE CEO劉國清:ADAS終將成汽車標配|Xtecher人物
※關於AI和未來的碎片思考
※教程 | 沒錯,純SQL查詢語句可以實現神經網路
※中國人工智慧技術支出2020年將佔全球12%
TAG:人工智慧 |