假如路上跑的不是汽車,而是阿爾法狗?

上月人機世紀大戰最終以谷歌人工智慧圍棋手AlphaGo四勝一負完勝人類世界圍棋冠軍李世石9段落下帷幕,引發了全人類對人工智慧的關注狂潮。 AlphaGo的強勁表現令科技界產業界為之振奮, 而未來其所代表的人工智慧(AI,artificial intelligence)技術在智能駕駛等領域的發展則更加讓我們期待。

為什麼這樣說?我們從兩個方面來聊一聊。

第一是深度學習,從大數據中學習發掘規律。

AlphaGo和李世石對弈, 都是在決定下一個子落在哪裡的問題。 一個19*19的棋盤最多就有了361種選擇。 而最終的勝負是由這幾步、幾十步、甚至上百步決定的。 所以圍棋是典型的動態決策系統, 每一步都影響了後面的結局,每下一步我們都不得不去考慮接下來的幾步應該是怎麼樣的, 這一步落子對後面有什麼影響。 這也就是咱們說的棋盤推演。若是由電腦來做推演, 去考慮落子的各種可能性,從中選出最有勝算的一招,那人還有勝算嗎? 1997年『深藍』就是利用類似的『窮舉法』打敗了當時的國際象棋世界冠軍卡斯帕羅夫。圍棋難就難在它的變化太多, 複雜度太高了,和國際象棋完全不在一個數量級, 就算是讓深藍用上當今最快速的硬體去硬算圍棋的棋盤推演, 深藍也只能對你說臣妾做不到呀。

▲ 人機世紀對決(圖片來源於網路)

人比『深藍』高明的一點就是棋感。 人根據棋局評感覺, 而不必做細緻的棋盤推演, 就能大概篩選出一些較好的選擇; 對於走一步之後的局面, 人能大概判斷出是贏面大還是輸面大。所以人就避免了窮舉棋盤推演, 只需針對少量的選擇做些有效的搜索即能做出落子判斷。 從決策規劃的角度考慮, 這就好比把一個動態規劃的問題用近似動態規劃(ADP)的方法解決了。而對棋局的簡單有效的評估就類似ADP中的value function, 落子的傾向性選擇類似ADP中的heuristics。這種valuefunction和heuristics就是圍棋中的規律。 AlphaGo的成功就在於它的演算法中包含了這兩個規律,而不僅僅是野蠻搜索。它的規律是通過機器學習獲得的, 這就是AlphaGo背後的兩大技術本質:大數據和深度學習。通過學習幾千萬局的對弈過程數據,訓練後的人工神經網路中固化了優秀棋手的落子傾向和對局面的判斷能力。 這樣在實時的人機對弈過程中, 其所需要搜索的空間範圍已經收縮到一個可計算的範圍內, 最終選定最佳落子。 而深度學習持續不斷的學習對弈數據, 使AlphaGo始終保持進步。

二是數據、學習與互連,讓AI做你的智能駕駛司機。

AlphaGo的勝利只是針對一個博弈遊戲,但是AlphaGo的演算法是通用的機器學習演算法,而不是特定於圍棋一種應用,所以真正有意義的是人工智慧已經在影響技術領域。 AlphaGo經過學習打敗了圍棋世界冠軍, 那麼AI技術用在汽車領域呢?人工智慧駕駛會不會成為世界上最優秀的司機? 當前不是, 但是這個進程已經開始。

人就是智能駕駛的老師, 每天的行駛數據(路況, 地圖, 交通信息, 駕駛員的操作)中包含著駕駛和交通的規律。AI技術通過學習這些大數據就能掌握人所掌握的規律。 Tesla 的Autopilot 1.01就已經具備了學習的功能。特斯拉的用戶們已經報道了他們的汽車每天的變化, 一開始不能很好保持在彎道行駛上的特斯拉汽車,漸漸地學會了在彎道上減慢車速從而實現車道保持。

▲ 小鵬汽車工程師對標TeslaModel S

而這種學習更大的力量在於它可以不僅是一輛車的學習, 更可以是所有的Tesla汽車的共同學習。 汽車已經有了互連網路的屬性,駕駛數據從每一輛汽車傳輸到雲端, 所以是一個群體去訓練同一個機器大腦。 這一點是比人腦更有優勢的地方, 一個人的學習只能依靠自己的數據, 而機器學習卻能從所有人的數據中去發現規律,從而有望學習到最全面的駕駛規律, 超越每一個個體。 並且這種學習成果的分享性更是人類所不能及。 雲端的AI可推送到每一個汽車中,實現數據的閉環。所以以後的汽車應該是具備本地學習能力以及互連群體學習的功能。 目前能提供這種基礎構架的例如NVIDIA發布的PX2車載終端, 其每秒可進行24萬億次深度學習計算。 我們小鵬汽車在設計之初就考慮了這種需求方向,智能與互連是我們的屬性, 汽車-數據-網路-後台, 系統的框架能夠讓AI今後在我們的汽車上發揮作用。

機器學習甚至意味著能夠發現人類駕駛數據中沒有包含的規律。 好比AlphaGo通過左右互搏,產生大量新的對弈數據,通過reinforce learning刺激AlphaGo發現更優的圍棋路數。在智能駕駛領域, 通過模擬交通場景, 讓AI自己去發現智能駕駛的問題與局限, 今其產生更好的規劃、決策和執行。

智能駕駛技術的成熟尚需時日, 正如人工智慧技術本身同樣處於快速發展中一樣。 越來越多的技術會最終應用於智能汽車, 通過學習不斷提高駕駛水平,帶來更加安全更加極致的駕駛體驗。

我們的司機是AI, 這一天終會到來,我們也會盡情的享受這種變革給我們帶來的便利,而不會再覺得是被碾壓了。
推薦閱讀:

「互聯網金融&大數據風控」結合的九大維度
數據分析培訓:一名數據分析師的職場感悟
大數據的行業應用
Dragee的學習筆記1:超簡單!Python安裝matplotlib等模塊
2018智能周報 | 02.17-02.25 | 附資源地址 | AI作惡、CVPR會議、IBM量子計算揭秘……

TAG:人工智慧 | 無人駕駛車 | 大數據 |