劃分人工智慧水平的四個等級

文/達觀數據 陳運文(CEO)

人工智慧(Artificial Intelligence,簡稱AI),是研究、開發用於模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術科學。既然是期望讓計算機智能系統來代替人的腦力勞動,自動化的從事的各項工作,那麼衡量人工智慧的實際水平就非常的重要。

無論是人工智慧還是人類的腦力活動,所要面對的問題的難易程度各不相同,針對不同的應用場景,現在業界所掌握的人工智慧技術的實際應用水平高低也各不相同。在選擇劃分人工智慧水平的標準上,國際著名的人工智慧專家Sandeep Rajani教授,在文章《人工智慧:人或機器》(Artificial Intelligence-Man or Machine)中,通過將人工智慧的水平和人類能力進行橫向對比後予以劃分,定義為共四個等級的水平:

巔峰級——已經實現了無法超越的最優能力

超越人類級——比所有人類的能力都要強

強人類級——比大多數人類的能力要強

弱人類級——比大多數人類的能力要弱

在介紹計算機演算法和數據挖掘技術的教科書《智能Web演算法》(第二版)中,達觀數據陳運文將Rajani教授的該四類人工智慧的劃分方法作了翻譯和介紹。在當今時代背景下,現有各個不同應用領域裡人工智慧技術的水平高低情況和已經達成的水平如下。

巔峰級水平

在一些規則完備、策略空間較小的應用場景下,例如在19*19的棋盤裡下五子棋,如今的計算機技術已經可以窮舉所有可能的對弈情況,確保與人類在任意對弈的情況下都可以實現最優的方案。同樣在Tic-Tac-Toe(一種簡單的井字棋遊戲)、跳棋等領域,以及數據統計等工程應用方面計算機已經是巔峰級水平了

超越人類級

AlphaGo和柯潔的圍棋對戰,以及IBM深藍(DeepBlue)戰勝國際象棋冠軍卡斯帕羅夫,都展示了在這些複雜的棋類遊戲上人工智慧已經達到了超越人類級。在一些具體的應用領域,如指紋識別、虹膜識別等領域,技術也已經非常成熟,同樣實現了超越人類的能力

強人類級

有些智力活動需要深入的領域經驗,計算機相比少量的專業人士能力還有差距,但是比大多數普通吃瓜群眾的能力要強。例如在德州撲克、橋牌等領域,計算機已經強過大部分普通人類了,在一些專用領域,例如在良好條件的人臉識別(沒有不良的遮擋、光照、角度問題)、良好條件的語音識別(沒有特殊地域口音、複雜環境雜訊)等領域裡,花卉植物種類的識別等領域,計算機的能力也已經達到了強人類級了。

弱人類級

有很多技能大多數普通人類掌握起來並不難,例如駕駛汽車,但是對計算機系統來說,因為要採集的信號以及分析的數據情況非常複雜,目前還難以達到普通人類的水平,處於弱人類級。常見的還包括寫作文章、閱讀理解、人類語言翻譯等領域。

上述介紹里,人工智慧的水平從弱人類級到巔峰級水平高低不同,影響人工智慧實現能力的主要有三個因素,具體包括:

因素1 :規則和評價方法的明確程度

越是簡單明確、並且計算機可以量化評估的問題,通過人工智慧來實現的代價越小,例如棋牌類遊戲,計算機可以發揮的作用很大。

但是越是有不確定因素,例如駕駛車輛,駕駛方法和路況變化很多,並沒有非常嚴格而明確的「勝/負」、「好/壞」的駕駛方式,計算機來學習時會有很多不確定因素。另外例如麻將或撲克,有很多隨機性因素,甚至有運氣成分,處理條件並不嚴格一致,此時也會給人工智慧更好的處理帶來挑戰。

因此,規則越明確、評判好壞的標準越客觀的應用,目前人工智慧處理的效果越好。

因素2: 特殊情況出現頻率的高低

很多應用問題,在典型場景下的處理和在包含各種特殊異常情況下處理,其難度高低差異非常大。以人臉識別問題為例,在人臉拍攝條件良好、正面的無遮擋情況下,現有機器學習的技術,完成人臉的檢測、識別,精度已經非常高了。但是在實際應用時,會遇到相當多異常因素,例如安裝的攝像頭,由於受到光照、角度等客觀因素的影響,加上被拍攝者存在化妝、佩戴飾品、局部遮擋、年齡變化等各種情況,甚至少量情況下還存在被拍攝者試圖通過整容或偽裝方式,故意干擾計算機的識別過程,這些因素都會非常嚴重的影響實際使用的效果。

自動駕駛技術也同樣存在大量的問題,例如正常晴好天氣,和雨雪等惡劣天氣,對解決問題來說難度的差別非常大。各種各樣的路況情況,也對自動駕駛的實用化帶來很大的挑戰。

現有的大量人工智慧應用,在實驗室條件下很多已經達到了非常好的成績,但是在工業化應用中,由於使用條件比實驗室環境要複雜和惡劣的多,需要處理各種異常和干擾因素,因此在很多應用的實際水平,還徘徊在強人類級和弱人類級之間。

目前人工智慧的技術,從實驗室走向實際應用,需要克服的問題很多,還有很長的路要走。在實際落地的時候,務實的做法是先限制具體的場景,盡量排除掉不確定性因素,簡化問題。例如在自動駕駛應用時,如果限制為固定線路之間、或者封閉道路內的應用,技術難度就會大大簡化,此時往往就能從弱人類級往上提升1-2個級別,達到實際可用的程度。在文字閱讀理解時,如果限制文本的行業、類型和理解內容時,也能大大的提升系統的準確率,達到可以實用化的地步。

因素3 :積累的訓練數據的規模

我們都知道,「大數據+演算法模型=人工智慧」,因此不難看出,人工智慧的關鍵性的基礎是大數據。俗話說,巧婦難為無米之炊,只有積累了海量的訓練數據,才能將人工智慧的水平向上提升。AlphaGo也是通過積累了數千萬盤圍棋對戰棋譜數據,並進行充分的模型訓練後,才打敗了人類頂尖選手的。

在每一個人工智慧的應用場景里,數據積累程度的高低,直接影響該領域裡人工智慧的應用水平。然而現實領域裡,很多訓練數據的積累工作才剛剛開始。尤其是監督式學習所需要的「標註數據(Labeled Data)」的積累,往往需要大量的人工參與,成本很高,大大制約了在各自領域裡水平的提升。另外有一些領域的數據因為受到一些政策因素的限制,例如醫療數據,或者有些數據被部分行業企業壟斷,難以流通,導致使用時障礙重重。

隨著近年來計算機硬體存儲成本的迅速降低,雲計算的逐步普及,數據積累工作的硬體環境迅速改善。數據採集的意識也逐步覺醒,希望在應用需求的推動下,有越來越多的數據被數字化,並記錄下來,訓練出優秀的演算法模型來提升效果。

從弱人類級起步,到強人類級、超越人類級、巔峰級,任重道遠,先易後難、化繁為簡,隨著技術一點一滴的進步,相信未來有越來越多的應用領域裡,人工智慧技術都能代替人類來完成越來越多有價值的工作。

想了解學習更多技術乾貨,掃描下方二維碼關注「達觀數據」公眾號

【本文版權歸達觀數據(http://www.datagrand.com)所有,如需轉載請註明出處。】


推薦閱讀:

AlphaGo讓人類棋王驚魂未定,Google又推出了完勝國際象棋和將棋的AlphaZero
中國AI能在2025年之前超越美國嗎?
hi,您認為傳統醫療商(比如醫療器械商、第三方影像公司等)做智能醫療會後來居上嗎?
你看到的可能是假的奧巴馬?沒錯,還真是假的!

TAG:人工智能 | AI初创 | 人工智能AI酱 |