如何看待《最強大腦》第四季 的人機大戰?


首先,Andrew Ng在人工智慧界的地位就不多加贅述了。個人認為這個節目里用的是百度專門為這個節目做的程序,Andrew Ng 應該就是掛個名,站台上代言一下而已。看完整期節目,我有以下幾個拙見(其實有點較真):

1. 關於項目的不公平性。

(1)計算力上的不公平性。

眾所周知, CPU的計算力之強大,之前最強大腦的速算為例,計算機的話,一行代碼搞定,無論是10位數加減乘除還是百位數,千位數,肯定是瞬間出結果。即便小度用的是很一般的處理器,在計算速度上也是秒殺級別的,所以最後一輪,雖然小度和王峰都輸出了正確結果,小度靠時間優勢取勝,勝之不武,該規則有失偏頗。

關於為什麼第一輪,匹配少女的環節用時過長,我懷疑是這樣的: 一個女孩出現的幾秒鐘,因為畫面是動態的,小度應該是把這些流動的畫面按時間劃分成很多靜態畫面,然後把畫面一一做了相似度計算,所以要慢很多。

建議:

應該忽略時間因素的影響,比如要求10分鐘內確定答案就ok,而「正確率相同看時間」的舊思想應該只保留在人v.s.人或者 機器v.s.機器的比賽中。

P.S. 前不久的圍棋大戰中,Master在對戰聶衛平的比賽中把時間由30s提高到60s就體現出這一點。

(2)經驗度上的不公平性

很明顯,對於這種 監督學習(supervised learning),倚靠百度的海量數據,小度可以通過大量的實例學習提高準確率,特別是第二輪比賽中集體照的環節(畢竟舞台效果不太容易在之前模擬)。

建議:

如果在比賽前幾天將小度用的學習數據交給人類方,是更公平的。

(3)項目成熟度上的不公平

人臉識別的項目太成熟了,支付寶都應用化了,準確度確實高,這裡雖然有年齡的跨度,但本質上對面部特徵值的提取,和判別方法等成熟的不能再成熟了。一個已經如此成熟的課題,套上一個時間跨度的皮pk人類,確實有失公允。

之前有過一期節目:一個好像是香港的妹子的能力令我印象深刻, 好像是讓通過父母的臉,匹配孩子的臉,儘管我覺得小度贏得概率依舊大,但比節目里的項目更有意思,而且在尋找被拐兒童方面,也更具有作用。

(4)關於doctor魏 「小度只有一個大腦的說法」。

我認為這個說法是不太對的,這裡先不說多核心的問題, 在演算法上,非常有可能小度同時運用的多種演算法計算,然後匯總多個相似度結果後,給出最終結果。從這個角度上講,讓三個人類選手一起應戰,也沒有不合理之處。

(5)其他

其實很多因素都有失公平,但無法避免,比如人類疲憊的問題,比如人類通過屏幕觀察,而小度觀察的圖像是直接傳送還是攝像頭二次從屏幕獲取,無從而知。當然這些因素不是並沒有太大的影響。

2. 關於作秀的成分(百度這波廣告滿分)

【重要的話說三遍】

我強烈懷疑 挑雙胞胎之一 是故意安排的,

我強烈懷疑 挑雙胞胎之一 是故意安排的,

我強烈懷疑 挑雙胞胎之一 是故意安排的。

我強烈懷疑 列印出第二張結果 是人為操作的。

我強烈懷疑 列印出第二張結果 是人為操作的。

我強烈懷疑 列印出第二張結果 是人為操作的。

首先從概率上挑中雙胞胎的概率不是很高,其次,隊伍中有雙胞胎,製作團隊100%提前知道,這麼好的資源不用,太可惜了。

ok,退一步講,如果真的是隨機挑中了雙胞胎之一。

按照規則,輸出一個結果,100個程序員中99個都是按相似度排序後輸出最高那個,還有一個程序員不會排序,被老闆打死了,墳頭草都快1m了。

從節目中看,兩個相似度確實不一樣,有0.01%的差別。請問兩者都輸出的原因在何?原因是差距小? ok,請正確定義什麼叫差距小?

1%,0.1%,0.01%,0.001% 。

再退1W步講,百度就是厲害,就是找出兩個了。

最大的漏洞在於:為什麼兩張圖片沒有同時列印,而是間隔了一段時間。 這明顯是人為操縱的。

還有一處細節: Andrew Ng 大神 看到圖的第一反應: Are they the same person? 其實這個環節挺做作的。他上去能幹啥?哈哈,上面都有數字,肯定選高一點的啊。 注意, Doctor 魏此時很淡定。

我相信:真相至少至少是跑出數據來,後台工程師一看相似度排序結果,心中OS「我去,怎麼回事,差別這麼少,再提交列印一份吧,別出問題」。

或者更黑暗一點:這一切都節目組安排好的,就剩Andrew Ng不知道,上去一臉懵逼,做節目效果。

我更願意相信後者,因為一個正常的程序員應該不敢私自決定再列印,一般會懷著忐忑的心情堅信著「 畢竟高了0.01%」,以數據為中心,這是程序員的通性,事實證明 Andrew Ng也是這麼做的。

3. 關於這次PK的想法

我認為從各自極限上, 小度會一直贏下去,如果敗了,那一定是工程師做的不夠好,或者給工程師的時間不夠,至少也是和人類一樣做的不好,而不會更差, 畢竟是掛著Andrew Ng 大名的PK,又有Baidu 無比強大的數據支持,工程師團隊中必定個個都是 大神級別的人物。

而且百度的這波廣告絕不允許被人類虐,所以。。。。。人類碾壓級別的勝利可能性微乎其微。

為什麼圍棋阿爾法狗引起關注,很重要的原因在於規則的公平性要好很多,而且圍棋作為我個人認知體系里「最深奧的棋類項目」,在世界範圍內的公認的高手也有很多。所以對阿爾法狗的人機PK,很具有代表性。反觀百度,果然是人家做什麼,百度學著搞,只可惜,這次選的平台娛樂性太強,項目又沒有太大意義,所以看看就樂呵一下,不具有代表性。(我挺希望Master能公開PK平台,讓世界AI團隊挑戰,PK一次多少美金,想想也挺有意思)

其實人工智慧的未來是 專業性的 有價值的 經驗領域,比如無人駕駛,疾病診斷,古董鑒定,

4.我的恐懼在何

理性點考慮,AI的發展勢必會造成底薪工作崗位被擠壓,特別是中國,想來倚靠製造業,勞動密集型產業,而且由於人數龐大,產業結構轉型慢。 其實機械化生產正在侵蝕底薪工作崗位,下一個階段,AI的發展與進入,很難相信國家如何應對在這個AI高速發展的時代。

AI是未來,我們卻沒有做好準備。


推薦閱讀:

TAG:人工智慧 | 綜藝節目 | 最強大腦電視節目 |