如何看待《最強大腦》第四季 的人機大戰?
首先,Andrew Ng在人工智慧界的地位就不多加贅述了。個人認為這個節目里用的是百度專門為這個節目做的程序,Andrew Ng 應該就是掛個名,站台上代言一下而已。看完整期節目,我有以下幾個拙見(其實有點較真):
1. 關於項目的不公平性。
(1)計算力上的不公平性。眾所周知, CPU的計算力之強大,之前最強大腦的速算為例,計算機的話,一行代碼搞定,無論是10位數加減乘除還是百位數,千位數,肯定是瞬間出結果。即便小度用的是很一般的處理器,在計算速度上也是秒殺級別的,所以最後一輪,雖然小度和王峰都輸出了正確結果,小度靠時間優勢取勝,勝之不武,該規則有失偏頗。關於為什麼第一輪,匹配少女的環節用時過長,我懷疑是這樣的: 一個女孩出現的幾秒鐘,因為畫面是動態的,小度應該是把這些流動的畫面按時間劃分成很多靜態畫面,然後把畫面一一做了相似度計算,所以要慢很多。
建議:
應該忽略時間因素的影響,比如要求10分鐘內確定答案就ok,而「正確率相同看時間」的舊思想應該只保留在人v.s.人或者 機器v.s.機器的比賽中。P.S. 前不久的圍棋大戰中,Master在對戰聶衛平的比賽中把時間由30s提高到60s就體現出這一點。(2)經驗度上的不公平性很明顯,對於這種 監督學習(supervised learning),倚靠百度的海量數據,小度可以通過大量的實例學習提高準確率,特別是第二輪比賽中集體照的環節(畢竟舞台效果不太容易在之前模擬)。建議:
如果在比賽前幾天將小度用的學習數據交給人類方,是更公平的。(3)項目成熟度上的不公平人臉識別的項目太成熟了,支付寶都應用化了,準確度確實高,這裡雖然有年齡的跨度,但本質上對面部特徵值的提取,和判別方法等成熟的不能再成熟了。一個已經如此成熟的課題,套上一個時間跨度的皮pk人類,確實有失公允。之前有過一期節目:一個好像是香港的妹子的能力令我印象深刻, 好像是讓通過父母的臉,匹配孩子的臉,儘管我覺得小度贏得概率依舊大,但比節目里的項目更有意思,而且在尋找被拐兒童方面,也更具有作用。
(4)關於doctor魏 「小度只有一個大腦的說法」。
我認為這個說法是不太對的,這裡先不說多核心的問題, 在演算法上,非常有可能小度同時運用的多種演算法計算,然後匯總多個相似度結果後,給出最終結果。從這個角度上講,讓三個人類選手一起應戰,也沒有不合理之處。(5)其他
其實很多因素都有失公平,但無法避免,比如人類疲憊的問題,比如人類通過屏幕觀察,而小度觀察的圖像是直接傳送還是攝像頭二次從屏幕獲取,無從而知。當然這些因素不是並沒有太大的影響。2. 關於作秀的成分(百度這波廣告滿分)
【重要的話說三遍】我強烈懷疑 挑雙胞胎之一 是故意安排的,我強烈懷疑 挑雙胞胎之一 是故意安排的,我強烈懷疑 挑雙胞胎之一 是故意安排的。我強烈懷疑 列印出第二張結果 是人為操作的。
我強烈懷疑 列印出第二張結果 是人為操作的。我強烈懷疑 列印出第二張結果 是人為操作的。首先從概率上挑中雙胞胎的概率不是很高,其次,隊伍中有雙胞胎,製作團隊100%提前知道,這麼好的資源不用,太可惜了。
ok,退一步講,如果真的是隨機挑中了雙胞胎之一。
按照規則,輸出一個結果,100個程序員中99個都是按相似度排序後輸出最高那個,還有一個程序員不會排序,被老闆打死了,墳頭草都快1m了。
從節目中看,兩個相似度確實不一樣,有0.01%的差別。請問兩者都輸出的原因在何?原因是差距小? ok,請正確定義什麼叫差距小?
1%,0.1%,0.01%,0.001% 。
再退1W步講,百度就是厲害,就是找出兩個了。
最大的漏洞在於:為什麼兩張圖片沒有同時列印,而是間隔了一段時間。 這明顯是人為操縱的。
還有一處細節: Andrew Ng 大神 看到圖的第一反應: Are they the same person? 其實這個環節挺做作的。他上去能幹啥?哈哈,上面都有數字,肯定選高一點的啊。 注意, Doctor 魏此時很淡定。
我相信:真相至少至少是跑出數據來,後台工程師一看相似度排序結果,心中OS「我去,怎麼回事,差別這麼少,再提交列印一份吧,別出問題」。
或者更黑暗一點:這一切都節目組安排好的,就剩Andrew Ng不知道,上去一臉懵逼,做節目效果。我更願意相信後者,因為一個正常的程序員應該不敢私自決定再列印,一般會懷著忐忑的心情堅信著「 畢竟高了0.01%」,以數據為中心,這是程序員的通性,事實證明 Andrew Ng也是這麼做的。
3. 關於這次PK的想法
我認為從各自極限上, 小度會一直贏下去,如果敗了,那一定是工程師做的不夠好,或者給工程師的時間不夠,至少也是和人類一樣做的不好,而不會更差, 畢竟是掛著Andrew Ng 大名的PK,又有Baidu 無比強大的數據支持,工程師團隊中必定個個都是 大神級別的人物。而且百度的這波廣告絕不允許被人類虐,所以。。。。。人類碾壓級別的勝利可能性微乎其微。為什麼圍棋阿爾法狗引起關注,很重要的原因在於規則的公平性要好很多,而且圍棋作為我個人認知體系里「最深奧的棋類項目」,在世界範圍內的公認的高手也有很多。所以對阿爾法狗的人機PK,很具有代表性。反觀百度,果然是人家做什麼,百度學著搞,只可惜,這次選的平台娛樂性太強,項目又沒有太大意義,所以看看就樂呵一下,不具有代表性。(我挺希望Master能公開PK平台,讓世界AI團隊挑戰,PK一次多少美金,想想也挺有意思)
其實人工智慧的未來是 專業性的 有價值的 經驗領域,比如無人駕駛,疾病診斷,古董鑒定,
4.我的恐懼在何
理性點考慮,AI的發展勢必會造成底薪工作崗位被擠壓,特別是中國,想來倚靠製造業,勞動密集型產業,而且由於人數龐大,產業結構轉型慢。 其實機械化生產正在侵蝕底薪工作崗位,下一個階段,AI的發展與進入,很難相信國家如何應對在這個AI高速發展的時代。
AI是未來,我們卻沒有做好準備。推薦閱讀: