如何看待最強大腦第三場人機大戰有人提前爆料出的水哥王昱珩「被輸」給小度事件?
真實性有待考證,不過據說水哥已經取關了最強大腦和叨叨魏。
關於《最強大腦》里究竟有沒有黑幕,這個問題大群主我進行了縝密的思考和研究。大家請看下面我的分析。
更多人工智慧:知乎專欄--硬創公開課
----------------------------------我是分割線----------------------------------
在吳恩達的微博下面評論區,求證是否有「黑幕」的評論被頂到了前排。
針對黑帖里幾個點,雷鋒網來扒一扒,這次黑幕的可能性有多大?黑帖主要針對了以下幾點:
1、臨時更改了規則
在節目錄製的前一晚,節目難度突然增加了,視頻明暗度調低了20%,這樣挑戰難度增加了好幾倍,令王昱珩處在不利地位。
魏坤琳在比賽現場也做了說明:「王昱珩要求節目組把明暗度調低,讓照片更加模糊20%,但這個難度(對於人來說)增加太多了,可能機器在這方面不會受到明暗度太大的影響。」
對於臨時更改規則這一點,王昱珩在直播里說出了自己的想法:「對於增加難度,我想的是,是不是越暗,電腦的噪點就越多?如果我把亮度降下來的話,是否(電腦在處理的時候)就回不來(亮度)。就像如果給一個人美顏了,再讓這張照片回到原圖可能就費勁了。」
王昱珩的動機,實際上是想增加對機器人的難度。他在之前的綵排中,三次都是全中,在這樣的情況下,他提出增加難度的動機是可以理解的,他不想平手,他想贏,想讓計算機出錯。但是人工調節照片的明暗度,對計算機來說,可能根本沒有什麼影響。
魏坤琳給出的說法是:「人工智慧用對比度解決識別輪廓的問題,就算整體變暗,但是對比度還是原來的,只靠這個東西就可以把線條輪廓弄出來。「
北京大學信息科學技術學院的一位博士生告訴我們:
「人工調節明暗度如果是成比例縮小所有像素的數值,那麼相對於人來說,人工調節對電腦的影響不太大。但如果是因為拍攝環境的改變,比如說天色變暗,那麼人工智慧將會受到影響。魏教授所提到的通過邊緣輪廓識別人臉是正確的,像部分傳統人臉識別演算法,就是通過相對明暗度來檢測特徵點從而識別的,所以降低明暗度對這類演算法影響不大。但是對於深度學習,由於我們目前並不完全了解它提取了哪些特徵進行識別,並且大部分開源的訓練照片的明暗度都適中,所以在部分深度學習演算法的評測,我們確實發現拍攝環境的明暗度是有影響的。」
也就是說,如果小度的工程師團隊用演算法把照片明暗度恢復了,那麼其實人類和計算機面對的難度是不平等的,另外這位博士還說道:「比較公平的是,在視頻錄製的時候,調低附近燈光。」
但是視頻錄製是早在一個月之前就弄好的,王昱珩在直播中說道:「我誤認為耳朵和鬢角是唯一沒有遮擋的地方,所以是最能反映真實信息的。我哪想到這(視頻)是一個月前的,中間有剃頭的、長痘的、痘痘消了的。」而規則是在錄製的前一晚更改的,所以當時無法去從根本上調整視頻的明暗度。從這個角度來說,王昱珩在不是很了解機器學習運行原理的情況下,誤以為自己更改規則會增加機器識別的難度,但實際上並沒有,用他自己的話說就是「聰明反被聰明誤」了。
2、王昱珩把本來正確的答案,改成錯的
在視頻中,我們看到王昱珩有幾次,都是在2個選項中決定,然而往往都是把正確答案擦去,最終選了錯誤答案,最終他三個答案都錯了。鑒於王昱珩之前的表現,三個都錯是比較異常的,所以就有人就懷疑,王昱珩是「被迫」擦去了答案,甚至「還原了」當時王昱珩憤怒的畫面。
(黑帖之一截圖)
王昱珩自己在直播里解釋道:「如果你讓我只寫一次的話,或許我就對了。我擦掉的全是我之前寫的答案,留下來的都是我校準完以後的。」王昱珩用人的耳朵和鬢角來做「校準項」,這幾個信息是會隨著時間而產生變化的,這是他三次都錯的主要原因。
3、小度的對話問答系統受到質疑
小度在現場除了進行比賽之外,還跟主持人、嘉賓互動,展現了機器人幽默可愛的一面。然而這種問答系統似乎並不是計算機自動產生的。
首先,我們沒有看到小度在交互的過程中是用「喚醒詞」來開啟對話的,似乎人們不用說出「喚醒詞」就能跟小度對話,而這是目前NLP領域不可能達到的水平。其中有一個細節是,主持人在第一期節目里問王峰是否對自己的答案有信心時,轉身問小度:「對於你的答案有......」話還沒說完,小度就自己回答「有信心」。主持人也忍不住吐槽:「我還沒問他,他就直接講出來了。」
一位從事NLP研究的博士生告訴我們:「目前機器是不可能生成這樣的答案,一般人做聊天機器人不會加入搶答這個功能,因為無法確定什麼時候該回答。所以我猜測是有台本的, 後台有工作人員控制。」
4、小度在第二輪錯得「離譜」
在第二輪中,小度和王昱珩的答案都錯了,正確答案是中間的8號,王昱珩選擇了7號,小度選擇了29號。可以看出,7號與8號比較像,然而小度的答案29號卻與8號相差比較遠了。
對於這一點,百度的工程師似乎也感到很驚訝。目前獲贊最多的 @翁仁亮 老師也講出了她的迷茫:
作者:翁仁亮
鏈接:如何看待最強大腦第三場人機大戰有人提前爆料出的水哥王昱珩「被輸」給小度事件? - 翁仁亮的回答 - 知乎來源:知乎著作權歸作者所有,轉載請聯繫作者獲得授權。哦 對了 小度為什麼第二題會選出29號 我們也不知道。當時我們是一臉蒙逼的。這也是後面research的一個很重要的課題,就是對深度神經網路的輸出和網路特性做理論解釋。
更新: 我能理解大家的心情。。換做我 我也難以相信水哥會全部做錯。我和我們團隊很多人都是水哥的粉絲。所以揭曉比賽的結果的過程中 我的心情是很複雜的。。比賽前,我們總監和我們說「水哥太厲害了。輸給水哥很正常 除非你們三題都做對 才有可能打平。」所以我們從一開始就是抱著打平的目標去優化演算法的啊! 雖然確實輸給水哥是正常的 但是不能輸的太難看。因此,我們針對這三個場景做了很多優化。包括做各種各樣的data augmentation,設計新的演算法(每一對sample 不同的patch之間各自先做比較,比較的結果再adaptively 學出權值來加權不同patch的比重)。到排練的時候(錄製的前一天,對,我們需要走過場,確保所有的信號線儀器都是可用的)節目組給了模擬題給小度和水哥做測試。結果是雙方都是三道全對。。我們才稍微舒了一口氣。
後來才知道水哥為了贏當晚找節目組增加了題目難度。。只不過提升的難度(人臉模糊及暗度)在我們的前期訓練中的data augmentation里已經儘可能地cover到了,所以對小度的影響不是很大。。這個可能是水哥結果不太理想的主要原因之一。至於說水哥迫於節目組和百度的壓力改答案,這個說法不止傷害了節目組和百度,也傷害了水哥。如果水哥就這樣被百度威脅了 他也就不再是我們的水哥了!更何況,他後面也不會選擇要和小度再戰。所以,請大家相信我們,我們不會也不屑於做這樣的事!水哥更不會因為百度的一句話而改答案!期待和水哥的再次交戰!
為什麼系統出現了這麼大的失誤?雷鋒網諮詢了幾名業內專家,沒有得到確切結論。雷鋒網也進一步聯繫百度IDL的工程師,目前為止還沒有得到回復。
小度這次為什麼會被黑?
同樣是帶有PR性質的「人機大戰」,跟AlphaGo與李世乭對弈相比,為什麼谷歌沒有被質疑,反而達到了震驚全球的效果(因AlphaGo的影響,2016年甚至成為了「中國人工智慧元年」),而百度這次有人工智慧界的權威人物吳恩達坐鎮,甚至當事人王昱珩進行一場「澄清直播」都顯得不夠。
為什麼百度這場「人機大戰」會招徠這麼多質疑?
其中有一個很重要的部分,是「播出形式」對比賽的真實性打了折扣。AlphaGo與李世乭對弈戰況,是實時直播的。站在第三方觀戰的角度來說,觀眾可以看到比賽全程,雙方落下的每一步棋、思考時間等等細節,都一覽無遺地呈現出來。所以李世乭「神之一手」這樣具有「戲劇化」的一幕才會一直到現在都被人們津津樂道,人們並不會去質疑這是否是經過了編排,因為觀眾都是「親歷者」。
《最強大腦》是個錄製節目,為了營造戲劇化的情節,節目組會對賽況進行後期剪輯編排,加上燈光和音樂效果,所以對於觀眾來說,比賽進程的真實性就是會打折扣,這是「播出方式」本質上決定的。
另外,第一期節目里,王峰是臨時受命上場的,人類在毫無準備的情況下去對決一台訓練充足的機器,這種比賽規則並不公平。還有一點,就是小度的語音問答系統的真實度確實不高,但是節目里卻營造出小度在跟主持人、嘉賓聊得風生水起的效果,普通觀眾或許真的會因此認為AI的能力已經達到這樣的高度了,這會讓人們對AI抱有不切實際的期望,而這對整個AI的發展並不利。
百度深度學習實驗室主任林元慶此前曾在採訪中表示:「我們在過去幾年裡,對百度大腦投入了很多,這次參加《最強大腦》的初衷,其實就是為了看看我們的技術水平達到了什麼程度。」
《最強大腦》始終是一個娛樂性質的綜藝節目,如果百度想做一次像AlphaGo那樣成功的PR,其實可以考慮把比賽的控制權掌握在自己手裡,請一群人類高手來參加自己組織的比賽,做好賽制的Peer Review工作,徹徹底底做一場較量,或許就會好很多吧。
吳恩達在接受採訪時說道:「雖然小度在人臉識別方面可以做的非常好,但是如今王昱珩以及任何人類能做的事情,AI還不能做到。」但這樣「請理性對待AI」的信息,似乎並不能夠通過娛樂節目來傳遞給大眾,反之只會令AI的狂熱越來越大。
總的來說,這次小度參加《最強大腦》遭黑,是因為這場秀里「若干個謊言包裹著真實」,確實有一點難以服眾,當然你把它當個娛樂節目來看,也就沒什麼了。
答案來源:小度戰勝「水哥」王昱珩,到底有沒有黑幕? | 雷鋒網
「我很想贏,但我並不怕輸」
這才是喜歡的原因
-------------------------------------------看過幾集最強大腦。
按照大部分的項目和設定,人腦比不過電腦是理所當然的。
就好象同一集的那個花傘的項目,人眼看旋轉的傘,會看不清細節,機器來看,完全就是錄下來,然後一幀幀的看。光是這點的差別就是巨大的。人臉這個項目也是這樣。
王昱珩覺得亮度調低就難度降低。但是電腦錄下來之後,是完全可以自己重新把亮度調回來的啊?隨便一個功能稍強一點的視頻播放器都有這功能。雖然這麼調了之後,顏色可能會失真,某些本來比較亮的區域會過曝,但最起碼的是畫面不會產生形變的,所以是不會對面目特徵提取產生任何影響的。這點「提高難度」的小把戲,純粹就是沒仔細考慮人腦和電腦的差異,然後反而把自己給坑了。所以我覺得什麼ai之類的,沒必要上來跟人pk這種記憶類型的項目,純粹是勝之不武。人的腦力大師們,也不要去跟電腦pk這記憶類型的項目,純粹是自找沒趣——尤其是之前的那些什麼魔方牆星空牆找不同的,在電腦來看,只要把畫面對應區域提取出來,網格化之後,搜索代碼甚至都不超過100行。不說有沒有黑幕,我覺得人工智慧在識別和選擇能力上再搶,也取代不了水哥的地位知乎專欄作者:花痴女王
鏈接:知乎專欄
來源:知乎著作權歸作者所有。商業轉載請聯繫作者獲得授權,非商業轉載請註明出處。自從水哥王昱珩上周輸給了人工智慧以後,很多人都在後台叫女王寫「水哥王昱珩」,但說到這個自然就少不了說人工智慧。所以,我請了一直對圍棋大戰阿法狗很有研究的妖女來寫這篇文。我最後在她文章的基礎上做了一些修改和補充。
花痴妖女+女王|文
《最強大腦》水哥王昱珩挑戰人工智慧的人臉識別比賽我看了。
怎麼說呢,雖然水哥輸了是很可惜。
但我覺得結果還是可以接受吧。
△比賽內容就是從30個嫌疑人中找出監控視頻中一閃而過的三個嫌疑人
先不討論是不是有黑幕(水哥後來多次說明了沒有黑幕,在這一點上我選擇相信水哥),輸的原因,水哥和叨叨魏在後來的直播里說得很清楚。
一是比賽臨時增加了難度,人像出來的時候,閃了一下屏。而且為了挑戰極限,水哥自己要求將監控視頻的明暗度調低20%。
這兩點,叨叨魏說對人工智慧影響不大,因為電腦只會選取最清晰的一幀記憶,但人沒有這種功能。
另一個就是,水哥在備選選項里,把正確答案都寫上去了,但提交的時候卻選錯了。
有人說是節目組要水哥擦掉的,但水哥的解釋是,這是因為他最後二選一的時候,參考的不是五官,而是鬢角之類的細節,而視頻是一個月之前拍的(水哥說事先不知道),水哥的這些校準項都是會變化的,所以最後就選錯了。
△這是水哥和叨叨魏賽後做的直播內容,在水哥微博上有,文字記錄是公眾號「玩物益志」的博主自己寫的,我在網上看到就截圖下來
結合上面這兩個因素,水哥輸的原因,主要就是我月半說的:
「他有這樣的實力,他輸在選擇上。
這就是說做選擇的時候,人還是沒有機器準確」。
△強行讓我月半出一下鏡
是啊,的確就是這樣,電腦做的是概率運算,會選相似度最高的。
而人哪怕是水哥,都是有情緒的,有偏差的,兩個答案放在他的面前,可能對他來說都是50:50的概率,這當然更容易選錯。
可是這又怎樣呢?選擇比不上機器準確又怎樣呢?這就能說人不如人工智慧嗎?妖女我要舉雙手和雙腳反對啊。
光是看水哥為了隊友重新回到賽場挑戰人工智慧的勇氣,我就覺得帥炸了。
△「我是想贏,但我並不怕輸」,man爆了。有多少人不願意去挑戰人工智慧就是怕砸招牌,敢出戰本來就很man。而且水哥本來是不想再錄節目,是節目組和他以前的隊友邀請他回去的,這是講義氣。
而且就像叨叨魏說的,計算器算術又快又准,可是我們人類會去崇拜一台計算器嗎?不會。
「因為只有人,才會為兄弟兩肋插刀。」
△叨叨魏又說了句大實話
我真的超級同意這句話!
他說出了我喜歡水哥的理由。
水哥是很厲害,智商很高,但我喜歡他,並不是他像機器一樣精準,而是水哥作為一個大魔王類的boss級人物,不僅不高冷,身上還有非常熾熱的情感,熱血且熱愛生活。
這一種反差萌,才是最吸引我的地方。
△在第二季對日本隊的比賽里,水哥將摺扇比作歷史,上面寫滿了30萬遇害同胞的名字,日本人卻想把它折起來……這番話,當時真的直接把我看哭了
比如水哥的成名之戰「微觀辨水」,在520杯水中找出被嘉賓選中的一杯。
看上去很屌對不對?水不都一模一樣的嗎?還能看出分別?
水哥不僅做到了,而且速度驚人(不到一秒觀察一杯,用時不到15分鐘)。
當時在場所有人都以為他有什麼超能力。
△水哥這個名字就是這麼來的。
但其實,水哥並不是天賦異稟(水哥說也是上了節目做了檢查才知道自己的海馬體跟別人不一樣),也沒有專門練。
「只是我比別人都有閑功夫,願意安靜下來看一些東西。」
水哥強調,他完成挑戰靠的是想像力。
當他觀察水的時候,水哥不是去看這杯水有多少個氣泡啊,氣泡排列組成怎樣這些硬邦邦的特徵,而是把所有元素都聯想起來,把水想像成一幅畫。
比如這杯子里裡面是「一張孩子的臉」,這就特別容易記住。
看上去很玄,特別難理解對不對?
那你去看看水哥家就明白了。
那裡就是一個奇幻森林。
不僅花花草草鋪滿屋,而且還有各種動物,貓、龜、鸚鵡,魚……
而水哥的「超能力」,就是跟家裡的這些生物學的。
△水哥的女兒和貓,萌爆了。
畢業以後,留在家裡做設計的水哥,除了工作,其餘大部分時間都花在這些花花草草、動物身上了。
在這個照顧的過程中,水哥每天都可以看到它們的變化。
像葉子,他可以從紋路上看出它水分是不是充足。
像魚,他可以從體型上看出它是不是「懷孕」了。
像珊瑚,很多人就覺得它是「死」的,不會動的。
可是在水哥眼裡,它每天都有變化,就連珊瑚上面的蟲子,他都能看到。
就是有了這種從生活中培養出來的觀察力,水哥才可以分辨出不同的水。
因為在水哥眼中,水就跟珊瑚、樹葉一樣,它有自己的生命,有自己的美。
「當你發現每一杯不同的美,自然就會找到它。」
這確實不是什麼天賦,而是一種「用心」生活的能力。
(當然對我們這些湊合過日子的來說,熱愛生活的人就像有了一種超能力了)
另外就是,水哥雖然被稱為「鬼才之眼」,但他眼睛視力其實很差。
2014年,水哥的右眼被羽毛球砸中,現在視力只恢復到0.3左右,而且隨時有可能會失明。
當水哥在節目上說出「他眼睛不好」的消息後,很多人都震驚了,大家驚訝,水哥是怎麼用一隻眼睛完成那麼多變態挑戰?
可是,妖女我更關心的是,水哥到底怎麼從幾乎失明的痛苦中走出來的。一般人要有這種情況,別說去做什麼「鬼才之眼」,估計正常生活都很難。
剛受傷那段時間,水哥確實也很痛苦。
因為受傷,他的視覺畫面從立體變回平面:台階變成斑馬線,倒水常常灑出來,甚至連夾起花生米都做不到。
基本的生活自理都成了問題,工作也被耽擱了,電腦都看不了。
就連睡覺,為了防止眼壓升高,水哥也只能坐著。
但是,水哥沒有放棄。
在醫生的開導下,水哥發現自己現在兩隻眼睛都還在,已經是非常幸運的。
所以,他要在自己眼睛還能看見的情況下,多做點有用的事情,多留下點東西。
於是,水哥在眼睛受傷的時候,關上電腦,拿下放下了十多年的畫筆開始畫畫。
他畫身邊的花花草草。
畫動物。
還畫女兒。
△水哥希望在失明之前多畫一點女兒,這一段我也看哭了
同時,水哥還開發出很多新技能,比如樹脂畫。
做扇子。
做陶瓷。(好可愛的小恐龍,妖女也想要&>_&<)
甚至做荷包。
生活,就這樣慢慢變得豐富起來。
水哥說,如果不是眼睛受傷,他大概不會重新畫畫,不會有後面這些技能。
「這也是壞事變好事啦」。
就連右眼快要失明,水哥都可以豁達地把它當成一件好事。
這麼強大的內心,現在你明白,水哥站上台的氣場從哪裡來了吧?
所以,我一點都不擔心水哥輸給人工智慧的事情。
畢竟人家連眼睛受傷都挺過去了,這小小的一場輸贏,對他來說,又算什麼呢?
△水哥說他想有一天能告訴女兒自己眼睛不好這件事,然後跟她說,「沒有什麼困難,是不能克服的」。
說到這裡,我還想說說另外一個,剛剛輸給人工智慧的高智商男神——柯潔(據說他也要去最強大腦,我又可以花痴了)。
他是圍棋界酷炫吊炸天的騷年。
不到20歲就成為了世界第一,還四次獲得世界冠軍(頭銜太多了,只寫幾個最屌的)。
在幾個星期前,這個最強少年,也和人工智慧PK了一場。
只是他們是用網上下圍棋的方式,結果,柯潔輸了。
△柯潔178手不敵Master。
而且,人工智慧不僅贏了柯潔,還碾壓其他職業高手,取得了60勝的瘋狂戰績。
這是去年4月李世石輸給阿法狗之後,人類在圍棋上的第二次落敗。(這事女王寫過阿法狗贏了又怎樣?它懂男人下圍棋時那動人心魄的帥嗎?)
很多人擔心,我們的圍棋是不是真的搞不過人工智慧啦?
對這個問題,妖女我作為一名棋迷,是一點都不擔心。
因為人工智慧厲害又怎樣,我又不會花痴它。
它連柯潔萬分之一的可愛都沒有!
△柯潔小時候萌萌噠。
人工智慧會賣萌嗎?
會有纖纖玉手嗎?
會說段子嗎?
△央視把柯潔叫成了何潔,柯潔懟了他……
會獻愛心嗎?
△在家鄉麗水遭遇強降雨災害時,柯潔發起了公益指導棋籌款活動,為災區籌集40多萬善款。
而且最重要的是,像這樣可愛的棋手坐在棋盤前落子,難道不是比兩台冷冰冰的機器對坐無言,然後直接算出結果的畫面要美得多嗎?
柯潔在輸給人工智慧之後說過:「就算輸給機器,也不是什麼丟人的事情」。
「我經常會和機器測試,在Master(Alpha Go s升級版)出現之後,我們棋界沒有一個人怕輸,都是往上沖,雖然結果很慘烈,但是我們人類還有機會。
其實,輸掉之後,我和國內一些頂尖公司交流,如果我們能多下幾盤,我相信肯定能發現它的弱點,我相信人類還是有機會的。」
對啊,我們人類就是這樣啊。
不怕輸,衝上去,就還有機會。
這種不會被打敗的熱血,才是我迷戀這些高智商男神的主要原因啊。
甚至是人工智慧,它們背後的程序員,不也是這樣不怕輸每天和bug作戰的一群人嗎?
只有這份精神在,我們又怕什麼人工智慧呢?我們又不是要活成計算機!
最後,我想用李開復上周在《奇葩大會》上說的演講結束這篇文章,我覺得這是目前關於人工智慧最好的概括:
「在未來十年,可能有一半的人會失業。交易員、助理、秘書、中介,這些重複性工作,人工智慧會比人類做得更好。」
「但是,人工智慧雖然厲害,但它真的不懂什麼是美,它不能說出畢加索為什麼是個偉大的藝術家。」
「人類在過去一百年大多的被逼著走向了,所謂的要學就學理工,要進就進商學院,而人文藝術的東西可能放掉了。
也許人工智慧取代這些重複性工作以後,反而給了我們更多的機會,我們能更平衡地發揮。」
「而且,在人工智慧取代重複性工作的社會裡,我們就有了更多的時間。所以,去開心點,玩玩有趣的東西,不是更好嗎?」
你看,連理工大牛都這樣說了,我們就沒必要瞎擔心了。
如果有一天人工智慧真的做了人類的大部分工作,那我們就像水哥一樣,好好生活,用心生活就好啦~
我們人類積極的生活態度,才是永遠沒辦法被取代的!Fighting!
花痴妖女+女王|文
喜歡文章的歡迎關注我的微信公眾號「花吃了那女孩」(ID:huachinvwang)
更新: 人工智慧即使贏了人類,也是你的朋友。這是我們與民政部合作推出基於人臉識別技術的尋人平台 希望能通過這個平台讓更多的家庭團聚
http://xunren.baidu.com/index.html?from=timeline
更新:不要輕易相信自己願意相信的事情。
轉發一下叨叨魏的微博(微博ID:魏坤琳):
「 其實,讓科學流行起來是一個美好的願望,但我一直期望起碼能讓理性思考、獨立思考的精神流行起來—不過,現在看來,也許,這更難。
大家可以看看昨晚水哥和我的直播的說法,不要人云亦云。
」
-------------------------------------------------------------------------------------------------------
哦 對了 小度為什麼第二題會選出29號 我們也不知道。當時我們是一臉蒙逼的。這也是後面research的一個很重要的課題,就是對深度神經網路的輸出和網路特性做理論解釋。
更新: 我能理解大家的心情。。換做我 我也難以相信水哥會全部做錯。我和我們團隊很多人都是水哥的粉絲。所以揭曉比賽的結果的過程中 我的心情是很複雜的。。比賽前,我們總監和我們說「水哥太厲害了。輸給水哥很正常 除非你們三題都做對 才有可能打平。」所以我們從一開始就是抱著打平的目標去優化演算法的啊! 雖然確實輸給水哥是正常的 但是不能輸的太難看。因此,我們針對這三個場景做了很多優化。包括做各種各樣的data augmentation,設計新的演算法(每一對sample 不同的patch之間各自先做比較,比較的結果再adaptively 學出權值來加權不同patch的比重)。到排練的時候(錄製的前一天,對,我們需要走過場,確保所有的信號線儀器都是可用的)節目組給了模擬題給小度和水哥做測試。結果是雙方都是三道全對。。我們才稍微舒了一口氣。
後來才知道水哥為了贏當晚找節目組增加了題目難度。。只不過提升的難度(人臉模糊及暗度)在我們的前期訓練中的data augmentation里已經儘可能地cover到了,所以對小度的影響不是很大。。這個可能是水哥結果不太理想的主要原因之一。至於說水哥迫於節目組和百度的壓力改答案,這個說法不止傷害了節目組和百度,也傷害了水哥。如果水哥就這樣被百度威脅了 他也就不再是我們的水哥了!更何況,他後面也不會選擇要和小度再戰。所以,請大家相信我們,我們不會也不屑於做這樣的事!水哥更不會因為百度的一句話而改答案!期待和水哥的再次交戰!
更新 :關於流言 水哥今晚9點40會在一直播上分析當時的比賽情況 大家感興趣的話可以關注一下
我是IDL人臉組的翁仁亮 也是參與這次最強大腦項目組的成員之一。 我們參加這次最強大腦最大的初衷是為了探索和證實人工智慧人臉識別是否真正意義上的超過了人類,尤其是和觀察力超強的人比 這個結論擅且未知。為此 我們全程卯足精力,加班加點,就是想做出我們能做到的最強演算法去和最強大腦的選手去比賽,不想留下任何遺憾。當然,對於我個人而言,我很想贏。一來,這可以驗證人臉識別在給定足夠多的訓練數據和網路capacity 後能夠在很多情況下超越人類,這對我們後續的研究是很大的鼓舞。二來,對idl以及百度來說確實是個不錯的branding,改善百度在外界的口碑。但是,我們最不想做的是在一個不公平的平台上比賽,更不會逼選手改自己的答案獲勝。這樣做不僅違背了我們的初心,也愧對我們之前為這個項目通宵達旦沒日沒夜投入的心血!
具體和水哥比賽的幕後細節,我會在第三期播出結束後更新這個答案,請大家不要散布沒有證實的猜測和謠言。多謝!
從圖形圖像角度說百度機器人戰勝王昱珩,規程有欠公平
寫在最前面:
1,如果說《最強大腦》僅僅是一個GAME,不需要具備嚴謹性,那請節目組和相關人員忽略此文,就當我啥也沒說。我本人也是廣播電視從業者,做過10年的導播,很能理解你們,這裡只是希望換個技術角度對節目流程和制度提點看法,我愛《最強大腦》,希望它娛樂性和嚴謹性兼備。
2,想看或者分析百度有什麼黑幕的可以繞道了,本文不涉及這個,我感謝並尊重百度的工程師們為人工智慧所做出的努力,人工智慧的進步會使你我他都受益。以下分析是純技術角度的,盡量不帶感情色彩。
以下正文
王昱珩給自己挖了坑,真的,為什麼自己坑自己我並不清楚,但坑明明是在的。
記得節目最後叨叨魏說過,王昱珩太想贏了,並且想贏得漂亮,所以賽前他提高了難度,把圖像的亮度降低了20%......
這就是王昱珩給自己挖的坑,最終的失敗也與此直接相關,請看:
水哥和小度(應該叫大肚才對,沒腰的)共同看到的錄像是這樣的
(圖片來自愛奇藝視頻截圖,侵刪)
看官覺不覺得奇怪,圖像很暗,甚至連路燈都暗的不正常?
導入示波器進行分析,發現圖像的峰值(屏蔽截屏周邊後加的台標字幕什麼的)僅僅在350不到,這還是路燈,臉部亮度估計連128都不到,正常路燈應該是「爆掉」——1024,臉部至少也要在512以上。以下是正常畫面的示波器波形,圖像也是來源於該節目的這個片段中
可以清楚的看出,上面的圖像才是應該擁有的正常亮度,示波器也顯示出正常範圍。
是的,叨叨魏說對了,圖像在水哥的要求下被調暗了,為的是增加難度,贏的漂亮,但叨叨魏也許說的不準確,調暗不止20%,而是50%甚至更多。
的確,這是水哥自己要求的,他希望增加比賽的難度,他希望替人類再多爭取幾年的領先地位,他很自信,覺得難度增加對自己和小度是同等的,公平的,所以才會如此要求,水哥在拼,甚至賭上了失敗帶來的聲譽損失,憑這一點,我敬重他,但他可能不知道,這個調暗,對小度幾乎不會產生多大影響,而對人類,影響很大,請看:
我只花了5秒鐘的時間,加了個類似ps中Auto lelves之類的插件,把亮度調上來,就得到了這個,事實上,目前江蘇衛視的拍攝肯定已經是全高清,我這個只是網路上的SD視頻截圖,壓縮也是類似H.264的高壓縮率,所以,節目組給小度的視頻,應該至少比這個高5倍,並且從節目中我看到水哥的視頻觀看電腦畫面不是滿屏的,是中間開小窗口,窗口解析度最多也就是SD的精度,720*576,如此重要的環節設定如此低的解析度,我不知道強大的江蘇衛視技術部門是如何考慮的(陰謀論者不要借題發揮)。
剛才提到的Auto levels功能,實際上小度是自備的,作為人臉識別,電腦肯定要把外部輸入的圖像先做預處理,把亮度對比度調到適中,再進行下一步工作(如果沒有此功能我會鄙視你們業餘),但人類自身沒有Auto levels功能,你看到什麼,就是什麼。
所以水哥以為自己的想法很公平,他看的吃力別人也不會好過。但不了解演算法的他無論如何也想不到自己看到的和小度拿來分析的圖像差別這麼大,到了這一刻,輸已經是鐵定的了。我們再來把清晰點的圖像拿來對比一下:
哪怕用這麼渣的圖像來觀察,只要水哥自帶Aoto levels功能,或者不要那個亮度降低,我相信屏幕前的你我都應該看出畫左的那位小哥和嫌疑人的臉型有著能看得出來的差距,自然會否定掉他。
水哥可能不了解圖形運算,所以他對自己挖的坑渾然不覺,但百度的工程師們你們懂啊,你們了解自己的小度的演算法,你們也是人類,你們更了解人類不具備此能力,哪怕最強大腦,有些東西不具備就是不具備,就像人類看不到紫外線,不具備這個功能,最強大腦也不行。沒有把這個坑明確的告訴水哥,可能也無可厚非,畢竟是對手嘛,但我說的不公平這就是其一,尊重對手,讓比賽公平進行應該是每個選手的做人底線,哦不對,小度是機器。
什麼還有其二?對的!
我只是個搞視頻製作的,我承認,面部識別技術我是渣,但多多少少也從你們百度上搜索到一些有價值的面部識別的常識,臉型、眼睛、五官的位置與特點,這是面部識別的關鍵,人工識別也是一樣,但此次的嫌疑人,要麼戴墨鏡,要麼戴口罩,要麼帽檐擋住眼睛,給識別帶來了前所未有的難度,很佩服百度有這樣的勇氣,也給節目增加了精彩,但這個難度對水哥也是相同的,所以沒有誰更佔便宜,很公平。
但既然眼睛和五官的信息不完整,那辨識只能依靠臉型輪廓,或者還有人的上半身肩膀什麼的與頭的比例,或者百度還有什麼秘而不宣的技術等等。人類判斷臉型是生活經驗,而機器判斷臉型則是依靠模型比對,或者簡單理解就是依靠被攝圖像,3D建一個人頭模型(這樣理解並不完全準確,只是為了方便吃瓜群眾理解想像),而建模需要3D信息,通俗點講一個人臉大,到底是腮幫子大還是臉蛋肉多,人類是依靠經驗,所以看照片就能猜出,而機器需要從正面和斜側面兩個以上維度來觀察,但照片是2維的,沒有深度信息,所以必須是動態圖像,但僅僅是固定鏡頭,畫面里的人在運動,Z方向信息量還是不夠,所以攝像機也必須運動,先通過攝像機反求算出場景和空間深度坐標,再根據人的運動和攝影機運動的交互解算,建立人頭和身體的粗模,然後和自己多年積累的資料庫進行比對。
所以,所以,所以,節目組聰明的想出了三個拍攝方案,第一個是行車記錄儀,車是動的人也是動的,第三個是兩個美女拿著手機玩兒自拍,第二個記不太清楚了,好像是路面監控,這個攝影機是靜止的,但這個角度和之後的嫌疑人正面證件照片的識別,我相信應該是百度最擅長的,畢竟它以後的應用方向和這個角度有密切的關係,所以積累的數據是最多的,即使攝影機不動,百度也自信可以識別(最終恰恰翻車在這上面,不知道是不是巧合),這三個「聰明」的拍攝方案不知道是誰想出來的,節目組還是百度,反正真夠聰明的。
人類看到最清楚最仔細的,應該是照片(朋友圈自拍美女圖不算),因為照片是靜止的,特徵點可以細細觀察,但我很困惑為什麼水哥翻來覆去的看視頻,沒有定格停下來,沒有暫停鍵?還是其他什麼原因,反正畫面那麼小那麼暗是事實。
綜合上面分析,百度和節目組還是有意無意的選擇了對百度更為有利的設定(陰謀論者請出去,麻煩把門帶好)。
所以我說,這個比賽,規則並不公平,如果我來設定,我就用照片,不用視頻,用仰拍,中景,沒有運動沒有參照物,旁邊還站兩個外形相似的人,打腳光,沒人工干預看你小度怎麼選,並且,這對人類的水哥來說毫無壓力(奸笑)。
我尊重百度,也尊重節目組,我喜歡《最強大腦》,可能是自己的腦子不夠用吧想用視頻雞湯補補,但真心希望節目設置更科學更公平,之前的比賽也有過,關於聲音比對的,機器比對聲紋是依靠波形、諧波頻率、音頭音尾等等數學手段綜合分析,所以根本不會受到那個斷斷續續的干擾項的影響,甚至機器根本不在乎你在讀什麼,只要採集到了足夠的樣本就行了,而人類是依靠經驗,超能力,這最容易受到干擾,如果我是那個小盆友的後援團,就會要求採集聲音樣本的話筒和最終唱歌的話筒使用不同的類型,一個用電容,一個用動圈或駐極體讓你諧波的音量等級發生變化,看你怎麼判斷,而這些對人類的影響也有,但比那個勞什子的干擾項要合理。
也許,也許。。。嚴謹的設置會使機器的失誤率增加,節目的娛樂性降低,但還是希望節目組在有叨叨魏的同時(很佩服此人),請一些更專業領域的老師做指導,否則遲早會鬧笑話。
上面啰啰嗦嗦說了這麼多,我估計能看懂和有耐心看的一定是「真愛」,自己都煩了,就此打住吧。
再回來啰嗦一句,最近「人機大戰」是個吵得很熱的話題,有人憂心重重,有人大叫人類藥丸,我的看法其實不必太在意,那個什麼阿狗戰勝人類的棋王一點都不奇怪,遲早的事情,並且比賽也是不公平的,那個狗傢伙躲在陰暗的角落裡,把能搜集到的棋譜全都存下加以分析,而柯潔李世石連阿狗是公是母都不知道,知己不知彼,哪有的公平嘛,越下會越輸,越下阿狗越漲經驗值,除非,有計算機團隊在柯潔後面做參謀,全面分析透徹機器人的弱點,這才有的玩兒。
反對@劉道偉 說的
百度贏了就是有黑幕,百度輸了就是技術渣
聲明下,在第四季前,我根本沒去理會記憶圈網上對這節目的水很深的質疑。而寫這篇答案是因為,碰巧就我對科技方面的所知已讓我在看這節目的時候一直吐槽。
我不是來解釋是否有黑幕,只是想解釋下為何人們認為這次比賽有黑幕。
1.自砸招牌:2014年吳恩達加入百度。百度在此後的ILSVRC人工智慧挑戰中居然取得了超越微軟和谷歌的最好成績。但是組織方後來發了一封通知,匿名的說有一個參賽組織通過馬甲多次考試來提高成績的方式作弊。(ImageNet Large Scale Visual Recognition Competition (ILSVRC)) 估計本想是給對方個機會主動承認,誰知百度不給面子,所以六月份又發了通告對百度指名道姓並貼出了詳細細節。(ImageNet Large Scale Visual Recognition Competition (ILSVRC) )自此百度才公開承認在人工智慧競賽測試中作弊
所以 Andrew Ng = 大神 ≠ 沒作弊
當然普通網民立即想到的應該是過去百度賣貼吧、賣廣告、百毒百科的那些破事。。。
2. 最強大腦節目組有作弊史:《最強大腦》總製片人桑潔就指責選手林建東是作弊贏得比賽。又比如官方同選手把在賽前就事先已經做好記憶部分,然後挑戰時只要做好選擇就行的項目偽裝成現場記憶。(長報道 | 王昱珩:最強大腦與自在的心 )(類似的還有聽水量,聽水高和聽盲擰)
3. 小度其實是並不是全自動AI
小度在現場比賽現場跟主持人、嘉賓互動,稍懂的人都知道這是後台哪位工程師以迅雷不及掩耳盜鈴之勢飛快打出的對白(或選出的預製台詞)。也就是說你無法確認比賽時是否有人工支援小度。
4. 誰都覺得比賽不公正
*視頻只播放一遍 &<--- 小度把視頻錄下了
*王昱珩要求節目組把視頻明暗度調低,讓照片更加模糊20% &<--- 小度只需增加視頻的曝光度(我很好奇,居然沒人告訴水哥這點)
*驗證時居然是現場叫嫌疑犯一個一個拍照 &<--- 人的瞬間記憶就會隨著時間的丟失慢慢模糊掉,李威在現場就說當心水哥的記憶
*王昱珩在直播時說了,視頻是在一個月前拍的,而他不知道中間有剃頭的、長痘的、痘痘消了的。。。。&<--- 這被坑的
*電視版剪掉了一段,Sina Visitor System ,陶晶瑩直接說了,綵排的時候,王昱珩比小度快,而且全對,而百度相關人員 翁仁亮 表示之前小度也是勉強達到平手的。。。
*某人技術性分析了案件視頻(如何看待最強大腦第三場人機大戰有人提前爆料出的水哥王昱珩「被輸」給小度事件? - cafe 的回答 - 知乎),基本上可以說這測試應該沒有經過嚴禁的選題,造成了對小度有利
相較AlphaGo與李世乭的公正公開對比,當大眾知道了最強大腦確實有為了收視率而做了些醜事,百度的那些破事,狼來了效應造成了這場比賽實在缺乏公信力!所以黑幕的說法才會流傳。。。。
人機大戰,水哥完敗。小度贏的是否公平?有沒有黑幕?
更新補充:有朋友提出,雖然小度有存儲記憶的優勢,但是你憑什麼認為它是靠記憶取勝?注意,我從沒說小度是單靠存儲記憶的優勢取勝。舉個很簡單的例子,一個MBA考試中的邏輯題目,相信考過MBA或者練過公務員行測考試的都能理解我說的意思,題目是:有兩個人A和B,參加人臉識別比賽,比賽規則是,給A和B看3張照片進行觀察,然後根據記憶,從20個干擾項中選出之前觀察的3個人。最後,A獲勝,因此,得出結論,A的人臉識別能力更強。下列選項中,最能夠加強結論的是?相信複習過MBA考試,抑或是公務員行測考試的朋友,都能直接脫口而出這題的正確答案,即:兩個人的記憶能力一樣,或者差不多。同理,這道題的另一個問答,就是下列選項中最能夠削弱結論的是?不給選項,相信有過MBA考試基礎的朋友也能答出來,答案就是:A的記憶力比B強很多。這個答案,或者說選項的解題思路,我們一般稱之為「另有他因」。並且請注意題目,是削弱而不是否定!同時,很多人提到人機對戰無法做到絕對公平的問題,這點我並不否認。但是叨叨魏第二場其實提出過能夠促進比賽公平的很好的建議,同時,水哥去年與螞可的比賽也有較為公平競賽的先例。我們不能因為人機對戰無法實現絕對公平,就對能夠在一定程度上促進公平的措施視而不見吧?下面是正文:水哥是四季最強大腦節目中,我最喜歡的一位選手,也是最強大腦的一面旗幟。他不卑不亢、桀驁不馴的性格特點,給觀眾們留下了深刻的印象。國人雖然對裝逼犯有天然的反感情緒,但水哥每次不經意的裝逼,卻能讓我們無比享受。
第四季第三期最強大腦的舞台上,水哥首嘗敗績,網路上關於節目組黑幕的消息令人應接不暇。我們不去琢磨那些真假難辨的消息,僅僅通過第四季的這三期節目本身,以及最強大腦官方微博透露的信息細節,回答兩個問題:1.比賽是否公平;2.百度有沒有作弊。
先說第一個問題,比賽是否公平的問題,結論很明確——不公平。我絕非有意袒護人類選手。
個中道理很簡單,公平的比賽的基礎是,雙方能夠得到的資源和條件應該是一致的。小度,或者說人工智慧也好,電腦也罷,相比於人,天然的優勢包括哪些?無疑包括後台記憶以及多任務處理的能力。什麼是後台記憶?也就是當小度看了視頻或者照片之後,能夠將數據完整地儲存,並且可以反覆回看,記憶永遠不會衰竭,除非是人為原因將其刪除抑或是硬碟損壞。什麼是多任務處理?就是小度可以同時提取已存儲的信息,與需要篩選的目標信息進行比對,並且可以同時對20張臉進行比對,直觀點說,好比你的電腦屏幕的左側是犯罪分子的臉,而右側是所有嫌疑人的臉,可以無比直觀地進行左右比對。而小度多任務處理的能力,在解題時間方面有優勢,好在節目組並不要求正確率相同情況下,以時間短者為勝。所以從這點來講,算是這場比賽中比較公平的一面。
但是,人的感知記憶卻是不斷損耗的,當小度利用後台存儲不斷回看時,人類選手只能根據不斷衰竭的記憶,反覆回憶反覆思考。所以,這三場人機大戰都是絕對的不公平。
在第二場比賽開始時,叨叨魏提出,應該為參賽的小寶反覆回放錄音,強化記憶,但是節目組對於三段錄音,只回放了一次,叨叨魏在台下不停嘟囔,不應該問選手是否需要回放,就應該一刻不停地回放。而節目組在具體安排時,顯然沒有接受這一對比賽公平較為有利的建議。最後的結果,是小寶與小度打成平手。倘若節目組按照叨叨魏的要求,為小寶反覆回放錄音,那麼,最後的結果人類選手獲勝的可能性很大。
再說去年,水哥在阿里巴巴的大本營杭州參加了一個比賽,是與阿里旗下的人臉識別機器人螞可進行比賽,在比賽過程中,為了體現公平性,水哥可以反覆回看識別對象以及牆上的照片,最後的結果是,水哥正確率完勝,並且完賽時間也領先螞可。而阿里的人臉識別機器人螞可,擁有商用領域最強的人臉識別技術。
所以,這三場人機大戰,是否公平,其結論不言而喻。
接下來,我們再來談談,百度是否存在作弊的問題。最強大腦官方微博在1月20日透露(見下圖),在第一場人機大戰前一天,節目組告知百度工程師,有可能需要對雙胞胎進行識別,所以,準確率還要提高0.001,實際上,此處的0.001應該是最強大腦官博編輯的手誤,因為比賽中小度對雙胞胎誤差的判別為萬分之一,即0.0001,倘若小度僅僅能夠識別精度為千分之一的誤差,那麼,這道題按照它事先設定的誤差和邏輯,將無法選出正確答案。
關鍵問題在於,為什麼節目組要提前一天告知百度工程師,有可能對雙胞胎進行識別,而且,識別的誤差務必要提高到萬分之一?事實上,第一場比賽的勝負點也恰恰在於這萬分之一的誤差,我們設想下,倘若沒有這對雙胞胎,或者是百度並未提前一天調準精度,最後的勝負結果,是否還會如此呢?
更可怕的問題在於這裡:為什麼節目組會曉得要將誤差調整為萬分之一才能夠準確識別?我們知道,不同的電腦,對於人臉識別的誤差、精度與準確率是不同的,倘若全部相同,那麼,小度也不必號稱是人臉識別的NO.1了。既然如此,倘若節目組用其他的電腦設備對這對雙胞胎進行識別,也許會得出誤差在百分之一,即相似度為99%的結論,而不必提醒百度,需要進一步調準誤差精度。所以,節目組提前告知百度需要將誤差精度調整為決定最終勝負,而且與現場結果截然相同的萬分之一,說明了什麼?無疑是在節目開始之前,已經讓小度對這對雙胞胎進行了識別,而且識別的結果與選定照片的相似概率在千分之一,但仍未能有效區分,即兩個答案結論一致,所以,為了確保小度能夠獲勝,節目組才不得不讓百度工程師進一步調準誤差精度。所以,節目組與百度究竟有沒有作弊,諸位可以自行分析。
再者,說說小度現場臨時改答案的問題。在第三季最強大腦中外PK賽中,李威與德國選手馬勞對陣,他在公布正確答案之前想臨時修改答案,但是卻被國際評審視為無效,而小度臨時改答案的行為,居然能被節目組接受,也真是讓人嘆為觀止。
總之,這三場人機大戰下來,競賽的規則絕對不公平,而且節目組與百度暗中確實存在作弊的嫌疑。水哥只是百度商業計劃中的一個犧牲品,百度需要推廣人臉識別的技術,所以,今年的最強大腦,百度必須要贏,而不問贏的是否光彩。至於水哥與小度電腦上看到的犯罪嫌疑人影像是否一致,以及為何沒有連貫畫面揭露參賽選手所看影像中人物的正臉,這些細枝末節,也沒有討論的必要了。
以下為百度工程師翁仁亮對節目組事先告知可能要識別雙胞胎以及小度列印兩份答案的解釋,也一同粘貼過來:
做出一點解釋,人臉識別對於雙胞胎識別的難度是特別大的,尤其是當前場景是跨年齡識別的時候。雙胞胎的人臉識別在學術界也是一個懸而未決的問題。我們測試過一些雙胞胎,雖然性能上還不錯,但是對於正常人的跨年齡識別而言,還是有性能上的顯著差異的。這裡性能不錯,我們認為是訓練樣本中的確有少量的雙胞胎,而且即使是雙胞胎,也會存在一些我們正常人類無法觀察到的variance,而這些variance會被已經訓練好的Deep Metric Learning神經網路分析到,從而體現在mapping特徵上距離的不同。而且當數據規模很大的時候,是可以cover到很多類似的case的。區分雙胞胎是非常難的,我們很早就跟節目組說,希望比賽里不要出現雙胞胎。節目組當時是明確說過不會有的。比賽的前一天,我們希望和節目組double-confirm 比賽里不會出現雙胞胎。節目組突然說這種情況她們不能排除,不能告訴我們是有雙胞胎,還是沒有雙胞胎。我們當時確實就急了,這不是太難了嗎!節目組反過來勸我們,有沒有雙胞胎,對機器和人類選手都是一樣的,還說百度的區分度要做好,比如小數點後面啊。她們覺得0.1%的區分度應該是很厲害的-- 因此她們在這個稿子里提到了0.001,我相信她們可能也不確切知道0.1%具體是代表什麼意思。和節目組溝通了很多輪,她們就是不否定也不確定的態度。最後,比賽就不到一天就要開始了,我們也別無選擇,只能硬上。因此,在程序設置里,我們決定當兩個分數相差特別少的時候,程序將列印兩個結果,當然也是分數高的先列印。這樣,我們即使在區分雙胞胎的時候錯了,我們也希望嘉賓能知道我們最起碼找到了雙胞胎,甚至我們當時還希望如果出現雙胞胎的情況,只要能把雙胞胎找出來,即使答錯雙胞胎中的一個,希望嘉賓能給我們0.5分。比較幸運的是,我們最後答對了,還是以0.01%的細微分差,這確實有相當的運氣的成分。
對於翁先生的解釋,我的疑慮主要在於,如果節目組沒有事先通知有可能識別雙胞胎,那麼,百度是否還會設定程度,在相似度極高的情況下,把兩個人都列印出來呢?
如果答案是否定的,即節目組沒有事先告知,那麼,小度現場只會列印一份,那麼我想,節目組的事先告知行為,對於最後的結果,是可能產生影響的。
看了節目,現在來評論幾句:
這一次的人機大戰的題目,明顯是機器有太多的優勢。它存在的目的就是來做這件事的。其他,也沒啥說的,對於質疑之前我講的公平的概念是,我解釋一下我所指的是數學的概念。 人和機器都要用相同的 輸入 X 來預測 Y。
假設,環境一樣, 人的結果 = 人腦(X);小度的結果 = Machine(X);這裡X必須是一樣的。從題目的角度來看,如果人類選手有充分的時間,或者可以反覆的觀看錄像,還是很有可能贏得。
但是,區別在於,這個機器模型已經接受了大量的關於解決這個問題的訓練,而這一點上人類是沒有的,所以這一場的比賽機器對人類是具有先天優勢的。人類真正的能力是對小樣本的學習和泛化能力,或者知識的遷移能力(transfre learning),這一點目前機器學習也沒有太好的演算法(one-shot learning 還需要發展),樣本一少,機器模型也直接麻爪( underfitting 或者 overfitting)。當然 如果允許人類選手提前接受人臉識別的訓練的話,也許結果會很不同。或者讓多個擅長人臉識別的人類選手一起來做決定,結果一定會好。
對於人機大戰的第一題不同年齡的人臉識別,我覺得機器優勢很明顯,王峰做的很不錯了,畢竟一個人一生也見不了多少樣本,學習的資源有限;
對於語音的那一題,我的結論是,人類選手太神奇,機器的工作原理我不熟悉,但是它沒有明顯的優勢,主要是樣本和目標都太奇葩了;圖像識別類的問題,機器的優勢很明顯。主要是樣本和訓練的時間都在人類之上。
題外話:機器視覺就是機械智能的第一步。不過別忘了,人工智慧不是人,就目前的技術發展來看,它也無法完全替代人。必須目前機器還是不會讀書 ( Reading ),所以它沒有我們人類意義下的「理解」。這個也是它的目前的局限性。人工智慧的標準定義雖然有很多,但是最最有名的是:圖靈測試! 最強大腦不是人和AI在比賽,不過是人和某個數學模型的較量罷了。
==================================
之下是節目播出前的評論!我的一個師兄推薦我看最強大腦,一直沒有當回事兒,直到聽聞 Andrew Ng 參加了帶著Baidu的研究成果參賽, 我才決定去看看這個節目。首先,我就不提節目里 」六核桃「,」豆瓣醬「 這些讓人哭笑不得的硬廣告和舞檯燈光了,伴隨著一些亂入的電視劇中才有的反轉,實在是看著著急 ~ (人艱不拆,做企業也難, 理解萬歲)。
其次,設計的題目中有些題目不太符合機器學習的應對能力設計,目的就是就是為了好好的PR吧!我個人(樂觀主義)覺得Baidu不至於在這類節目上作弊吧。在說很多題目的設計, 已經是在照顧人類選手了,對機器不公平。不比速度,不比記憶量(這裡特指閱讀理解,或者特徵提取的能力),不比準確率等等;機器的優勢能發揮出來的地方已經被限制了。不信的話,連著比賽一百場試試,把小度和它的雲端計算能力連起來,等等。
(請參考AlphaGo Master 60 不可思議的連勝,你就感受到機器的強大了吧!)對於題目的猜想:
從微博中看,人機雙方是要解決一個圖像識別的題目,公平的話雙方的輸入也應該是一樣的。但水哥看的是真實的場景,而小度還沒有能力像人類一樣去觀察一個場景, 可能是硬體的設計問題(或者其他因素)。所以換成標準的視頻信息(錄像)對於雙方都是公平的。人類無法從別的地方獲得機器無法得到的信息,避免了人類作弊。這個要求如果是真的,我個人覺得一點都不過分。既然是圖像識別,那就讓輸入完全一樣吧!憑什麼人看的是實景,機器看的是錄像,如果小度的解析度不夠,角度沒有跟上調整,如此人類豈不是獲得了更多的細節。(不知道百度的硬體是怎麼構造的,以上純憑經驗猜)
對於百度來說,贏或者不贏,它宣傳自己的目的已經達到了。贏了,皆大歡喜;不贏,為下一次更有經驗的PR做了鋪墊,可以說是修鍊一陣再出山。從宣傳造輿論的角度看,怎麼看都是賺的,還會在乎這個輸贏!!!
對人來說,你牛你就贏,你願意演戲就演戲,你願意爆料就爆料,"主根本不在乎"!
題外話,Baidu對人工智慧的投入很大,在不斷的聚集人才。從科研人員的角度來看, 我是不相信 Andrew Ng 會同意玩"輸了我不服必須改結果"這一套的。太TM沒勁了~~~這麼搞,以後怎麼面對同行。
坐等節目出來,看看到底咋回事!不說規則臨時更改亂七八糟的各種不透明的事,單單就比賽的過程而言,水哥身邊應該有兩台顯示屏,應有無限回看的權利。除了人臉識別還要讓水哥跟電腦比記憶力?開玩樂嗎?
我是最強大腦人機大戰節目錄製的工作人員,想把自己知道的一些真實情況在這裡說說。第一次在知乎回答問題,考慮到自己的身份,所以匿名了,見諒。
首先回答大家最關心的「有沒有黑幕」這個問題,答案是:沒有。
實話說,所謂的「黑幕」曝出的時候我們整個團隊一臉懵逼。各種亂七八糟的截圖、東拼西湊的對話和爆料滿天飛,很多爆料還自相矛盾,搞的我們想解釋都不知道該從何說起,導演組都抓狂了。而且為了澄清質疑,Dr.魏和水哥在昨天節目播出時還做了直播。
本來以為水哥在直播里都說清楚了,水哥粉絲們悲憤的小情緒該發泄的也發泄了,這事兒也該過去了。可今天卻發現這個勢頭一點沒有緩解的意思,說節目有黑幕的人越來越多,我還特別納悶,然後直到今天有同事在朋友圈發了一條消息,我才恍然大悟原來這裡面不光有水哥的粉絲,還有很多其他的因素讓那些謠言發酵,所以我覺得有必要站出來說一下。
1、首先是李威的微博截圖
李威發這條微博原本跟所謂的黑幕沒關係,但這張圖被一些別有用心的人斷章取義的利用,在最強大腦貼吧和微博瘋傳,成了詆毀節目組、詆毀選手的工具。
背後真實的情況是,李威在發微博的時候確實生氣,也確實提前不知道自己要上場。原因是節目組之前溝通了鄭才千來參加第一場挑戰,正式錄製前綵排走台的也是鄭才千(在此說明一下,最強大腦錄製都是需要綵排的,因為要確保各種設備正常)。但綵排的時候鄭才千一個都沒答對,當晚就跟節目組說要退出,我們沒同意,後來現場錄製的時候鄭才千又說自己沒帶眼鏡不能參賽,然後就出現了大家都看到的「撕逼」拱王峰上場的一幕,這個過程持續了將近一個小時。後來鏡頭又給到李威,他凌晨才到,什麼情況都不了解,第一反應可能是覺得被算計了,所以才憤怒。節目組原本的設想確實是提幾個在這個領域比較擅長的選手,然後從中挑出之前溝通過的選手,可是沒料到現場會出現這種情況,說我們和提前串通好了,絕對沒可能。
2、其次是完全無中生有的「黑幕」
第一:節目組故意設置微博話題#王昱珩戰敗#
大家可以去看一下微博上#王昱珩戰敗#這個話題,它在節目播出之前就已經出來了,我不知道這是誰設置的話題,但絕對不是節目組設置的,一來在這場人機大戰中我們很多人私下都希望水哥贏,二來我們沒必要在節目還沒播的時候就炒作這種話題。
看了看這個話題的主持人叫「財趣小億哥」,從昵稱看像是財經領域的,和娛樂領域八竿子打不著,這個人的微博粉絲有6666,但微博內容卻是空的,怎麼看也不像是個正常使用的微博賬號。如果真去炒話題,我們何必找一個這麼詭異的號?
多說一句,還有人說這個話題是百度弄的,我對百度沒啥感覺,但我覺得這個可能性也不大,原因和我們一樣,沒這必要。
第二:節目正式錄製時的規則和綵排不同
「綵排時是現場有人跑(讓選手來判斷),節目錄製時不是現場的人跑,而是看錄像。」
這是最可笑的一個說法,因為我們綵排和錄製現場從來沒出現過「現場有人跑」 這個情節!綵排的時候和錄製的時候,規則都是讓選手通過看一段視頻來做出判斷,水哥參與了綵排,怎麼可能不知道,況且我們錄製場地並不大,根本沒有「跑」的現實條件啊。
第三:綵排的時候水哥都答對了,錄製的時候卻全錯了,背後有貓膩
證據為預告視頻中陶晶瑩發言截圖:「其實綵排的時候,王昱珩的速度是比小度快而且是全對。」
真實的情況還請大家看一下完整的節目預告視頻。視頻中,Dr.魏回應陶晶瑩的話:「王昱珩是一個勇敢的人,他做了一件事情,他要求欄目組把明暗度調低20%,但其實難度增加了不止20%,因為他想贏。」
Dr.魏的話節目現場的觀眾都知道,水哥確實提前讓節目組增大了挑戰難度。水哥在節目播出當晚的直播中也說了,他說「綵排的時候我都對,很有信心。」我猜水哥可能對「將明暗度調低20%」後仍能贏得比賽產生了同樣的自信,而事實上很可能像Dr.魏說的,明暗度降低沒有對機器人產生太大影響,卻讓水哥的挑戰難度提高了不止20%,這也是導致水哥在錄製過程中輸掉比賽的重要原因,所謂背後的「貓膩」 。
第四:水哥比賽時「被迫」將正確答案改錯水哥答題時不同的鏡頭顯示水哥給出的結果不一樣
在這想說明一件事,就是水哥改答案的前後鏡頭其實是在比賽結束後補拍的,補拍的過程現場所有人也都看到了。原因是第一次拍攝時水哥和小度的答題區沒有攝像機跟拍,而水哥在公布答案時說他本來答對了,自己改錯了(關於他為什麼改錯,直播里水哥提到過,簡而言之就是在設置校準項的時候水哥用了非面孔的信息,鬢角和耳朵,這種可變的信息對他造成了錯誤的引導,在兩個答案之間選擇時,選了錯誤答案,卻改掉了正確的)。
節目組認為水哥的糾結可以通過鏡頭展示給觀眾,所以在比賽結束後補拍了這部分鏡頭,這也導致有些數字前後鏡頭對不上的問題,確實是我們的疏忽。
另外,為了避免鏡頭掃過水哥答題板導致答案泄露,水哥這場的雙方答題過程中,現場所有百度的人是被我們請到場外的,結果公布之後才被叫進來。
以上就是簡單的澄清,其實關於「黑幕」的故事版本看到很多,一些無厘頭的也沒必要解釋了,只想說一句:水哥輸了也依然是水哥,最強大腦也沒必要靠黑幕贏收視率。
回過頭來,其實特別想說說有些不分青紅皂白開口大罵的人和背後故意挑事兒的人。
就是這些人不分青紅皂白地在背後拱火、挑事,這件事才會被炒成今天這樣。最強大腦是一個優秀的有情懷的節目,這些夾雜著利益關係的言論是對最強大腦的侮辱,也是對名人堂的侮辱,實在讓人氣憤!
真的假的無所謂。
結果我也不在乎。我只關心水哥什麼時候能夠徹底離開這個節目,過他自己的生活。兩塊板子不太一樣。感覺怪怪的
都在說某度逼水哥現場改答案,看上去似乎一切都能說通了呢:
逼最牛逼的人出來輸給自己就會顯示自己比最牛逼的人更牛逼(嗯有點兒繞)。額。。。不明白這其中的政治意味,作為一名參加了第三期錄製的吃瓜群眾,我不站隊,只是還原一下看到的現場(略微劇透)
當時水哥很淡定,答案很快寫完了,有人說他主動要求提高難度這塊兒我倒是沒注意。
我記得我坐在邊上的位置,那一塊有很大一群人,後來被導演清走了,後來才知道是百度技術團隊的。原因是怕他們從屏幕上看到水哥的答案然後抄答案,公布結果後才把他們放出來。
現場水哥是否提前做對了又故意改錯我不知道。我只知道後面一大段時間在補錄水哥寫正確答案然後擦掉改錯的鏡頭,現場所有人都看到了(當時我還覺得奇怪?這是劇本安排嗎?)。
如果說之前都答對了然後改錯了,你現場對著水哥的那個鏡頭不都錄下來了么,補錄啥呢?還補得那麼刻意。然後後面的畫風就沒在輸贏上了,就在各種水哥你本來都做對了啊你都改錯了,你還是比人工智慧牛逼的只不過意志不夠堅定我們人類還是牛逼。。。(說實話看得我有點尷尬,,畢竟水哥已經是神話了)我理解節目組不想讓觀眾有人類打不過人工智慧的感覺,也不想把自己創造的神拉下神壇。但如果那麼多顧慮,從一開始就不要比就好了呀。何苦來的呢。
補充一句(錄製的時候聽來的八卦),有內部消息說當時節目組要搞人機大戰,候選除了baidu,還有sougou和ali,最後是考慮到技術的成熟度才選了所謂的小度機器人,不知道這個是真是假。。
另外,很多人說是某度贊助惹的禍,我個人覺得,去年某度水逆一整年,幾乎每個月都爆出醜聞,按這種節奏,參加這麼大的電視節目,應該沒有膽量作假吧,這不是給自己挖坑么額,就醬紫。。就是說一下感想。。貌似提到某度會被罵,還是匿了吧說實話理性一點的觀眾更關心比賽後面的規則。比如小度是提前多久對女子天團進行訓練的。用了多少樣本。準確率多少。跨年齡面具識別國際目前準確率是多少。小度是多少。名人堂平均水平是多少。水哥為何改規則。改之前綵排人機勝率如何。小度有沒有對30個嫌疑犯做提前的採集和訓練,等等。這些才是對科普科學有意義的東西。
這節目,科學的東西所剩無幾,剩下的全是爭議和質疑。真正科學信息和數據都被節目組刻意淹沒之後,這就變成了一個純粹的娛樂節目,百度也註定為這場爭議買單。套路就像我是歌手對觀眾表情的刻意放大,非誠勿擾對嘉賓的爭議言行進行放大一樣。既然爭議是你想要的,再出來裝委屈,就是做婊子立牌坊的事了。
圍觀群眾看看熱鬧就好關注幾個前線的信息源吧,會讓你淡定很多。
最後提醒一下不明群眾,水哥輸的是記憶而不是識別。節目組敢讓水哥重複觀看視頻么?有些朋友其實提到了,為什麼聲音識別那一場可以重複聽而水哥不能重複看,其實都是為了讓難度在人機之間達到一個平衡。水哥確實作死降低光照,殊不知光照對機器識別影響遠小於人類。這一次水哥確實輸在驕傲,我相信下次他會諮詢一下業內人士再做決定。
不管真相如何,反正是達到節目預熱的目的了,這周五收視率有保障了。現在壓力都在節目剪輯了。下場的都有可能是輸家,只有開場子的才是贏家。
只有我覺得規則是有偏向性的嗎?
嫌疑人錄像看完之後為什麼不能復看?後來30個嫌疑人為什麼一個一個排隊拍照而不是直接給選手30張照片?名人堂選手也說了,拍太久了!
大神再神也是人類啊,這段時間之後,對錄像的記憶顯然會變得模糊一些。而小度是機器人,可以無限次提取錄像進行比對!
如果要公平,在王昱珩作答時,應該可以不限次數看錄像!我記得前面的人機大戰,Dr魏提出過人類選手應該可以反覆聽,這次為什麼沒有一個人提?
我覺得百度和節目組都不會威逼利誘水哥改答案,更相信水哥不會被收買。但是這個規則,就是不公平!不公平!不公平!我還真沒注意這節目已經第四個年頭了,真快,撕的事兒其實看多了也就這樣,我之前看見各種台上台下的撕也義憤填膺,比如王英豪剛上來被排除在外,林建東臨場怯陣,小四在叨叨魏說話時肆無忌憚的笑等等。但是這一季節目播出我覺得沒意思了,厭倦了,撕來撕去能撕出個啥?所以如果這爆料是真的,那說明人類和人工智慧都極其強大,在2017這個節點上是各有千秋,我個人是歡迎兩者強強聯合,攜手跑步進入共產主義的。而節目組為我們帶來了四年的記憶,水哥也是極力維護風口浪尖的節目組,盡顯大度,兩邊都是很可敬的。
我在說這話的時候,新一代的網友又開始撕了,看著血氣方剛義憤填膺的他們,我感覺像是看到了曾經的自己,挺親切的。
願人類和人工智慧都更好。我覺得最大的問題就是 輸了 但並不是輸的心服口服 而是輸的很憋屈 所以才招黑
這個比賽感覺很像之前水哥協助警方破案 雖然不太清楚當時破案過程水哥拿到的線索是什麼 但整體思路感覺相似
可是比賽的設置非常不公平 一來為什麼錄像不可以回放(如果模擬破案錄像可以反覆看)二來為什麼30個人要出來走秀浪費時間
所以這次比賽一點實際價值都沒有 最有趣的是第二個人是最難的 因為是上帝視角(45度角影像)無數拍照技能帖告訴我們這個角度最能扭曲臉型 而水哥和百度機器人的答案都錯了 正確答案是一枚餅臉男子 但水哥錯選的是另一枚餅臉男子 機器人選的是一枚尖臉男子 差的十遠八遠 所以在最考驗推斷力的一題機器人錯的很可笑
有人可以說這可能是技術人員沒有考慮到這一點 以後還有待改進 但我個人覺得第二題最有實際意義 因為很多攝像頭都在高位都是這個角度的影像 如果本著要機器人造福於民的出發點 這個角度的參數分析不應該是最先考慮到問題嗎 然而機器人在這一題錯的這麼離譜 要他何用
如果你開發一個機器人就是為了戰勝最強大腦賺取噱頭靠撕逼博取關注度 而不著眼於它的實際利用價值 (況且這個關注度多是負面的)講真我要是股東我就自扇耳光罵自己傻X瞎了眼
所以拋開什麼陰謀論 拋開昨晚比賽還沒播完微博水軍就開始刷#王昱珩戰敗 的話題 不講 反正百度贏得 一點都不讓人心服口服
———來自一個試圖保持理性的迷妹話說沒有不透風的牆,錄製現場的所有人誰能保證鐵板一塊?雖然包括我在內很多人對百度某些做法不太滿意,但是不代表百度會在全國公開的大型節目上作假,對百度來說收益和風險太不成比例了。至於最強大腦向來為了節目效果故弄玄虛,這也不是一天了。這件事要麼是炒作,要麼是節目為了效果故弄玄虛。看回答的人裡面有現場的觀眾,說補錄了一段人類選手答對然後又改掉的鏡頭,也就是有可能是結果揭曉人類選手答錯了,然後說我本來答對了結果不太確定改錯了。但是鏡頭沒有捕捉到,所以為了節目效果補錄一下這個過程也是有可能的。
推薦閱讀:
※iPhone X 是現在還是未來?
※如果 2台 alphago 不斷對戰,是否會不斷的強大?
※如何看待人工智慧系統 Libratus 戰勝四位德州撲克頂級選手,獲得最終勝利?
※如何評價 DeepMind 於2016年9月12日公開的 AlphaGo 自戰棋譜及3月人機大戰解說?
※有沒有人工取代機器的例子?