如何評價阿里雲在《我是歌手》賽前預測與最終預測結果不一致？

01-23

註：
阿里雲小Ai是實時預測結果的，賽前（還沒唱歌的時候）概率是黃致列。抽籤後是李玟和張信哲、7個人唱完之後奪冠概率是張信哲。最後3選1的時候，就是預測李玟。
——一個動態的過程去預測場內500人的選擇。事實證明3輪過程都正確，這有什麼好黑的？
————————————————
看微博

4月8日晚上20點，阿里雲微博，預測黃致列冠軍
而4月9日0點，阿里雲再次發微博，說阿里雲AI成功預測李玟為冠軍
我就好奇，阿里巴巴和阿里雲，這樣國內知名的企業，怎麼這麼沒節操呢，而且在微博還刪評論

這個阿里還是圖樣了一點，要是提前去找湖南衛視相關人士看下節目劇本，提前幾周就能100%預測準確

看不下去這些為黑而黑的回答，知乎是個講乾貨的地方，花了點時間回顧了下阿里雲這個小Ai預測歌王的整個過程。

先要搞清楚一點，這個預測是動態的，小Ai每聽完一個歌手的歌都會進行分析預測，在主持人宣布歌王之前，預測系統都是在實時運行的。所以題主提出的「更改」預測結果就是個偽命題，因為小Ai確實一直在改啊。

補充一下預測的定義，統計學的@張路陽給出了很好的解釋：「統計預測是根據過去和現在來估計未來。預測肯定是有偏差的，有效數據越多，趨勢會越明顯。某種程度會對預測準確性提高。所以，如果現在有實時的數據肯定要考慮進去。」如何評價阿里雲在《我是歌手》賽前預測與最終預測結果不一致？ - 張路陽的回答小Ai做的是實時預測，就跟天氣預報一樣，會不斷更新，因為選手的現場發揮會直接影響500大眾評審的判斷，這跟賭博的買定離手不是一回事。

其實只要關注下小Ai在各個環節都發布了什麼，就能知道到底是怎麼回事了。

首先是4月8日20:09，阿里雲官方微博發出了賽前預測（話說這個字體也是有點無力吐槽）。先說下這個預測怎麼來的，據小Ai的負責人介紹，這個排名是基於歌手以往表現、此次歌單、輿論情況等作出的綜合預測。這裡想強調下，如果認為小Ai只是個輿情分析工具，那太低估阿里雲了，為什麼要說人工智慧？智能的地方在於阿里雲這個程序從音樂庫里「學習」200萬首歌，訓練自己對「音頻」和「受歡迎程度」之間的關聯性思維，然後與現場音頻做比對，得出一個分數，這部分才是人工智慧BT的地方。

這個時候我歌的直播還沒有開始（一路的廣告），小Ai在預測中說黃致列的奪冠概率最高。

同時，各大媒體紛紛給出了搶眼的標題《小Ai賽前預測：我是歌手冠軍是黃致列》，不得不說黃致列的粉絲很強大，在直播的幾條微博，就這條轉的最猛。

之後湖南衛視開始了直播，開場白之後，主持人杜海濤和寇乃馨在第二現場介紹起了小Ai，從這裡開始，現場的畫面就跟阿里雲官網實時同步了。這會顯示的是黃致列第一，李玟第二。

然後就開始了殘酷的7進6競演，每位選手唱完，排行榜都會發生變化，直到所有歌手第一輪競演結束。其實這個時候，小Ai的奪冠排序已經出來了，而湖南衛視要用兩兩PK的方式把淘汰的懸念留在最後。

當時，小Ai的預測已經變成這樣的了：張信哲、李玟、黃致列、李克勤、老狼、徐佳瑩、容祖兒。

而湖南衛視實際公布的結果是這樣的：李玟、黃致列、張信哲、老狼、李克勤、徐佳瑩、容祖兒。

這裡大家可以看到，小Ai在排位的名次上只對了最後一個容祖兒，但在排序上，是準確排出了李玟&>黃致列&>李克勤&>徐佳瑩&>容祖兒的順序，張信哲和老狼在排序出現了比較大的偏差。

個人認為，7進6是人工智慧預測起來難度最大的，學過排列組合都知道，7個人排序有5040種方法，也就是說猜對的概率只有1/5040，而後面兩兩PK猜對的概率就高多了，獨立事件就有50%的概率，非獨立事件的話，算上3進1那一輪，小Ai猜對的概率可以達到1/24，這比7進6的概率也高到不知道哪裡去了。

接下來兩兩PK的環節里，每當兩位歌手唱完之後，小Ai就給出了兩者獲勝的概率。

22：59 阿里雲官微稱小Ai預測張信哲將晉級

23:34 小Ai預測黃致列晉級

23:44 小Ai預測李玟晉級

這些預測都是在何炅公布賽果之前發布的。芒果TV的專用機位也有播出

最終這輪預測的結果大家也都看到了，全部正確。

然後就到了第三輪3進1，原本我以為還會有一輪演唱，三位歌手再PK一下，沒想到是直接出結果。

這個時候第二現場的鏡頭對準了小Ai的實時預測，畫面也變成了3個人的概率在動態變化

阿里雲官微沒有發圖，而是用一個現場視頻直播的全過程：秒拍視頻

之後，官微就宣布小Ai成功預測李玟奪冠了

整個過程下來，官微做的只是實時轉述，不存在前後預測結果不一致的問題。

其實問題挺簡單的，根本不複雜。

你們就是有一個好，不管什麼問題，黑的東西點贊最勤。為黑而黑才是知乎范兒么？

今天算是得罪了你們一下。

我不是針對哪一個，我是說在座大部分人，都是在憑主觀情緒在答題，根本沒有看清題主的意思，一個勁的在噴阿里雲ai。

回到問題本身，預測是根據歌手表現實時更新預測結果的，有什麼不對呢？題主沒有弄清楚而已，而大部分人都沒有清楚題主在說什麼。

紙糊藥丸。

這難道不是跟天氣預報差不多根據現實條件不斷改進的？

哪能像賭博一樣，下定離手啊？帶著它去香港買馬吧。

大數據是個筐，什麼都能裝。

——————————————————————————————————

更多文章關注我的專欄數據冰山 - 知乎專欄，更多精彩回答請看何明科的主頁

這下我知道阿里是有AI的了

謝邀。看到這麼多黑的，就沒見到一個復盤的文章，正好看到一篇文章詳細描述了那晚的情景，要了下授權貼給大家。

【說在前面】

其實當晚芒果TV上專門有個人工智慧猜歌王機位，直播了預測的全過程，目前這段節目的錄製視頻還沒有放上來，將來或許會有片段。我看了一小會，就換機位看比賽了。相信應該是有人全程看這個機位的，比如對音樂不感冒的科技媒體（霧..）。

電視上後來沒有出現小Ai的畫面，應該是考慮時間的關係，畢竟宣布歌王的時候已經過了12點，再插入個小Ai，觀眾就不樂意了。

對這個題主這個問題，先說說自己的看法。

首先是題主語文不及格（這個很多回復也說了）阿里雲這幾條微博在文字上沒毛病。

第二個是爭論比較多的賽前預測打臉的問題，這麼說吧，《我是歌手》總決賽是要臨場發揮的，只做一個賽前預測那就是個輿情監測工具，阿里沒這麼傻，把一個搜索分析工具拿出來充當人工智慧。

第三，雖然對人工智慧不了解，但如果說，只給計算機一個演算法，讓它得出一個跟人類情感判斷差不多的結論，這已經不是傳統意義上的計算機了。

第四，黑要拿出黑的樣子，這麼圖樣的問題讓知乎很沒面子啊。

正文精簡下，只保留各環節流程。全文可看：

再聰明的人工智慧也有懵逼的時候看看阿里雲小Ai踩過的坑

一、第一輪排序中結果正確，排序大誤 60分

對照http://ai.aliyun.com上的實時預測和湖南衛視直播，在第一輪的7進6過程中，小Ai預測容祖兒是第七名，而事實上現場500大眾評審確實也是投了容祖兒。所以這一局從結果來看小Ai勝出。

不過，從1-6這個排位卻全都錯誤。這體現在第二輪的兩兩pk中。

按照《我是歌手》的賽制，第一輪7人幫幫唱結束後並不立刻給出排名。而是直接進入到第二輪的捉對廝殺，規則是第三VS第四；第二VS第五，第一VS第六；

最尷尬的場面出現了。因為是預測，小Ai先給出第三與第四，他給的是黃致列與李克勤，這表示他認為黃致列是3，李克勤是4。大眾評審給出的排序是張信哲是3，老狼是4。

氣氛尷尬。

第二組，小Ai認為是李玟（第2）對陣徐佳瑩（第5）。但大眾評審認為黃致列第二，李克勤第五；

場面尷尬。

第三組，小Ai認為張信哲（第一）對陣老狼（第六），而大眾評審認為李玟第一，徐佳瑩第六；

好吧，都錯了。不過還好第七名沒錯。

也就是說，第一輪幫幫唱之後的排序除了容祖兒之外，小Ai和場內500大眾評審沒有達成一致。

無疑，小Ai被啪啪啪打了3次臉。這也是人工智慧團隊最為尷尬的時刻。

這個排序確實很難，據說全部猜中的幾率非常之低。只要有一個排位不正確，分組就會出錯。

但是話說回來，第一輪是為了pk掉最後一名，小Ai也算是完成預測任務了。因為第二輪兩兩pk實際上可以看作是另外一組獨立的任務進程；

二、第二輪兩兩pk全對，100分

如上，第二輪的任務就是剩下的6人分成3組，每組淘汰1人。

小Ai按照真實的對陣分組開始預測，分別是老狼VS張信哲；黃致列VS李克勤；李玟VS徐佳瑩；

這3組pk賽，小Ai幾乎沒有失誤地判斷出張信哲、黃致列、李玟勝出。（可惜了女神徐佳瑩……）

這輪預測100分。

三、第三輪3選1的歌王爭奪，80分

前兩輪下來，現場實際上7人每人唱了2首歌（容祖兒雖然票選淘汰，但加了返場，也就是說每個歌手都是帶著2首歌來的），那麼14首歌過去了。剩下3人是不是再唱一輪？

並沒有，因為節目時間完全不夠了。

所以，這裡的3選1實際上沒有唱歌就開始投票。

小Ai的排序是李玟、黃致列、張信哲。票選結果是李玟、張信哲、黃致列。

從結果來論，小Ai成功預測出歌王，勝；而第二和第三名排序還是沒對，這是不足。（古來老二皆寂寞，唯有第一留其名）

四、幾個有趣的地方

1、賽前的預測（發生在8點），黃致列奪冠概率排名第一，抽籤排演唱順序出來後，黃致列奪冠概率下降到第三名；現場有人調侃，為啥演唱順序那麼重要，「因為7個人不同風格轟炸之後，你都記不得第一個唱了啥。」看過歌唱比賽或者文藝表演比賽的都知道這點。小Ai對於順序這個因子還是有考慮到的。

不過這個賽前預測（黃致列）大火，最終結果卻是李玟，就有很多黃致列的粉絲不依不饒，認為小Ai根本就不準嘛。（這是動態的，只論最後結論。讓你們跟粉絲講道理）

2、黃致列和李克勤的pk賽中，等到黃致列舞蹈出場之後，勝出概率蹭蹭往上走，立刻翻盤。後面脫了外套露出有漏洞的緊身衣之後，又是一陣攀升。這裡估計小Ai的網路評論權重也挺大。舉個例子，湖南廣電大樓外的粉絲當中，黃致列陣營以1敵7。粉絲勇猛無比。

3、幫幫唱中老狼邀約了中國音樂界的半壁江山和3/4搖滾江山。但老哥們幾個發揮很不好，被稱為車禍現場。小Ai給出的勝出概率也滑滑地掉。

ps.這次幫幫唱環節真的是歌手來play的，各種跑調、音不準。咋感覺大家都是來玩一把就死的。（不知道人工智慧怎麼想）第二輪就正常多了。

4、500大眾評審在第一輪幫幫唱和第三輪3選一的TOP3排名略微有變化，從李玟、黃致列、張信哲，變為李玟、張信哲、黃致列；賽中小Ai有3個環節的排序是李玟、張信哲、黃致列（抽籤之後未唱之時，張信哲和李玟有交替浮動）；張信哲、李玟、黃致列以及，李玟、黃致列、張信哲。看得出小Ai的變動幅度比500人要大，是有一定的「思考」修正能力的。

綜合來看，以預測歌王這個目標來看，小Ai是猜對了。以每一輪的賽制任務來看，小Ai也沒有出錯；以每一輪預測結果與場內評審票選結果來對比的話，還是有不少錯誤的。

題主自己截圖的微博自己好好看清楚了好嗎？賽前預測是賽前預測，每輪比賽之後根據網路評價和歌手表現，人工智慧會一直更新預測結果的。阿里雲宣稱預測正確是指每個環節表演之後的預測，按照他所提到的點確實是正確的。『在歌王爭霸環節中，以42%的概率一舉命中李玟拿歌王』。

阿里雲的AI預測過程中其中比較有爭議的是第一輪過後預測的排名，張信哲和老狼，一個預測到了第一，一個到了第六，這兩個的位置錯了以後，把其他正確的順序數字弄亂了，但其他歌手的相對順序是準的。但是因為這個，現場出來第一組三四名跟預測完全不同，讓主持人很尷尬，後來好像就沒有再鏡頭給人工智慧預測。

對於歌手排名結果的預測本質上是一種排序，最重要的是相對之間的順序，而不是每一個的數字。如果你做過連線題或者段落排序題就懂了，選錯一個導致的是一連串的順序錯位。對於排序準確度的理解，我覺得應該考慮相對順序和偏離正確位置的距離。或者說，我們沒有一個演算法或公式，來評價排序結果跟真實結果的接近程度。但是，以我們的經驗和智能，是能夠理解相對順序和偏離距離的價值的。所以，不討論幕後的陰謀論，不討論這個人工智慧預測究竟有沒有跟比賽結果串通甚至控制比賽結果，我認為這次預測的結果還是相當成功的，賽前預測相對於第一輪結果比較，容祖兒正確，其他歌手都是相差1位或2位的誤差，從整體實力偏差來看反應了一定的實力差別了。而第一輪過後，出現錯誤的張信哲偏差-2，老狼偏差2，其他都是因為張信哲或老狼的順序而導致的位移。相對於賽前預測實際上更接近觀眾投票結果。而後面的兩兩PK，以及歌王的預測環節就很容易了，也很輕鬆地預測正確。

本人對阿里沒什麼好感，也不太了解阿里此次的宣傳和微博是否刪評論。只是從結果看，我認為阿里的人工智慧預測有相當的準確度，而且這種預測跨越了很多領域和手段，據說包括現場表演和演唱，風格和表演者影響力等等因素的權重，以及網路的評價，對於項目幕後團隊和預測方式的詳細解讀還是挺有興趣的。至少，在做陰謀論時，對於認真做人工智慧研究工作的成員是一種不尊重。

因為你這樣節(nk)操(dl)滿(ks)滿(ks)的人會喜歡看呀

真是作孽

我昨天看了一段這個節目，其中說到預測結果是5分鐘（應該是5秒，聽錯成5分鐘了）更新一次，所以題主理解錯了。

而且微博的內容說明，以及節目的規則就是多輪制的：

七進六幫唱、六進三兩兩PK、歌王爭霸

根據實際演唱情況來更新預測結果，難道不是很正常嗎？這裡很多回答也有失水準。

另外，根據 @少說廢話L 的評論，這兩條微博的意思可能沒表達清楚.. 容易給人造成是『無節操改預測結果』的誤解。但我相信這個預測不是由人來操作的，還是機器的預測結果.. 現場還有公證員呀..

不知道你想表達什麼，總想搞個大新聞！怎麼就更改預測結果了，4月8日晚上八點的時候預測的是黃致列冠軍，李玟第二，這個預測結果是根據歌手前面幾場比賽表現預測的，晚上八點的時候決賽還沒開始，這個只是賽前預測。賽前預測並不等於最終預測結果。比賽中小Ai還在實時預測，每隔5秒更新一次預測結果。根據歌手所選歌曲，唱功，臨場表現，現場觀眾的情緒反應，微博等網路評論等等要素綜合計算歌手的取勝概率，最終給出預測結果。第一輪七進六比賽中預測了容祖兒淘汰，結果正確。不過七個人的排名好像沒能完全正確，排在最後的是容祖兒，然後被淘汰，這個淘汰預測的結果是正確的。第二輪六進三兩兩PK，這個預測的結果是完全正確的。張信哲PK老狼，黃致列PK李克勤，李玟PK徐佳瑩。最終張信哲，黃致列，李玟勝出。他們三人進入三強。這個時候機器人小Ai直接給出了三個人的排名。李玟第一，勝率42%，黃致列第二，張信哲第三。我以為他們三人還要在PK一把，然後評出一二三。然鵝沒有。這個時候湖南衛視還在統計現場500名大眾評審的投票結果。這個時候快晚上12點了，比賽也接近尾聲了，就等最終結果了。韓紅，韓磊等上季的歌手在這個空擋一起演唱了一曲。大概4月9號凌點4分公布了最終結果，歌王李玟。沒有公布第二和第三。小Ai預測準確。至此比賽結束，該洗洗睡了。

真格不吐槽不行了，在哪呢就人機大戰，強行往上套，臉子都不要了，據說小AI聽了幾百萬首歌（估計為了往大數據上套），也不懂了，機器學習還能學習和提升品位咋地？就算真能聽懂歌好壞了，就能迎合觀眾嗎？阿里這個B裝的真不行

人工智慧都學會說謊了難道你們不覺得可怕嗎？

看來阿里雲還是不智能。

人工智慧，說白了就是人的思維唄。

正常人，明眼人第一期就知道李玟奪冠。但人工智慧竟然還會跑票黃致列。

阿里雲一點也不智能！

好不容易看到一個和專業相關的熱門話題，好激動，可是下面好多答主的回答讓我感覺就是帶著對阿里的不喜歡而不喜歡。

我也只是一個統計學的本科畢業渣。一直不敢回答關於本專業的東西是覺得自己太渣，只學了皮毛。不過這下面回答和好些人的回復我真看不下去了。講的不對之處請指正，順便幫渣渣我學習了。

書不在旁邊，專門百度了一下預測的概念。

對，統計預測是根據過去和現在來估計未來。按我學的統計預測與決策，因為預測肯定是有偏差的，所以，有效數據越多，趨勢會越明顯。某種程度會對預測準確性提高。所以，如果現在有實時的數據肯定要考慮進去。

有人拿這次的比賽和之前的世界盃來比較。私以為不妥。我大三去北京參加比賽，有幸聽了台灣大學統計學教授關於大數據的講座。（時間久了，忘了教授名字，慚愧，當時激動一直在關注我偶像曾五一教授和金勇進教授了）……回歸正題。當時教授就拿世界盃的預測舉例了。百度做的有多細呢，它把每場比賽每個球員的站位變化實時監測，（記得球員的健康狀況也有記錄，時間久了，記不是很清楚）得分情況這些更不用說了。這些統計出來一起做的最後一場的預測。那世界盃是有之前那麼多場比賽的，而且純粹靠實力。而且，大家只看到了最後預測準確了，前幾場它們的預測也不是百分百的準確的。我是歌手這個比賽前面也有一些答主提到了，它和歌手的出場，選曲，表現都有關係，而且觀眾來投票。所以，阿里通過邊比賽邊修正我不覺得有什麼不妥的。

人工智慧什麼的我不懂，我是從統計學角度來看待，個人覺得能做到這樣的程度真心很崇拜的。而且，大數據也是近幾年慢慢被應用的，講真，我那次因為寫論文去百度了一下淘寶雙十一情況，或許是我孤陋寡聞，我覺得國內淘寶把數據分析應用的真是挺棒的。哦哈哈，就和網易雲音樂一樣每天能推送懂自己的歌。是不是扯遠了。

我覺得，大數據很棒，統計人也都在摸索階段，大家給些寬容，剛才看到有人說離微軟差遠了，我蠻心酸滴。我不覺得差太遠。而且，我相信它這個是實時分析和預測的，不存在你們說的什麼陰謀論。

嗯，路漫漫其修遠兮，統計人將上下而求索。

以上。還請補充與指正。

比微軟差了一個銀河系

分頁阅读： 1 2