阿里雲小Ai預測《 我是歌手》總決賽歌王的原理是什麼?
看到新聞,說阿里雲的人工智慧程序小Ai要提前預測《我是歌手》的歌王
阿里雲小Ai挑戰人耳 將預測《我是歌手》冠軍
人工智慧下圍棋好理解,就是窮舉法來決策下一步,但這個歌王預測,考驗的不只是計算能力吧?新聞里看的小Ai是基於神經網路、社會計算、情緒感知等原理工作,這些原理具體是什麼呢?
昨天和朋友一起看《我是歌手》決賽。他一會兒抬頭看電視,一會兒低頭盯著手機。
我瞅了一眼他的手機屏幕,問他:你看啥呢?
原來是一個預測比賽結果的人工智慧系統,在手機端直播,5 秒鐘更新一次預測結果。我這位朋友會關注這個,是因為他曾在 IBM 的人工智慧部門工作。算是行業內人士。話說回來這套預測《我是歌手》的 AI 系統,事實證明:真的很准。人工智慧做預測這事,我以前也有了解,起初特別好奇:這麼神奇!那能不能幫我預測股票是漲還是跌?剛買的股票基金,不僅沒漲還跌了不少啊 /(ㄒoㄒ)/~~
能不能幫我預測個雙色球?我的湯臣一品豪宅就指望人工智慧了啊。後來了解了人工智慧預測的原理,也隨即夢碎——湯臣一品沒有希望了。預測是建立在廣度搜索、處理海量信息、提取多維度數據樣本、建立演算法模型等一系列基礎之上的。就好比天氣預報,是根據大氣運動情況來預測未來時間的天氣情況。而雙色球這種純憑運氣的,就沒法預測了。對比賽冠軍的猜測,是建立在歌手人氣、往期排名、現場音準、社交網路討論情況等海量數據的處理、提取和建模上實現的。如果說工作原理,小 Ai 主要基於神經網路、社會計算(social computing)、情緒感知等原理。並且在參賽之前,背後的團隊又對它進行了大量的學習和訓練。我追著看了幾個視頻,除了音樂預測外,這套 AI 系統已經在實戰中成功實現交通等多個領域的預測。
當然準備工作不僅於此。為了預測歌王,背後團隊除了工程師、科學家外,還有阿里音樂部門多位專業人士參與進來,給這套 AI 「急訓」了海量的歌曲,幫助它建立對音樂的「審美」。
AI 對於「花落誰家」的預測,《我是歌手》並非全球首秀。今年的奧斯卡舉行前,人工智慧公司 Unanimous A.I. 就根據大數據,預測陪跑 22年的小李子將獲得最佳男主角。為什麼 AI 能夠預測《我是歌手》和奧斯卡的獲勝者?這是因為在互聯網大潮下,所有的渠道都可以數據化了,在這種情況下,人工智慧的計算能力和分析能力都遠超普通計算機,一些以前不敢想像的事情都能完成了——比如整合所有平台的數據,並分析出個中趨勢。當然,作為阿里系的一員,小 Ai 在獲得數據上也佔有優勢。同為阿里系的微博和優酷土豆,是娛樂輿情分析的最佳第一手數據採集地。
----如果說 AI 對萬眾矚目的賽事預測,帶有一定的宣傳作用的話,那麼 AI 預測在其他方面的應用,大多是少為人知、但確乎影響深遠的。比如上面提到天氣預報,現在霧霾也是可以預測的,並且這項預測對我們來說越來越重要——明後天要去北京玩?不僅要看看天氣預報,還得看看霧霾預報。再比如預測未來一小時的交通情況,提前做好出行規劃。比如預測水庫水位,預防洪澇。如此 AI 就取代了星探的功能。
二是對情感的分析。就像電影《Her》中說的那樣,未來我們每個人都會有虛擬個人助理,TA 可以根絕你的過往,預測出你的喜好,比如——- 給你建議:今天去哪家新餐廳吃飯,並且你去吃了一定會喜歡;
- 幫你建議:去看哪一場新上映的電影,是最適合你的審美的;
- 你遇到挫折了想找人聊天,TA 一定是最會安慰開解你的。
還要預測?不是李玟我都不信啊
重要的事情先說:
關於阿里雲人工智慧預測《我是歌手》總決賽冠軍,我碼了一篇文章,權當對此事的看法,本文內容並不涉及AI預測的原理,忘大家見諒。
標題:《我是歌手》總決賽居然有第8位嘉賓?
是的,你沒有看錯,是由阿里音樂董事長高曉松隆重推薦的神秘嘉賓。
當大家紛紛猜測哪位歌壇大佬現身為老狼幫唱之時,阿里巴巴卻宣布阿里雲人工智慧程序小Ai現身總決賽舞台,挑戰電視機前的6億隻耳朵,進行歌王預測。
小Ai是誰?
今年5歲的小Ai是阿里雲人工智慧首席科學家閔萬里博士團隊研發出來的人工智慧程序,曾在Sort Benchmark獲得世界排序比賽冠軍,在聽寫PK中打敗全球速記亞軍,是國際AI界一顆傲嬌的新星。
大家明白沒有,人工智慧圈的一位小鮮肉要挑戰國內頂尖音樂賽事的結果預測,它試圖從圍繞7位歌手的信息海洋中找出有價值的線索並賦以權重,再根據某種不為人知的方法把所有線索編織成一幅完整的權重圖,最終的權重排名就是7位歌手決賽成績預測結果。
作為一個天天上下班都會路過湖南廣電「草泥馬」大樓的湖南人,每周五晚上吃著口味蝦邊看《我是歌手》邊和朋友們猜測誰拿第一成了我周末為數不多的興奮事,這次看到阿里雲小Ai出手,我自然也沒忍住要八卦一下。
預測不是算命
預測是一個貫穿人類文明史的命題,自古以來在我天朝盛行已久,從河圖八卦問前程吉凶,到夜觀天象識人間爭端,再到推背圖勘定朝代更迭,沒有最玄只有更玄,那時候的預測基本就是活躍在野史和趣聞里的一本正經地胡說八道。
當然上邊的預測沒有任何科學根據,說得通俗一點就是算命,就像大師盯著你掐指一算,說一聲施主你命里缺顏值一樣。
為什麼有朋友會覺得算命師傅說的很准,那是因為人家擅長冷讀術,當然這個不在今天討論的範圍。
算命先生:朋友,我們算命界從來都是講究自願,沒有說強拉硬拽別人要算一卦的,但是你知道為什麼今天我看到你,我必須要把你按在這,跟你說兩句嗎?唉,你印堂發黑啊。
但不可否認,不管預測還是算命,直到現在都是最抓大眾眼球的新聞頭條,因為預知未來是全人類都翹首以盼的妙事。
可能大夥會忘記2010年世界盃冠軍是誰,但是你們不會忘記那隻預測8場比賽結果都準確的妖孽「章魚保羅」,當然還有2014年巴西世界盃被國人大喊活捉的「烏賊劉」。
預測未來沒有100%的準確率
預測不是信口胡鄒,依據海量數據來進行推測的挑戰非常之大。但凡預測的事情,特別是涉及未來的事情,從來就沒有100%的準確,這是客觀規律。
我們來看看傳統的預測活動:天氣預報。
作為人類史上最大的預測活動,天氣預報除了培養了一大批不靠譜的男人之外(天氣預報員),在預報準確率的貢獻上沒有太大的進步。
目前的天氣預報是通過大氣運動物理方程組來計算並預測未來一定時段的大氣運動狀態和天氣現象,所以24小時短期預報,由於小時間窗口的數據樣本比較穩定,因此準確度較高,而涉及到3-5天的中長期預報,基本就靠運氣了。
而針對強對流天氣的預測,如暴風雨、冰雹、龍捲風這些短時間內的惡劣天氣,預測的準確率低到令人髮指,只有20%。
為什麼天氣預報這麼難?因為天氣系統是一個連續的混沌系統,不像離散模式的圍棋適合利用神經網路和機器學習計算來預測結果,它可能更適用於物理學方程的預測模式。
人工智慧預測靠譜么?
自打穀歌的AlphaGo九段贏了李世石後,人工智慧是否會取代人類就成了科技界的熱點,乃至有些腦洞大開的小夥伴認為當年的妖孽「章魚保羅」其實就是AI在低調顯擺。你在圍棋界捉對廝殺,我在朋友圈杞人憂天,這大概是尷尬癌患者的真情告白。
人工智慧預測不是算命,也不是類似天氣預報的傳統預測行為。它基於神經網路、社會計算和情緒感知來理解人類情感,並通過強大的計算能力和機器學習能力不斷進化來進行預測。
一言以蔽之,人工智慧預測可能是特定場景下最為合適的一類預測模式。
難道人工智慧只活躍在對弈領域,當然不是。
看看正兒八經的人工智慧預測栗子,這可不是掐指一算的大師能搞定的。
AI公司 UnanimousA.I在第88屆奧斯卡頒獎禮前成功預測了小李子獲得小金人,同時還預測對了最佳導演和最佳女主角。
好萊塢也會利用人工智慧來預測電影劇本的票房表現,至今準確率在65%-70%之間。
還有少數跨界人才利用人工智慧來預測股市波動,並自動下單炒股和投資,獲得了可觀的收益。
AlphaGo一身高冷科技范,再輔以圍棋對弈的智商碾壓加成,使得這位新晉圍棋九段幾乎不沾人間的柴火氣,成為AI粉頂禮膜拜高高在上的大神,當然這也拉遠了人工智慧和大眾之間的距離。
正當大家感嘆AlphaGo遙不可及時,阿里雲小Ai突然出現在公眾視野,阿里選擇如此重要的場合,以音樂作為切入點,向世人展示阿里雲小Ai的雄厚實力,這背後的深意值得我們去推敲。
在全國收視率最高的音樂類節目決賽中,跟6億電視聽眾進行預測PK,一方面昭顯人工智慧的無所不能神通廣大,另一方面也預示著人工智慧會在阿里巴巴的商業體系中發揮著不可估量的作用。
關於預測的預測
我個人認為小Ai這次預測的難度相當大,人工智慧在已有規則下(如圍棋)進行深度搜索的算力對決也就算了,這次阿里雲居然要玩無明確規則的廣度搜索,海量的信息碎片加上無法統計完全的影響投票結果因子,多維度的數據樣本提取,演算法模型的建立學習,還要試圖理解我大湖南投票觀眾的喜好,看來只有祝你好運了小Ai。
為什麼難?因為有太多的意外因素會影響最終結果,正如2006年世界盃決賽,當所有人都看好法國隊時,齊達內一記鐵頭功自領紅牌,使得法國隊最終敗北。
所以我想問小Ai之父閔萬里博士,你吃過長沙的口味蛇么?你了解剁椒魚頭為什麼為放兩種辣椒么?你知道老長沙龍蝦館最近一段時間在播放什麼音樂么?為什麼問這些,因為這些因素都有可能影響到現場觀眾的投票,如果小Ai的腦海里沒有這些元素,那預測難度就更高了。
當然還有更多腦洞大開的影響因子:
長沙各大KTV的熱歌排行榜數據有採集么?
直播當晚馬欄山周邊交通擁堵程度與觀眾心情關聯度會納入么?
長沙周五天氣和演唱歌曲的關聯度有做么?
幫唱嘉賓在長沙受歡迎程度和曝光率比較有觀察么?
現場演唱觀眾表情包會做人臉識別么?
耳帝和梁歡的實時點評及粉絲互動數據有抓取么?
黃致列脫衣秀肌肉,李玟跳熱舞,這二者權重各是多少?
從阿里雲小Ai的以往考試成績來看,它是一個十足的學霸,如果在已有經驗的領域進行預測,我覺得準確率可能會很高,但是第一次在音樂領域來做嘗試,不僅要判斷每位歌手的演唱水準,還要實時感知現場觀眾的情感,並且得處理浩如煙海的場外冷數據,我對這個預測也沒譜。
一身榮譽未嘗敗績的阿里雲小Ai是繼續取勝,還是折戟於長沙,看來我只能通過擲硬幣的方式來猜測了。
當然凡事皆有例外,如果阿里雲小Ai預測老狼奪冠,我是100%預測小Ai會贏得最終的勝利,只是不知道著名自拍狂人高曉松會不會提前發自拍照以謝天下。
好了,請原諒一個聽著校園民謠度過年少輕狂時代的80後孩子,在文章里夾帶私貨的行為。
最後我想強調的是,結果怎樣並不重要,重要的是在全球華人最受關注的音樂節目總決賽舞台上,阿里巴巴隆重推出人工智慧的背後意義。
當我們還在感嘆AlplaGo遙不可及的時候,阿里雲小Ai立即和大家來一次親密接觸,這會帶來怎樣的蝴蝶效應,我們拭目以待。
小Ai預測直播地址,請掃碼圍觀:
@余茨 @yuciduo「好萊塢也會利用人工智慧來預測電影劇本的票房表現,至今準確率在65%-70%之間。」請問,這個系統具體是什麼,如何真有65%以上的準確率,《異星戰場》那種幾億美元的賠錢貨是怎麼出來的?「還有少數跨界人才利用人工智慧來預測股市波動,並自動下單炒股和投資,獲得了可觀的收益。」指的是高頻交易吧,這種交易方式主要是為買家、賣家提供買入、賣出的機會,意思是他只是比你手快,但並不能預測股市走向,
下面回答你的兩個問題:一,關於票房預測基於AI的電影票房預測是以色列VAULT公司的產品,我在另一個問題下也回復過關於以色列的信息安全領域的某個話題,你可以搜一下,以色列在IT領域為什麼如此牛逼哄哄。VAULT將1980年至今的所有 hollywood電影進行分析,抓取出每部電影劇本的票房影響因子,然後建立模型對新發行電影票房進行預測,這家公司的官網有詳細的預測記錄,你可以看一下,有成功有失敗,最終準確率統計在65%-70%之間。PREDICTIONS - VAULT另外該公司從2015年開始預測,至今只有2015年和2016年的預測記錄,你說的《異星戰場》是2012年的作品,自然不能怪這家公司,當然也得感謝這部電影的失敗,為預測模型提供了諸多的修正因子。關於票房預測的新聞出處,你可以參考一下:This startup uses artificial intelligence to predict whether a Hollywood film will be a hit or a flop a€」 just by scanning the script二,關於股市預測AI應用於投資市場當然不是你想的高頻交易那麼簡單,這裡的股市預測是指應用於量化投資領域。量化投資跟高頻交易是兩個不同的概念,量化投資一般依賴於複雜的模型,而高頻交易一般依賴於運行高效的代碼。
量化投資公司的持倉時間往往達到1—2個星期,要預測這麼長時間的價格趨勢需要處理的信息自然非常龐大,模型也因此更為複雜,對程序的運行速度反而沒那麼敏感。
高頻交易處理信息的時間極短(微秒或毫秒級),不可能分析很多的信息,因此模型也趨於簡單,競爭優勢更多依靠代碼運行的效率,很多人甚至直接在硬體上寫程序。
而最後,量化投資的資金容量可達幾百億美元,而高頻交易公司往往只有幾千萬至幾億美元,在量化投資領域有團隊利用AI建立的模型是經過驗證十分成功的,不知道這麼解釋你是否滿意?
窮舉法?谷歌用的不是窮舉法吧?
我對其預測原理也很感興趣,但是由於不是研究人工智慧的科班出身,並且官方對小AI此次預測並沒有公布其原理,所以以下的一切僅僅是一個業餘愛好者的個人猜測。
阿里雲小Ai本季歌王預測回顧:
4月6日下午,小Ai對外預測,黃致列將是競演歌手中潛力最大的一位。
4月8日19:50分,500位大眾聽審進入演播廳後,小Ai對外預測,黃致列極有可能贏得勝利。
22:00點,首輪競演結束後,小Ai做出調整(小Ai根據歌手現場表現,每隔5秒更新一次奪冠概率),張信哲排在其預測排名第一位。
23:30分,末輪競演結束後,小Ai給出預測結果,李玟將成為本季歌王。
4月9日0:05分,湖南衛視揭曉,最終李玟問鼎。
一,首先大家需要先了解一個定義,什麼是人工智慧?
人工智慧(英語:Artificial
Intelligence, AI)亦稱機器智能,所以阿里雲的小Ai名字的意思就是「人工智慧」。人工智慧是指由人工製造出來的系統所表現出來的智能。通常人工智慧是指通過普通電腦實現的智能。該詞同時也指研究這樣的智能系統是否能夠實現,以及如何實現的科學領域。
人工智慧的研究是高度技術性和專業的,各分支領域都是深入且各不相通的,因而涉及範圍極廣(不光能研究圍棋,還能研究情感演算法)。
人工智慧的研究可以分為幾個技術問題。其分支領域主要集中在解決具體問題,其中之一是,如何使用各種不同的工具完成特定的應用程序。AI的核心問題包括推理,知識,規劃,學習,交流,感知,移動和操作物體的能力等。
人工智慧又分為強人工智慧和弱人工智慧:
強人工智慧觀點認為有可能製造出真正能推理和解決問題的智能機器,並且,這樣的機器能將被認為是有知覺的,有自我意識的。強人工智慧可以有兩類:
- 類人的人工智慧,即機器的思考和推理就像人的思維一樣。
- 非類人的人工智慧,即機器產生了和人完全不一樣的知覺和意識,使用和人完全不一樣的推理方式。
弱人工智慧觀點認為不可能製造出能真正的推理和解決問題的智能機器,這些機器只不過看起來像是智能的,但是並不真正擁有智能,也不會有自主意識。
強人工智慧目前仍然是該領域的長遠目標。目前比較流行的方法包括統計方法,計算智能和傳統意義的AI。目前有大量的工具應用了人工智慧,其中包括搜索和數學優化、邏輯推演。而基於仿生學、認知心理學以及基於概率論和經濟學的演算法等等也在逐步探索當中。
二,研究出小Ai的閔萬里博士是什麼樣的人?
14歲被中科大少年班錄取,19歲畢業後赴美攻讀物理學碩士,2004年獲得芝加哥大學統計學博士學位。他還先後在IBM Watson研究院及Google 擔任研究員,2013年時加入阿里巴巴,領導阿里雲人工智慧項目小Ai。
閔萬里最擅長就是建立模型——他長期從事機器學習理論研究與應用演算法研發,在腦電波(EEG)解析、高維數據挖掘、隨機過程理論、時間序列分析、網路流理論等領域獲得過多項國際專利。2011年發表的道路交通流預測研究,是該領域全球五年來被引用次數最多的論文之一,曾推動紐約、新加坡、瑞典等地的智慧城市創新。
所以,當這些「人工智慧」方面的經驗應用到小Ai身上的時候,幾乎可以說是得心應手,這裡還有一個很有意思的小故事,當時獵頭找閔博士的時候第一句話:
中國有家公司的數據量比亞馬遜+eBay+PayPal還多,如果真的想做大數據,想做人工智慧,還是要在中國。
這句話對於一個科研工作者來說,吸引力無疑是巨大的。
閔博士本尊
三,小AI此次成功預測的原理的猜測。
(1)小AI之前其實就表現不凡,有相關的實戰經驗,積累了足夠多的數據和演算法。
在參加《我是歌手》比賽之前,小Ai已經積累了不少實戰經驗,比如在Sort Benchmark上獲得世界排序比賽冠軍,聽寫能力打敗全球速記亞軍,幫助交通部門預測未來道路擁堵情況,幫助光伏電廠預估發電產能減少能耗,幫助水利監管部門預測水庫水位以預防災害發生、幫助金融機構的客服人員接電話、幫助阿里音樂預測音樂黑馬等等,可以說小Ai已身經百戰。
這裡說一下預測交通擁堵的原理:
結合城市道路公開的歷史車速、實時車速、路網關係等數據,通過開發的路況預測模型,就可預測未來一個小時內的道路擁堵情況。
該模型能夠定量描述上下游路段之間的車速關聯性,通俗來說,就是通過周邊路段車速來推演未來車速的演變趨勢。
此前,小Ai已經成功預測多省市的路況了,據閔博士說,預測成功率高達99%。
通過以上的原理,試想一下如何預測歌手未來的潛力?
首先將各大音樂平台上的音樂進行數據化;
其次,抽取出特徵值;
最後再與用戶行為與社交網路數據、新聞資訊等數據進行有機關聯,就可以預測哪些音樂人會成為下一個巨星。
怎麼樣,是不是有點明白了?
(2)增加音樂鑒賞領域相關的數據和演算法。
此次預測演唱比賽,難度確實高於之前的幾個量級,為了解開這種充滿不確定性的謎題,小Ai團隊請了多位阿里音樂和專業人士作為教練,「海補」了幾百萬首歌提升音樂品味和鑒賞能力。比如基於阿里音樂資料庫,自動學習音頻的重要特徵,在最後形成對歌曲的多維度評價,例如音高、能量、語譜、基頻等特徵維度,不斷訓練小Ai對音頻及受歡迎程度之間的關聯性思維,小Ai的學習速度是人類的1萬倍,人類需要10萬小時成為某一領域的專家,小Ai只需要10小時就使小AI迅速成為音樂鑒賞專家。
(3)輸入前幾季賽事的資料數據,建立演算法模型,尋找變數因子。
小Ai從歷史賽事和海量資料中尋找影響比賽結果的變數因子,訓練出一個實時動態模型進行預測,比如歌曲、歌手、粉絲、現場氛圍、網友討論等維度,每種維度都通過機器學習提取海量特徵。這些特徵有的是靜態的,有的跟隨比賽不斷變化,需要小Ai現場實時計算,最終給出預測排名。
(4)搜集每個歌手的資料,形成標籤。
在計算機程序眼裡,一個人其實就是個標籤的集合,放在這裡,歌手其實是無數標籤的集合,比如李玟:女歌手、70後、華裔、美國、偶像、性感、奧斯卡、RB、Soul、粉絲量等等。
(5)高頻次的刷新,計算數據結果。
小Ai沒隔5秒就會重新計算一次結果,所以可以儘可能的一點一點的提高準確率。通過洞察一切可能影響投票結果的因子,即便他們是似是而非的信息碎片,但因為數量無限大,通過人工智慧的演算法仍然可以推斷出一個結論。整個過程是在全空間的、連續的、動態的場中尋找真相,擅長廣度上的數據組織和推演,「是在理解人類的喜好」,「洞察人類的思考」。
影響評委喜好的因素非常多,小Ai需要找到這些影響因素的每一個信息變數,比如和歌手演唱相關的曲風、流派、編曲、幫唱嘉賓、舞蹈、歌手顏值等現場的熱數據,以及浩如煙海的場外冷數據信息,這些數據每秒都在變化,所以不停的實時更新數據更能提高預測的準確率。
最後,小Ai還預測了未來一年的星途潛力榜:黃致列、老狼、徐佳瑩,名列一、二、三名,這個,咱們拭目以待吧。
據阿里雲科學家團隊透露:小Ai在4月1日《我是歌手》突圍賽進行了實戰預測,並成功預測10進3中前2位歌手——容祖兒和張信哲。第3名與第4名預測分數非常接近,而未能成功;第6、7、8名的預測和投票結果完全吻合。
《我是歌手》總決賽當晚,小Ai將每隔5秒更新一次7位歌手的奪冠概率。重要預測節點將有三次:分別在比賽開始前、第一輪幫幫唱結束後以及第二輪兩兩演唱結束後,最終以是否預測出現場500大眾評委選出的歌王來衡量勝負。
這個事件引起了我的興趣,既然問到阿里雲小Ai預測《我是歌手》總決賽歌王的原理是什麼,那我就姑且嘗試回答,以拋磚引玉。以下是我對原理的理解:
①預測建模
要知道阿里雲小AI預測《我是歌手》總決賽歌王的原理。首先我們引入一個概念:預測建模。
預測建模是建立一個能夠進行預測的模型的通用概念。通常情況下,這樣的模型包括一個機器學習演算法,以便從訓練數據集中學習某些屬性做出這些預測。
預測建模可以進一步分成兩個子集:回歸和模式分類。回歸模型基於變數和趨勢之間的關係的分析,以便做出關於連續變數的預測,如天氣預報的最高溫度的預測。
與回歸模型不同,模式分類的任務是分配離散的類標籤到特定的observation作為預測的結果。回到上面的例子:在天氣預報中的模式分類任務可能是一個晴天、雨天或雪天的預測。
因為歌王預測主要是對離散變數的預測,所以阿里雲小AI預測《我是歌手》總決賽歌王屬於後者——「模式分類」:分配預先定義的類標籤到特定實例將它們分成不同的類別的一般方法。「實例」是「observation」或「樣本」的同義詞,描述由一個或多個特徵(或稱為「屬性」)組成的「對象」。
所以,在小AI眼裡,歌手其實是無數標籤的集合,比如李玟:女歌手、70後、華裔、美國、偶像、性感、奧斯卡、RB、Soul、粉絲量等等。
比如張信哲:男歌手、60後(我也是今天才知道男神的真實年齡的)、國產歌手、情歌王子、傷感抒情等等。
這些標籤都是建模的影響因子。
②影響因子
那麼預測建模的一般流程是什麼呢?
分析影響因子及其權重→建立預模型→根據修正因子訓練矯正→模型→預測。
小Ai這次預測的難度相當大,是因為歌王預測是7人混戰,充滿不確定性,海量的信息碎片加上無法統計完全的影響投票結果因子,多維度的數據樣本提取,演算法模型的建立學習,是對理智和情感的複雜考驗。這也是建模預測的主要難點。
歌王預測是無明確規則的廣度搜索,廣度優先搜索是一種盲目搜尋法,目的是系統地展開並檢查圖中的所有節點,以找尋結果。換句話說,它並不考慮結果的可能位址,徹底地搜索整張圖,直到找到結果為止。BFS並不使用經驗法則演算法。
小Ai要做的是去通過洞察一切可能影響投票結果的因子,即便他們是似是而非的信息碎片,但因為數量無限大,通過人工智慧的演算法仍然可以推斷出一個結論。整個過程是在全空間的、連續的、動態的場中尋找真相,擅長廣度上的數據組織和推演,「是在理解人類的喜好」,「洞察人類的思考」。
結果將被很多因素影響,所以影響因子必須要考慮的全面和詳盡。比如:和歌手演唱相關的曲風、流派、編曲、幫唱嘉賓、舞蹈、歌手顏值等現場的熱數據,以及浩如煙海的場外冷數據信息。小Ai需要找到這些影響因素的每一個信息變數。
據介紹,目前小Ai已經進行了大量的學習和訓練,除了工程師、科學家之外,還有多位阿里音樂和專業人士作為教練,「海補」了幾百萬首歌提升音樂品味和鑒賞能力。
當然還有更多容易被忽略卻不能忽略的影響因子:
幫唱嘉賓的人氣是否應該納入考慮?權重多少?
水軍造成的虛假人氣輿論繁榮如何排查、計算影響?
男明星秀肌肉,女明星跳熱舞,這二者權重各是多少?
然而預測天然帶有不確定性,無論怎樣詳盡周全的考慮了影響因子,人工智慧也不一定能達到歌曲好壞的判斷。比如說,有人覺得左小祖咒的嗓音好聽,有人完全不能忍。有的歌曲能勾起回憶,某代人對其有特殊的情感。這些都是沒有辦法用一個標準去評價好壞的。
這就是預測的不確定性。
③訓練矯正
希望大家釐清一個概念,Ai預測不是以次為單位的,而是有準確率的,並且準確率肯定會不斷提升。
阿里雲小Ai主要基於神經網路、社會計算(social computing)、情緒感知等原理工作。此前,小Ai已經進行了大量的學習和訓練,並在實戰中成功實現交通、音樂黑馬等多個領域的預測。
而歌王預測是音樂領域的新嘗試。就算失敗了,也沒有關係,失敗可以為預測模型提供諸多的修正因子。反而成功的預測並不能幫助預模型修正和進步。
所以我很贊成高曉松的觀點。他說,如果小Ai預測准了給它鼓掌,如果預測不準也沒關係,「小Ai會繼續學習,總有一天會超過我們。」也就是說,預測結果其實並沒那麼重要,這次亮相《我歌4》總決賽,已經成功的把阿里巴巴人工智慧科普給湖南衛視6億觀眾了,稱得上是「絕佳機會」。
(你說的很對,曉松老師,可是別發自拍了好嗎?)
④啟示意義
阿里雲小Ai預測歌王與谷歌AlphaGo下圍棋相比,是人工智慧在另一個領域(音樂和賽事)的全新嘗試。
(圖片引用自「科技蟹」)
此前,我們已經說過,人類需要10萬小時成為某一領域的專家,但小Ai只需要10小時。所以說,相比傳統的觀眾或專業評委,加入小AI這樣的人工智慧作為變數後,對音樂綜藝而言,似乎可以引領一個新的變革。
用「小Ai之父」閔萬里的話說,小Ai挑戰歌王預測,是人工智慧在音樂和賽事領域的全新嘗試。如果打開腦洞,音樂競技類節目尚可嘗試「人工智慧」,對於具備強遊戲元素的其他類型綜藝而言,玩法可以更多。以浙江衛視懸疑音樂推理節目《誰是大歌神》為例,節目每期會邀請一位大牌歌神與幾位模仿者共同演繹經典,明星猜評團需要通過聲音尋找隱藏在其中的大歌神。如果有效利用「人工智慧」參與猜評,在「人機大戰」之外設計獎懲環節,也能增加不少看點。
不僅如此,對網路綜藝節目愛奇藝《偶滴個神吶》等節目而言,節目本身玩的是從多位真假實力唱將混編的選手中,憑歌曲表演等環節選出一位真正的「實力者」。根據選手本人說話的聲音,現場放出來的歌聲,判斷是否為同一個人,可能明星猜評團做不到,但對人工智慧而言,確是「小菜一碟」。而且,在節目製作思路和緯度上,創造空間也更加開放、自由。
當然,除了簡單的綜藝節目,小Ai的各個模塊都已經積累了實戰經驗,比如在Sort Benchmark上獲得世界排序比賽冠軍,聽寫能力打敗全球速記亞軍,幫助交通部門預測未來道路擁堵情況,幫助光伏電廠預估發電產能減少能耗,幫助水利監管部門預測水庫水位以預防災害發生、幫助金融機構的客服人員接電話、幫助阿里音樂預測音樂黑馬等等,切入「娛樂圈」或我們的日常生活,小Ai身經百戰,且潛力巨大。
總之,很看好阿里雲小Ai的此次嘗試,AI未來也會在我們的生活中發揮更大的作用,作用於更多的領域。
我個人最期待的是,小Ai能給我下期的雙色球號碼!(微笑)
其實我不知道大家有沒有在關注這件事情,我是全程看直播的,所以我對於新聞上面說小Ai預測正確是嗤之以鼻的。
我們分為四部份來探討,賽前、幫幫唱、6進3、歌王
一.賽前當時,小AI很高調的預估黃致列是冠軍。這個在阿里雲的微博上還能找到。當時的順序是:黃致列、李玟/李克勤、張信哲、徐佳瑩、老狼、容祖兒二.幫幫唱
在幫幫唱環節結束後,小AI預估第3與第4名是黃致列與李克勤,但是實際上是張信哲與老狼。第2第5我沒看到(因為你們不給看了)。但是小Ai還有個黑幕,他只會公布當前的順序,也就是說有可能一開始的排名是完全錯誤的。修正完2345這四個之後就只剩下徐佳瑩、李玟、容祖兒,徐李兩人的幫幫唱都是大咖,唯獨容不是,那難道不會是容祖兒淘汰的幾率高些嗎?(歷屆確實跟幫幫唱的身份有些關係,例如上屆的韓紅...)三.六進三
這個應該只要是正常人都能預估到,畢竟都是有人氣差距的。老狼的人氣不如張信哲;李克勤的人氣不如黃致列;徐佳瑩的人氣不如李玟。畢竟都沒有大失誤,這時候人氣就是關鍵。四.歌王
歌王我有點忘記分數,小Ai預估印象中是李玟超30%,黃致列第二,張信哲第三。結果呢?李玟拿了超過一半,而且黃致列是第三,張信哲是第二。在這樣的事實下你說你準確預估?我想大多數人絕對不會相信的昨天看到阿里雲要預測歌王,當時就蒙逼了!這種充滿內幕交易,娛樂至上的綜藝娛樂節目,明顯都是人為操控的結果。看著台下那一個個演技驚艷的表情帝,如痴如醉的欣賞著音樂,不難想像阿里雲那個人工智慧獲取到的都是些什麼樣的不靠譜的大數據!舉個很簡單的栗子,如果啊里AI是通過捕捉現場觀眾情感情緒做為數據參考分析,那這個部分就很容易操控了。只需要安排多些表情帝,鼓掌要比其他參賽選手熱烈些,喊叫聲更大些就好了。再換個角度,阿里AI一定會在網路上檢索每個參賽者各方面相關信息,比如獲獎次數,花邊新聞,出專輯數,粉絲論壇,業界影響力甚至收益支出消費習慣等等綜合數據。既然是這樣,那也不難。請專業的水軍出動,扮成粉絲,發布大量參賽者正面的各種信息,包括這次預測會奪冠信息,想測不準都難!對於我來說,娛樂節目都只是為了節目效果,博眼球,爭收視率,難免會有摻假,只是多少而已!特別是放到檯面上的比賽,都是缺乏公正性的!只能說這次阿里做的廣告不錯,這下又能刷爆各大網站上個頭條了
整個直播過程真是大寫的尷尬…從第二階段預測3、4名,小ai預測和實際結果不同之後,2、5和1、6宣布前雖然鏡頭切去了杜海濤寇乃馨阿里雲小AI這裡,但啥都沒說打個馬虎眼又切回了尷尬的何炅。 相信這時啟動了應急預案處理這一狀況。 整個直播過程給人感覺阿里雲的作用和何炅手上那瓶水差不多只是廣告,而且整體安排從外人來看滿是疑點。500個評審打完分了才顯示「預測」,無法不讓觀者生疑,公正人員公正的是場內500票,而不是阿里雲小AI。 之前給奧斯卡做預測的Unanimous A.I,一半的獎項都錯了,小AI也不可能避免。從廣告角度來說不允許失敗被人看笑話,這可以理解。但看客們(至少是我們這些做IT的人)更不希望被欺騙。 算了,這就是場秀,何必認真,洗洗睡了…明天起床肯定會看到一堆軟文…
@孫維,信息安全從業者(公眾號:sunw3i)「好萊塢也會利用人工智慧來預測電影劇本的票房表現,至今準確率在65%-70%之間。」請問,這個系統具體是什麼,如何真有65%以上的準確率,《異星戰場》那種幾億美元的賠錢貨是怎麼出來的?
「還有少數跨界人才利用人工智慧來預測股市波動,並自動下單炒股和投資,獲得了可觀的收益。」指的是高頻交易吧,這種交易方式主要是為買家、賣家提供買入、賣出的機會,意思是他只是比你手快,但並不能預測股市走向,
音樂評分我信,可以利用音樂的內容和音樂下載量進行相關性分析,從而training 出有一定正確率的結果。冠軍?抱歉這種比賽沒多少,冠軍沒幾個,所含有的因子不透明,每個比賽不一樣....大量比賽被操控,實際數據不可得。機器學習需要大量【正確】的樣本來做這種「預測」。在這件事件中,200W音樂和獲勝這兩個信息相干性弱的不行(沒有多少相干性吧).....行內人一看就是在裝逼。你告訴我上屆是奧巴馬,讓我用這個數據機器學習預測下屆是誰?你咋不上天咯!
這種都內定結果的比賽,有什麼好預測的。。。況且阿里和芒果的關係不一般啊
做這個預測絕對是吃力不討好的事:要是預測准了,肯定會被說是黑幕;要是預測不準,又會被說水平太low。之所以做這個預測,可能主要還是為了宣傳小Ai博眼球吧。相比這個預測,小Ai做過的其他一些事情,比如路況預測、橋樑診斷等等,技術含量更高實用性更強,但是新聞性肯定沒這麼強了
幾個答案都很好。但是題目中有錯。"人工智慧下圍棋好理解,就是窮舉法來決策下一步" 下圍棋用的不是窮舉法。
能在去年預測出孫楠退賽嗎
利用大數據預測不稀奇,挑戰在於現場實時數據如何收集如何計算,這比美國總統大選、奧斯卡預測難多了。開個腦洞:如果機器人可以收集決賽現場評審的每一個表情,一顰一笑,甚至xxx歌手脫了衣服,xxx幫唱嘉賓摔了一交,都能成為機器判定的影響因子,那這個技術就NB大發了。