搜狗參加《一站到底》的機器人牛嗎,和 AlphaGo 下圍棋哪個更厲害?
……
作為國內AI從業者,其實並不想在這個階段打擊同行。但是這麼多大V睜著眼睛說瞎話,就這種段位人工智慧,各種「最」的帽子往它頭上扣,我也是實在看不下去了。不往死里砸,隨便說3點。
1,戰前的寒暄是假的。
機器判斷人類的意圖時,停頓點為一句話的結束。每句話結束,語音就翻譯成文本,然後對文本語意進行判斷,然後召回答案。也就是說,
只要主持人沒停頓,它就不能開始判斷意圖(決賽時題不念完不能搶答,很明顯。)同時,只要主持人有停頓,機器人都必須有回復。否則就是丟包。而男女主持人有多次,多停頓長句,甚至是男女主持人交替對話,機器人均跳過了回復。
這種多輪交互,技術上還沒有可行性的理論方案。2,那個比賽場景下,對NLP幾乎無挑戰。
自然語言處理的挑戰不是聽懂標準問題,而是難以理解語意不明導致過召回和漏召回。
決賽期間,
主持人幾乎所有問題都是標準提問方式,明確關鍵詞、簡單從句、語意清晰無分歧的問句。同時答案也是無分歧的唯一答案。應用場景也單一,完全的通用信息,無任何閑聊或需求場景的干擾。這種難度下的NLP,在對話型機器人裡面,也就是入門級。就跟物理實驗里的超級滑塊一樣,是純實驗中才會出現的理想場景。3,搜狗NLP用的不是深度學習技術。
對話型機器人對語句的理解,是無法通過純演算法來實現的。高級一點的技術,通過海量數據對提問方式進行深度學習來實現,二流技術是通過在整句中抓取關鍵詞來實現的,
百度為了收集自然語言整句輸入的數據,在【手機百度】下方開了個強語音入口。
而搜狗輸入法是片語式輸入數據,搜狗搜索是關鍵詞式輸入數據。在搜狗全系產品中,我沒有找到他們能對自然語言數據有積累的場景。所以他們要麼是通過基本的抓取關鍵詞來實現答題,
要麼就直接記錄了題庫,那就完全是作弊了。總之:這玩意娛樂一下,騙騙外行人就得了,別再最好最牛最高級什麼的,內行人看著老難受了。作為第一期全新改版的《一站到底》的嘉賓,我想分享一些我與機器人對戰的經歷。之前對人工智慧沒有太多了解,但汪仔的出現讓我認識到搜狗機器人不僅有海量的知識,也有獨一無二的個性。第一眼見到可愛的汪仔,我沒克制住心裡的喜悅,跟它說姐姐很喜歡它。誰知它對我說的第一句話就是「美女姐姐,節目錄完跟汪仔走吧」。當時嚇我一跳,心想,我居然被一隻狗給撩了。它看著我和曉敏姐姐的時候,眼睛裡還冒著心。面對這個呆萌可愛,情商智商雙高的機器人,我好想忘了比賽還沒結束。
參加《一站到底》的初心就是希望離開舒適區,在一個充滿知識和正能量的舞台上挑戰自己。能夠和其他優秀的嘉賓切磋並且站到最後已經非常榮幸和幸運。對於最後的人機大戰,我抱著平常心,全身心的享受和汪仔PK的過程。開始答題前,我和護航員們互相加油鼓勵。由於頭天晚上只睡了兩小時,我在台上的表現特別亢奮。汪仔看著我特別man的說了一號戰隊的口號,突然冒出一句「美女姐姐好猛,旺仔差點嚇得一屁股坐到地上。」我再一次被他驚人的語錄給折服了。
比賽開始,前面三題,當我還在我的記憶庫中搜索關鍵詞的時候,汪仔立馬說出了答案。不過還好,我迅速的找到節奏,幸運的搶答了三題。
答對的三題:
1. 正史《三國志》中,草船借劍是哪位將領的事迹? 答案:孫權
這道題答對要特別感謝我的爺爺。作為高中歷史老師,他經常會和我分享一些歷史典故,包括正史《三國志》和《三國演義》中」草船借箭「的故事。
2. 我國第一隻水彩顏料是由哪家知名企業產生?答案:馬利畫材
小學上美術課,美術顏料都印著「Marie』s」的logo。能夠及時喚起童年的記憶很僥倖。
3. 」浸鴨子一月任食,煮而食之,酒食具用「說是哪種食物?答案:鹹鴨蛋
作為金牛,我對吃特別感興趣。回到中國,朋友們經常帶我品嘗各種美食。有一次正好聊到地方早餐,所以記住了泰安煎餅和東平鹹鴨蛋。
回看比賽,我發現汪仔每次都是等完整的問題問完之後才作答,因此給了我搶答的機會。其實PK過程中還有一道題我是知道答案的。為了學習中文,每年我都會讓爺爺從中國給我寄語文課本,所以讀過白居易的《長恨歌》。當時「六宮粉黛無顏色」已在嘴巴,但很遺憾,嘴巴沒有腦袋動得快,沒能搶答成功。想要戰勝汪仔,必須有超強的情緒控制能力,否則即便知道答案,也會因為情緒波動所造成的影響而不能及時搶答。其他沒有做答的題目大多數涉及到中國現代文學和電視劇。對於從小在國外長大的我來說,這方面的知識會比較缺乏。
這次對戰不僅讓我見識到機器人廣泛的知識庫,更讓我對人工智慧產生新的好奇。說實話,那道正史《三國志》的題目汪仔回答」諸葛亮「讓我很意外。或許機器人在接受和處理信息的同時也會遺落關鍵詞,比如「正史」。比賽中的問題基本輸入搜索引擎就可以得到答案,屬於常識領域範圍。我很好奇如果題目一旦包含很多重要細節或涉及複雜推理,人工智慧將會如何應對。
雖然人機大戰最後機器人獲勝,但是汪仔的答題精準度和速度是對人類智慧最好的證明。
「最強的人工智慧」?
2011年IBM搞出來的Watson是被搜狗買下來拆了嗎?
2011年,沃森參加綜藝節目《危險邊緣》來測試它的能力,這是該節目有史以來第一次人與機器對決。
2月14日至16日廣播的3集節目中,沃森在前兩輪中與對手打平,而在最後一集里,沃森打敗了最高獎金得主布拉德·魯特爾和連勝紀錄保持者肯·詹寧斯。
就像這樣?(左「汪仔」,右「Watson」)
從一個參與者的角度來說說搜狗汪仔
先來說說作者背景,各大百科可能都能看到,一站到底歷史上第一個沒有使用免答權通關全場、綽號答題哥斯拉怪獸、搜狗汪仔答題機器人第一陪練、站神——徐聖明。哈哈哈哈哈,原諒我的臭屁,不過說實話,這個牛我可以吹一輩子,可以吹給兒子孫子曾孫子,你爺爺我小的時候,站在科技的前線,參與了人工智慧!
去年的8月,收到一站到底和搜狗的邀請,去做一個答題機器人的測試,當時阿爾法狗剛剛火起來,人工智慧的概念剛剛進入到大眾的視野。臨行之前我問老趙,也就是一站到底的主編,到底搜狗做了個什麼機器人,厲害嗎?老趙說:「我也不知道,你去正好看看。還有一點,搜狗的人要的是『最強的對手』,你可是一站到底上答題實力非常ok的選手,萬一被虐太慘可就丟人咯。」
帶著忐忑和好奇,走進了搜狗大樓,第一次測試就這麼開始了,我原以為會見到一個實體的傢伙,還在期待它會到底是個什麼樣子。等到見到才發現,一台電腦,一個定向的麥,這就是汪仔最早的樣子。
測試開始之前,CEO王小川現身了,早就聽說了很多次的「駐守在五道口的男人」,總算是見到了活的咯!就像後來他在一站到底舞台上表現的那樣,溫文爾雅,客氣的打了招呼,坐在一邊安靜的看著測試。
第一次的測試,終究是沒給一站到底丟人,臨行前老趙的囑咐總算是沒辜負。在我之前,汪仔已經把另兩位同樣來幫助測試的一站到底答題高手斬落馬下,但到我上場時,只要是我會的題目,我通通用最快的速度給出了答案,總共差不多答了100多道題,最後的比分三七開,七當然是我,從搜狗工程師們和王小川的臉上的表情里讀出的是失落。
第一次測試給我留下很深印象的是這麼一道題「你耕田來我織布中的你指的是哪位人物?」這對於我們來說這再簡單不過,然而當時的汪仔卻似乎沒有理解題目的含義,也就是說它沒有人類的邏輯思維和判斷。對於「某某地方在哪個國家」,或者「某某電影是哪位導演的作品」,這樣的主謂賓非常嚴謹有序的題目,汪仔的反應速度飛快,換句話說,拿考試題型來做比喻,填空題它總是沒問題,但是閱讀理解它就敗下陣來了。
第二次的測試是在機緣巧合之下。搜狗的工程師們到南京出差,臨時起意要約我再跟汪仔大戰一次。第二次的汪仔給我的感覺完全不一樣了,最直觀的改變就是聽得懂人話了,具備了邏輯思維和判斷的能力。這一次雖說我贏了——但其實我佔了個大便宜。當時測試環境限制太多,第一沒有麥克風,對汪仔的語音識別造成了一定的干擾,第二酒店網路太差,這也就讓汪仔的答題速度大打折扣(要回答問題首先得聽清、知道問題)。人的知識都是有限的,不會不知道的東西,給你十天半個月你還是沒辦法想出來答案,而汪仔答題靠的是人工智慧。(這幾天才知道這個牛逼的技術叫搜狗「立知」),能聽到能聽懂,背後還有互聯網上海量信息的汪仔,已經很難有它不會回答的題目。
第三次的測試,非常的正式,放在了衛視大樓里,好哥和節目組的成員,加上搜狗團隊,在各種人的圍觀下就這麼開始了。
開始之前,老趙跟我開玩笑說,你得注意啊,你把機器人打的太慘了,搜狗沒面子,你被機器人打的太慘,我們沒面子。也是差不多100道題目,這次的結果是五五開,但並不是我放水,實際上我真的是用盡了洪荒之力。這次的100題難易度配比很合理,差不多也是五五開,我搶答了那五分簡單的題目,汪仔搶答了另外五分的難題,也就是說只要我要思考,汪仔必定贏我——而且是「搶答」。甚至其中有相當一部分的題目,汪仔搶得非常靠前,在我還在依靠已有的信息推斷完整問題時,汪仔已經做出了準確判斷,並回答正確。由於汪仔搶答速度太恐怖,快到讓人懵逼,我覺得這個對我答題造成了影響!
三次測試結束後,等到再見到汪仔的時候,它已經有了實體的模樣,出現在了舞台之上。這時候的汪仔已經讓我驚嘆了,我看著汪仔一步一步地從一台電腦加一個麥克風變成現在的機器人,從速度慢、聽不懂人話到現在萬事皆通、伶牙俐齒,答題速度到了讓我瞠目結舌的地步。阿爾法狗的圍棋陪練是樊麾,汪仔的答題陪練是我,有這個機會見證汪仔的誕生、成長和成熟,真的是非常榮幸。
天馬行空,想到哪兒寫到哪兒,也不知道該怎麼結尾了,就跟大家分享一下汪仔的有趣細節吧。
1.
為了在節目現場保證不出現第二次測試那種網速不快的情況,花了100W拉了根網線,那是我這輩子上過最快的網。
2.
汪仔答題還有個信心指數。對於自己找到的答案,汪仔會有一個信心指數的判斷,信心指數高的才會開口,不然就閉口不答等著對手犯錯,可以說是個心機狗。
3.
搜狗團隊非常年輕,一個我見了好幾次,一直插科打諢互懟的人,到第三次測試的時候,我才知道那是搜狗的CTO——之前,我一直以為那就是個程序員
4.
做成這麼大還帶動的實體機器人,技術難度很高,每次上場之前,搜狗團隊都要拜一拜汪仔,讓「狗爺」能發揮出和技術難度一樣高的實力水平。
5.
測試的時候,因為只能靠聽力去記住題目,稍長一點的題目對人來說還是蠻有挑戰的,每次沒答出來我都找這個做借口。。。。。。節目中答題其實選手都不聽,因為有大屏幕可以看題目(文字出的速度比好哥曉敏姐讀的快多啦),這樣選手的反應速度也就更快。
6.
駐守在五道口的男人真的溫文爾雅還蠻帥氣,還單身呢,超級鑽石王老五,單身女青年們,還不往上撲撲撲。
這汪不比那汪,下棋會被吃光。
2.14更新。
第二期已經播出了,被搜狗的「人工智慧」驚到了,隨便拿幾道題說說。
首先是最雷人的一道題,主持人提問:「你無情,你冷酷,你無理取鬧」,這句台詞最早出自哪部電視劇?
汪仔搶答:還珠格格!
人類選手:情深深雨蒙蒙
結果:人類選手回答正確
然而………
我沒懂,搜狗機器人「汪仔」所使用的系統就是「搜狗立知」系統,可為什麼現場回答跟系統檢索結果不一樣?想來想去只有一個解釋:為了讓節目看起來更「真實」,搜狗主動答錯。如果這個結論正確,那麼整個節目是搜狗自導自演的一場作秀就更可能了。
不過,相比於第一期,搜狗的確「聰明」了很多,因為這次居然能回答出一些題庫之外的「改編」問題:
Q:土耳其海峽連接的兩片海域分別是黑海和哪片海?(正確答案:地中海,汪仔搶答正確)
Q:由司馬光編撰,並被稱為「帝王的鏡子」的是哪本編年體史書?(正確答案:資治通鑒。汪仔搶答正確)
but,有了情深深雨蒙蒙的梗,誰又知道這些題不是提前寫在劇本上的呢,畢竟節目要播三期,每次都要有「驚喜」。
引用一句評論區網友的觀點: 這些網站啊,總想搞個大新聞
以下是第一次的回答:
昨天看電視看到這個比賽了。講真,節目質量和形式都一般般,這種比賽形式幾年前IBM參加《危險邊緣》就玩過了,那個節目中的問題非常複雜,對機器語義解析的難度要求要高的多,相比之下,一站到底的問題其實還僅限于格式比較固定的封閉題目。
早聽說一站到底有題庫,閑來無事把節目里的題目都搜了下,做個了統計,結果很有趣:
很明顯:凡是汪仔答對的,幾乎都是網上一站到底題庫中能搜到的問題,凡是汪仔答錯或者回答速度輸給人類的,都是題庫里搜不出的問題。這麼一看,搜狗這機器人與其說是「人工智慧」,倒不如說更像是用關鍵詞做了資料庫搜索匹配,而且資料庫來自於網路中的一站到底題庫。
有人可能會說,如果搜狗通過強大的搜索引擎技術將網路中的題庫作為自己信息抓取的來源之一,那麼能夠對節目中的問題迅速作答也無可厚非,並不能否認搜狗宣傳的「立知」系統功能之強大。可事實真如此嗎?
為了驗證這個問題,我在網上找了一個一站到底題庫( http://wenku.baidu.com/link?url=8HExro6HaIhnuEfDkKqZtKfD0YdQAM3LgBXW7tTVibdOZUdlrYp_NRCvliqsWp21rIb--cb-Vyp4uUND0sIkz5NdKKbaEPS7SBLqeBySo6a ) ,從中隨機抽取了幾個問題,在搜狗搜索APP中測試了一下。
問題1:金庸小說《倚天屠龍記》中,金毛獅王叫什麼名字?【此題來源於題庫,正確答案:謝遜】,搜狗搜索結果:
問題2:金庸小說《倚天屠龍記》中,張無忌的義父叫什麼名字?【此題根據上一題做了微調,但題庫中沒有】,搜狗搜索結果:
問題3:在「小虎隊」成員中,吳奇隆被稱為什麼虎?【此題來源於題庫,正確答案:霹靂虎】,搜狗搜索結果:
問題4:在「小虎隊」成員中,蘇有朋被稱為什麼虎?【此題把吳奇隆換成蘇有朋,但題庫中沒有】,搜狗搜索結果:
問題5:在「小虎隊」成員中,陳志朋被稱為什麼虎?【此題把吳奇隆換成陳志朋,但題庫中沒有】,搜狗搜索結果:
……求蘇有朋和陳志朋心理陰影面積
又測了一堆問題,同樣是這種結果,比如:
【題庫中的問題】演員房祖名的爸爸是哪位著名功夫巨星?搜狗:成龍
房祖名的爸爸是誰?搜狗:沒結果
演員房祖名的爸爸是哪位功夫巨星?搜狗:沒結果
可以看出,同等難度、同樣的封閉問題,題庫中有的,搜狗「立知」系統能給出準確答案,題庫中沒有的,搜狗就懵逼了……
合著搜狗的「立知」系統是專門為了一站到底做的啊?這還需要什麼語義解析和判斷推理能力啊?真是一條「應試教育」下的好汪仔,開眼界了,手動滑稽。
發出來的時候看到另一位朋友也發現了題庫的問題,握手。
https://www.zhihu.com/question/55495916/answer/144919020
搜狗機器人在這個節目中只是答題,語音識別和問題反饋表現的是不錯的,讓阿法狗說漢語,讓汪仔下圍棋,結果是啥樣不現場比一比不好說呀。
主持人問:「正史里誰提出的草船借箭?」,機器人搶答的是諸葛亮,另一名選手回答的是孫權,正確答案是孫權。如果這時候主持人再問一遍,「正史里誰提出的草船借箭?」 機器人能搶答出孫權,那我認為這是人工智慧,否則他就是一個題庫檢索器而已。答題之前兩個主持人和機器人開了個玩笑,機器人說了句「好哥(主持人名字),你難道要和只狗計較嗎?」這句話說得相當有「人味」,我覺得會是兩種情況,要麼他們這段對話是實現排練好的,主持人先開玩笑,然後設定讓他回復;要麼是有人可以操控這個機器人在說什麼,反正肯定不會是機器人理解他們的玩笑,自己自己也開玩笑自發說出來的。因為這種對話型機器人最難的地方就在於能理解上下文和根據語境心情做出回答。我覺得人工智慧最難也是最展現「智能」的就兩點:能理解上下文和自主學習能力。阿發狗能下棋顯然是需要理解對方上下步,而且也能通過自己和自己下棋來提升自己的能力。汪仔我還沒有太多智能的感覺。
先回答問題本身。
1.搜狗參加「一站到底」的機器人牛嗎?牛,可以代表國內人工智慧領域的第一梯隊水平,這個爭議是不大的。
2.和阿發狗下圍棋哪個更厲害?肯定是阿法狗下圍棋更厲害,拿國內人工智慧的第一梯隊水平,和阿爾法狗這種毫無疑問的全球第一比較,兩者差距是客觀存在的。
好了,所以就到了吐槽題主的時間了——你提這個問題,簡直就是刻意捧殺搜狗啊!
且慢,還真不是偶然的。
首先,看題主:
也就是這位:
咦,貌似是位知乎新人啊,除了3個月前一個幾乎可以忽略的提問,接下來就是這個問題了。
再看回答?咦,貌似是自問自答,而且還是這個問題下的高票答案啊。
我們再仔細看答案的內容:
這答案明顯是在批搜狗啊!明明提問時還將搜狗和阿法狗相提並論,為啥回答時就180度大轉彎了呢?
除了這個答案,看看其他幾個答案的答主,貌似也有點貓膩吧……
這位同樣用題庫說事的答主,是一位匿名用戶。
這位,同樣是匿名用戶。
這兩位嘲諷黨,同樣是匿名用戶。
這位直接拿出了《最強大腦》里小度的用戶總算沒匿名,不過他又是一名知乎新人……
咦,小度?貌似是百度公司開發的吧……
我們再看一遍高票答案,也就是題主自問自答的答案。
視頻鏈接是百度視頻。
全程的截圖是百度文庫。
連題目配的鏈接都是百度的愛奇藝……
所以,這位同學,你為什麼這麼喜歡用百度系的產品呢?
回到話題本身,高票答案之所以獲得80多個贊同,是因為作為知乎大V的搜狗CEO @王小川 給這個答案點了贊。為何要給質疑自家的答案點贊呢?我猜可能是創業者的度量使然吧。
然而,評論區里,川哥解釋的恐怕也不能更清楚了吧。
為認真的精神點贊是好事,然而,如果碰上了友商的公關,對面豈不要笑暈了嗎?
別誤會,我不是搜狗的PR(老大點贊的答案我敢吐槽,難道是不想幹了?)而且我的意思是,現在還沒有100%的證據證明這個問題和答案與包括百度在內的任何公司有關係,但是 @這屆百度公關 ,你們真的不打算出來解釋一下嗎?
是在下服了……
我是真的覺得搜狗這個機器人很哇塞啊!
搜索引擎這是成精了啊!我和一起看的朋友還在yy這個機器人要是會做飯就好了!(?¤????ω¤????)?
這個識別功能還有題庫功能我好想要啊!
我也想被人輸入一堆知識!
我現在腦洞大開啊,以後有沒有可能搜狗再出新產品,機器人給我傳電波,幫助我記住知識啊。
這樣我就不用擔心我記不住韓語單詞和英語單詞了啊。。。
搜狗加油啊!我看好你!我不知道有多少答題的是人工智慧的專業人士。只想說一句,阿爾法狗目前只是一個專註圍棋的AI,而同樣是AI,搜狗在某些領域,特別是中文語義方面完全可以說是不遑多讓。倒是有些人逢國產必反的心態叫人作嘔。
因為標籤里有《一站到底》,作為一個從高中看《一站到底》的死忠粉還是想要說下自己的感想。
首先,可以肯定的是搜狗的汪仔還沒達到阿法狗的程度,是有一定的差距的。畢竟這個技術差距是存在的,谷歌的科技水平是不容置喙的。但是如果說用途吧,兩者可能可比性不是很大。我搜了下阿法狗的能力是學習,深度學習,有點像人類儲存知識的過程,不同的是一個在腦部一個在晶元。汪仔亮相主打的是它超越了識別能力,能聽能說會看會思考,可以在幾個毫秒內,從海量數據當中檢索出信息,思考,推理,然後快速搶答。也就是說通過語音識別,然後搜索出答案,再回答的一個過程。只不過它的速度是很快的。語音識別功能搜狗的輸入法已經自帶了,之前也用過幾次,語音轉文字的功能還不錯,可能是因為我是普通話的緣故,它對流行用語識別的能力也還可以。
再講講它參加《一站到底》獲勝吧,前面有的回答提到了記題庫的問題,這個我覺得不大,很早之前有期來的嘉賓也整理過題庫,還裝訂成冊子帶來過,我覺得問題可能就在於檢索答案的時候有些死板,如果問題和已掌握內容有所出去,不知道還能不能很順利的回答出來。機器人參加這種問答節目還是很有優勢的吧,畢竟不存在心理上的波動,影響發揮。還是期待以後能把前幾年的「站神」們請到再和汪仔對壘一次看看效果。這可以把這些心理因素對答題的影響降到比較低的水平吧。
最後作為一個非專業人士,覺得汪仔這樣的人工智慧還挺好,雖然瑕疵存在,但是也是在慢慢進步吧,比以前那個什麼微信人工智慧小冰好太多了……至少不會覺得智商被忽悠了。請各位非專業人士讓開,朕要開大了。這個回答的結論在最後,但是精華是中間部分。
==利益相關:本人情報學研究生在讀,專業方向為知識工程。研一參與某問答系統相關研究(不是搜狗)。==首先分析搜狗機器人回答問題的步驟:1、語音識別——從節目中可以看出,識別準確率非常高。事實上,搜狗機器人在這一步應該沒有丟分。2、問句分析——有這樣一個問題:正史中誰提出了草船借箭?正確答案是孫權,搜狗的回答是諸葛亮。顯然「正史」這兩個字被有意無意的忽略掉了。這種忽略首先受限於搜狗的問題庫,在大量的問題當中,這樣的細節肯定會被忽略掉一部分。3、知識推理——節目中完全沒有需要複雜推理的題目。應該這樣說:節目中的題目只考驗記憶力,即知識庫的大小。所以,很明顯,搜狗機器人只要問題一出來,就立馬顯示答案,而人類要戰勝他,就必須做提前判斷。好了,總結一下搜狗機器人的問題在於:
1、必須輸入一條完整的問句才行,所以不能搶答2、問句細節理解不到位3、如果存在複雜推理,那麼搜狗機器人的性能未可知4、搜狗機器人的題庫應該是從網路資源當中提取的通用題庫,對於有一定專業程度題目可能存在漏洞優勢在於:
1、題庫可以非常大,而且搜索效率極高,即使是專業內容,只要給載入相應的題庫就好了。事實上,這種節目一般會給參賽者一整套題庫做準備訓練以保證參賽效果,而顯然搜狗機器人沒有獲得題庫……人類都是渣渣哈哈哈2、沒有現場情緒波動==目前的相關研究涉及到三個方面:1、問句分析。這方面,對於規範問句的解析程度已經達到相當高的水平了,本人某些使用CRF模型的試驗能夠達到81%以上的F值。2、語音識別。近乎百分百。3、知識庫構建與推理。當然,這個節目的性質導致推理幾乎沒有,而問題的範圍基本上是常識領域。所以,問題就簡化成了在維基百科、搜狗百科、百度百科上面檢索。可以看到,其實最難的地方就在於問句分析:因為節目中的問題都是常識問題,對於不同類型的常識問句,其成分是非常不一樣的。搜狗大概是積累了一套非常好的問句成分結構,那麼可以說:在中文問句成分這個領域上面,搜狗大概是具有世界領先的水平的。本來打算上來看一下評論,然後發現我被扒皮了???那必須是不服的。
1、我自問自答?
沒錯。因為我本來打算髮一篇專欄文章的,但考慮到自己沒什麼人氣,沒辦法引發討論,所以就斗膽自問自答了,認真的朋友可能看得出來我原回答開篇第一句話其實很像一個標題:
2、我用的鏈接和截圖為什麼都是百度的?
因為我用百度搜的啊。我為什麼用百度搜?因為我的瀏覽器書籤欄里有一個「百度一下」的書籤啊。為什麼我瀏覽器里有一個「百度一下」的書籤欄而不是「搜狗一下」的書籤欄?那得問搜狗搜索為啥這麼不蒸饅頭蒸口氣啊。
為什麼截圖裡也是「百度文庫」啊?我倒是不想用百度文庫啊,奈何這個題目就存在在百度文庫里,而且上傳時間是2013年啊。哦,要是覺得用百度文庫就是百度的人話,那你出個搜狗文庫吧,我保證馬上反水,呵呵。
3、既然這位匿名用戶(誒你為什麼匿名?)要陰謀論,那我們一起來陰謀論一下好了。
這個回答是今天11:00(一小時前)編輯的,但很快就排到了第二名的位置了(比我還靠前):
仔細一看,原來這位「孔慶勛」大V在這個答案發出來後迅速點了個贊。
在下去搜了一下,也發現了一些了不得的東西 :
666,孔先生昨晚特別積極地踩了兩下百度,捧了一次搜狗。那麼???
4、搜狗公關長點心吧。
-------------------------------------------------以下是第一次更-----------------------------------------------
一會兒的功夫,居然被王總點贊了!……不知道小川哥有沒有全部看完,我只能說,您這麼公開地同意我的觀點,我真是誠惶誠恐啊~~
--------------------------------------------------以下是原答案------------------------------------------------
「汪仔」到底有沒有比Google的AlphaGo更牛?是語音答題更難還是下圍棋更強?
王小川不久之前對比Google做過一番評價。他認為,Google在人工智慧領域做的事情過於寬廣,更多是在「秀肌肉」,而搜狗則更加垂直和專註解決實際問題。在中文領域,搜狗實際做到的識別準確度比Google更高。汪仔的露面,也是對應了王小川「解決實際問題」這個口號。
其實,從兩個產品涉及到的技術來說,兩者是有區別的。不能簡單的說哪個更難哪個更簡單。
先說Google。你不能否認,Google就是這個地球上人工智慧實力最強大的公司之一。《麻省理工(MIT)科技評論》在2016年「全球最聰明的50家公司」里它排名第8,在AI的布局中也相當廣泛:視覺、語音、自然語言、大數據、 神經網路訓練+深度學習、人工智慧加速器晶元TPUs、無人駕駛、VR生態……
AlphaGo的主要工作原理,是深度學習,一層神經網路會把大量矩陣數字作為輸入,通過非線性激活方法取權重,再產生另一個數據集合作為輸出。就像生物神經大腦的工作機理一樣,通過合適的矩陣數量,多層組織鏈接一起,形成神經網路大腦進行精準複雜的處理,就像人們識別物體標註圖片一樣。
再來看一下搜狗的汪仔。在搜狗對外發布的新聞稿,官方是這樣做技術描述:
汪仔可以根據節目現場主持人即時提問進行語音識別,當檢測到問題關鍵詞和問題的解決方案後,再進行正確率比對,將它認為信心指數高的正確答案通過自身發聲系統進行適時回答。搜狗稱,「汪仔」基本可以做到500毫秒內搜索到信息,並選出正確的答案。
拆分開來,汪仔的工作步驟包括:
1,對語音的快速識別。這個步驟相當於我們在訊飛輸入法上的語音輸入識別和Google Chrome瀏覽器上的語音搜索按鈕。
2,問題的檢索和答案匹配。其實就是搜索引擎的主要步驟。所不同的是要增加一層正確率判斷,輸出機器人認為最正確的版本。
3,語音播報回答。
這三個步驟中,1和3涉及到的是語音識別和合成。語音技術算是人工智慧領域當前比較成熟的應用了,在去年的鎚子新品發布會上,老羅就給科大訊飛打了個廣告,秀了一把訊飛的長語音識別能力。
視頻在此: http://baidu.ku6.com/watch/05088867644649418118.html?page=videoMultiNeed
第2個步驟涉及到的問題的檢索和答案匹配。按照搜狗的描述,「汪仔」也是基於深度學習原理,每天不停地吸收海量知識,從而提升決策的準確程度。
不過,如果你對《一戰到底》有了比較長時間的關注,你還是能從中挖掘出一些相當有趣的地方。
( 前 方 高 能 , 請 謹 慎 閱 讀 ! ! ! )
熟悉《一站到底》這個節目的人都知道,《一站到底》是江蘇衛視根據美國NBC電視台《Who"s still standing》改編而來的。從2012年開播之後,在4年多的時間裡,《一站到底》來來往往出現了多個「站神」,也在網上積累下了海量的題庫。隨著節目期數越來越多,有不少題目也在節目中重複地出現了。
在百度文庫里搜一下,你會發現,文庫里早就存在著歷年的「一站到底題庫」,而汪仔和豐莉婷PK的幾道題,竟然幾乎都能在這些題庫中找到答案。
這是汪仔和豐莉婷PK的題目列表:
第二道題,具有明目功效的中藥「白丁香」是哪種動物的糞便?(正確答案:麻雀)
第三道題,《笑傲江湖》中,風清揚將哪種絕世武學傳授給了令狐沖?(正確答案:獨孤九劍)
第六道題:作家阿來憑藉哪部小說獲得了第五屆茅盾文學獎?(正確答案:塵埃落定)
第七道題:「澳洲野兔」是哪位澳大利亞網球運動員的綽號?(正確答案:休伊特)
第八道題:詩句「回眸一笑百媚生」的下一句是什麼?(正確答案:六宮粉黛無顏色)
第十道題:世界上面積最大的內陸國是哪個國家?(正確答案:哈薩克)
第十一道題:電視劇《金粉世家》、《啼笑因緣》均改編自哪位作家的作品?(正確答案:張恨水)
以上這些一站到底網上現有題庫中能找到的題目,都被搜狗的汪仔機器人搶答正確了。
更弔詭的是,剩餘幾道汪仔沒能搶答正確或搶答錯誤、被豐莉婷拿下了的題目,恰恰是在百度文庫里搜不到、網上現有的一站到底題庫中找不到的。比如,「在正史《三國志》中,草船借箭是哪位將領的事迹?」這題中,正確答案是孫權,但汪仔搶答的是諸葛亮。另外,「我國第一支水彩顏料是由哪家知名企業生產」,以及「浸鴨子一月任食,煮而食之,酒食具用 說的是哪種食物?」這兩道題,汪仔也都沒能搶答到。這三道題目,都沒有出現在網上已有的一站到底題庫中。
這到底是一種巧合,還是恰恰說明,為了加快答題速度,汪仔只是在識別題目之後做了簡單的切詞,然後給出答案?或者,搜狗只是針對一站到底的此前題庫進行了機器訓練?希望得到更多大牛的解答。
此外,從主持人提問的問題,我們也可以分析一下。提問的方式多是以「哪個」來做封閉式的提問的,詳見下圖。這樣的提問模式,其實對搜索引擎來說應該是最容易進行語義的理解和檢索出正確答案的吧?如果提問用非結構化的方式來進行,比如「風清揚傳授給令狐沖的是?」,回答準確率恐怕就沒這麼高了。
整體來看,我認為一站到底這場人機大戰,對汪仔最難的就是在前端的語音識別,畢竟在那種遠場環境且能排除噪音影響,確實不容易。不過,連號稱國內語音識別能力第一的訊飛都不能做到這種識別結果和識別速度,搜狗居然能做出來,這背後到底依靠的是什麼神奇的力量,會不會存在貓膩?
估計搜狗在這一輪節目之後,要面臨不小的質疑。
如果你強制讓汪仔和阿法狗下圍棋的話,那汪仔肯定是完敗的
就像你讓阿法狗和汪仔答題,阿法狗肯定也是完敗
提問的人問的這個問題就不好,一個專門答題的機器人怎麼能和一個專門下圍棋的程序來進行比較呢?
這個問題就像【姚明牛嗎?和打乒乓球的張繼科一起打乒乓球的話,哪個更厲害?】一樣
非常的不專業
既然說到了AlphaGo,那我們就要先了解一下大家口中的阿法狗到底是個什麼東西
很多人對AlphaGo的認知,其實是有錯誤的,很多人會覺得AlphaGo=谷歌人工智慧
但事實上,AlphaGo的意思呢,其實是阿爾法圍棋程序
即【Go指代的是Go Game,也就是圍棋的意思】,而不是大眾認知中的【走】
所以,AlphaGo其實只是一個單純的,針對圍棋遊戲的一個程序而已
AlphaGo決不能代表谷歌的人工智慧水平
因為我們公司本身就是做人工智慧的,所以對這方面了解比較多
谷歌的人工智慧是遍布到各個領域內的,AlphaGo只是其水平在圍棋領域內的一個展現而已
而且AlphaGo的核心在於演算法優勢,AlphaGo和以前那些和人類下象棋的軟體是有著質的區別的
象棋這個遊戲,是可以通過算力堆出來的,但是圍棋是只能通過演算法來解出
這兩者絕對不是同一個數量級的東西
象棋就像一種簡單的考試,一個人就算再笨,只要下了功夫就能通過
但是圍棋就像一種非常難的考試,只有天才下了非常大的功夫才能通過,普通人再努力也無法通過
所以AlphaGo的出現,其實是代表著人類在圍棋這個領域內,創造了一個學習能力非常強的天才少年
這還僅僅是一個谷歌人工智慧水平的縮影而已
谷歌的人工智慧有多牛?
它們已經可以讓人工智慧生產出人工智慧了
由於我們公司的核心業務就是用人工智慧生產非智能的程序,所以我們可以非常深刻的感受到讓人工智慧生產人工智慧的難度,而這麼變態的事情,谷歌都做到了
所以谷歌在人工智慧領域絕對是傳說般的存在,毫不誇張的說,就是不可超越
但是,這意味著搜狗的汪仔不牛嗎?
錯了
搜狗的汪仔也很牛,但是牛的領域不同
AlphaGo牛,是因為它下圍棋牛
汪仔牛,是因為它答題牛
而答題牛主要體現在三個方面:
1.語音識別效率
語音識別的準確率這個東西早就已經非常非常完善了,但是汪仔的語音識別效率實在是太高了,你要明白,機器人開始識別語音是在你說完話之後的,而不是像人一樣邊聽邊思考,機器要聽完一整段話才能開始識別和思考,所以如果你看過節目的話,你就會發現汪仔聽完題目後基本上都是秒答,那個速度真的是太嚇人了
2.檢索效率
和上一點其實是相輔相成的,汪仔的答題效率是非常高的,聽完題到念完答案甚至連1秒都不需要,這不到1秒的時間內,它需要完成識別、檢索、輸出這三件事兒,聽起來簡單,實際上也不複雜,但要把這件事兒做到這麼快,是一個非常難的事情
3.語速拿捏的好
這一點不是來搞笑的,汪仔參加的是一個問答節目,我們可以明顯的感受到他的語速是加快的,主要是快在字與字的間隔時間上,字與字之間幾乎沒有間隔,而且人還能聽清他在講什麼,這是一個比較難拿捏的點,你太快了別人聽不清,太慢了在問答節目是劣勢,而汪仔在這個語速上肯定是經過了調教的,這點我們可以明顯的感受到
汪仔和阿法狗是完全不同的,除了都屬於【人工智慧】這個大類以外,基本沒啥共同點
你把他們強行拿來比較,完全沒有任何的意義
我還要吐槽一下提問的人,明顯是帶著偏見提問的
節目中說的很明顯,說汪仔是全中國最聰明的機器人:
而提問的人卻強行說他說自己是最強人工智慧的,這完全就是帶著偏見提問的
大家來感受一下提問者的語氣:
今天電視上看到搜狗的機器人「汪仔」參加江蘇衛視一站到底,聲稱自己是「最強的人工智慧」,大家怎麼看?
不要覺得國產的東西都不好,汪仔在答題方面做的已經很不錯了
最後,我們再來分析一下汪仔在節目裡面的答題表現:
規則裡面是汪仔讓了人類3分,最終得分是人類6分,汪仔7分
所以人類實際上答對了3道題,汪仔答對了7道題
而人類答對的3道題裡面,2道是搶答的,1道是真真正正讓汪仔打錯的
由於語音識別的邏輯存在著限制,所以汪仔是沒有辦法做出【搶答】這個舉動的,只有在聽完題之後才能開始分析,所以【搶答】其實可以算是人類對比人工智慧的唯一優勢(在答題領域)
所以說汪仔做的是非常不錯的,它的這個反應速度已經非常極致了
雖然說【最聰明的機器人】有點誇張了,但說它是【答題最棒的機器人】那是沒有任何問題的
下面是實戰狀況:
第一題,汪仔得分
第二題,汪仔得分
第三天,汪仔得分
第四題,人類得分
(注意,這道題是汪仔答錯了,正確答案是【孫權】,因為題目中強調了【正史】兩個字)
第五題,人類得分
第六題,汪仔得分
第七題,汪仔得分
第八題,汪仔得分
第九題,人類得分
第十題,汪仔得分
第十一題,汪仔得分
最後一句話:支持國產,中國加油
前幾天看節目看到了這個,從電視從業者的角度插個感觸,我覺得節目求新求變很棒。把機器學習、人工智慧這樣其實挺專業的問題用娛樂輕鬆的方式和普通人結合,我所處的泛娛樂行業,其實很需要和期待這種技術變革帶來的新鮮感和促進。看完節目,順便問了一下周圍的人,對人工智慧會恐懼嗎?一部分人會表示恐懼,感覺這是直面毀滅的開始。而我們作為影視行業泛娛樂及藝術從業者,卻覺得前所未見的時代來臨了。當我們被解放出來後,未來的文娛時代將到來,人工智慧與人類大腦的趣味機智結合,技術並不可怕。汪仔和阿法狗,兩者代表的都是人工智慧的開啟,現在看來,兩者還有差距,但未來還長著,希望搜狗加油吧。
就像所謂的AI機器人嬌嬌一樣…只是投機取巧的偽AI罷了……
。。。別侮辱阿法狗好么
大晚上逛知乎碰上這個問題,看了看節目視頻,怎麼說呢,就一個感受,搜狗宣傳的4000萬與其說是研發費用,倒不如說是交了廣告費。
前面幾對選手的PK剪輯還挺流暢,等汪仔(這名字蠢的沒誰了)一出場畫面就開始一頓一頓,每個鏡頭與鏡頭之間都像是生硬湊出來的,主持人、選手和汪仔的對話完全是念台本的感覺,反正我看著很不舒服。就一個字,假。
而且機器人的技術含量也太低了點,其實就是個題庫搜索。網上現在「一站到底」的題庫多的很,copy下來灌進去就行,充其次算個小型資料庫搜索,根本算不上人工智慧。就這也好意思說自己是「中國最聰明的機器人」?退一步講,我不能理解為什麼使用題庫搜索還會出現幾次離譜的錯誤,以及反應遲緩的情況,所謂的險勝到底是因為技術不行,還是故意做秀?
拿這種所謂的人工智慧和谷歌的AlphaGo相比真的沒什麼可比性,硬要比的話,單從技術複雜性上,AlphaGo就包括走棋網路、快速走子、估值網路、蒙特卡羅樹搜索等一堆核心技術,是深度學習的結晶。在與棋手對弈前,AlphaGo已經利用深度學習網路進行超過3000萬盤棋局的自我對弈,相當於人類不眠不休的進行大約3500年的圍棋訓練。
誰更厲害很明顯吧。
直接說垃圾,大家又接受不了,那隻能說雖然很努力但還差得遠,可是我想問問做這麼個東西有什麼用
推薦閱讀:
※如何看待谷歌被歐盟判罰 24.2 億歐元?有哪些值得關注的信息?
※中國的 BAT 與美國的 GAF (Google / Amazon / Facebook) 比較起來怎麼樣?
※Chromecast 基於的是 ChromeOS,還是 Android?
※chrome放視頻顯示「adobe flash player不是最新版本」,下載最新版安裝不了,為啥?
※年末谷歌64位系統就出來了,現在的32位CPU手機值得買嗎?