看了《一站到底》中搜狗機器人汪仔的表現後想起了IBM 沃森,哪個更厲害?有什麼區別?

最近搜狗汪仔在益智問答類節目《一站到底》上出現,和人類比賽答題。從第一期汪仔的表現來看,目前雖然在一些細節處理上還有不足,但是在整體答題速度(包括語音識別速度)、準確率上(包括語音識別準確率、對於問句的理解推理能力),是略優於人類的。

而之前,IBM的沃森也曾參加類似的節目《危險邊緣》(Jeopardy!),當時IBM對它技術解讀是「經過學習和訓練,Watson的Deep QA系統能夠從原始信息中自動抽取知識,對知識進行分類並且能夠分析和理解自然語言。」

對比沃森,搜狗汪仔在技術層面有進化和提升嗎?


另外看到沃森現在的發展,在醫療領域中,可以更快速地處理信息,提出智能診療建議,甚至可以隨著時間的推移,通過學習,在真實病例中更好地提出問題和診療方案。那麼同樣是在節目中先秀「推理」「判斷」能力,這是否意味著搜狗未來也會向這個方向發展?


謝邀。

先說下IBM的沃森。IBM做人工智慧有些歷史了。最早的里程碑事件是在1997年,深藍擊敗國際象棋冠軍卡斯帕羅夫。哪怕是從那個時候算起,到現在也有二十年了。

而沃森,光是開發就用了四年,而且一直在不斷迭代,到現在也發展了十年左右了,功能上從語義識別到金融再到醫療相當廣泛。IBM這些年收縮了個人業務,很多資源投入到了AI這方面。IBM有一個專門的中心就叫沃森,員工兩千多人,投入十幾億美元做研發。

再說搜狗,搜狗主打人工智慧還是最近一年的事情。給我的感覺,他們比較有競爭力的兩個點,一個是語音識別,一個是中文語義分析。關鍵詞,中文。在國內的科技公司里,論人工智慧,搜狗的表現可算是第一梯隊,發展也挺快。

簡單的說,一個是世界500強2000多人十年磨一劍的大作,一個是創業公司爭分奪秒努力的結晶;一個是老前輩,一個是後起之秀。

另外,不能忽略的一點是,兩者的實戰環境是有區別的。

此處引用一段搜狗技術負責人許靜芳曾給汪仔和IBM Watson留下的評價:

(1)輸入方式不同:沃森是特殊介面文本輸入,輸入內容準確無誤。而一站到底是主持人念題加題板展示題目(兩種來源都是逐字出題),汪仔通過搜狗的語音識別和圖像識別技術,利用語音和圖像兩種方式獲取,再轉換成文字。語音識別、圖像識別都是AI的關鍵技術,同時識別的錯誤會進一步提升答題的難度。
(2)題目設置不同:jeopardy!的題目有顯示類別和相應的獎金數,類別對於答題有幫助,能夠將答案限定在特定範圍內。而一站到底中的題目沒有給出類別,需要汪仔通過演算法識別問題的類別,增大了答題的難度。當然jeopardy!中題目的獎金不同,最後以獲得的獎金數定輸贏也帶來了新的問題,這點是一站到底所沒有的特性。
3)賽制不同: jeopardy!必須主持人把題目完整念出後選手才能搶答,而一站到底是在開始念題後任意時間都可以搶答,答對自己得分,答錯對方加分。因此在高水平的選手有大量的題目都是在題目尚未完整時就作答,汪仔同樣有很強的搶答,即根據題乾片段去預測問題並作答的能力,這是沃森所不具備的能力。
(4)沃森是一個封閉系統,不聯網,利用其離線的知識庫答題,而汪仔通過聯網,對全網信息及搜狗知識圖譜進行在線答題,在利用更大範圍信息的同時也對答題速度提出挑戰。
(5)其他
汪仔除了能回答知識問題,還有聊天功能,可以和主持人進行自然語言交流。

所以分析兩者的實力,還是從兩個層面出發。一方面是,人工智慧的發展是以日積月累的數據為基礎的,用戶越多,範圍越廣,頻度越高,就可以積累更多的數據。IBM現在的業務更傾向於解決方案,近幾年在收集行業數據這個方面投入了不少,沃森在金融、醫療領域就算是人工智慧解決方案的一種試水,同時也充分地豐富了自身的數據量。

而搜狗發展人工智慧的基礎是C端的產品。從瀏覽器,輸入法到搜索引擎,幾億用戶基數構成的資料庫為搜狗開發人工智慧提供了巨大的數據量。但是若是想把汪仔投入更深層次的行業應用,目前的公共資料庫是不夠的,不僅僅是搜狗,國內任何一家都沒有這個實力。加大在收集行業數據的投入,勢在必行。

另一個層面是演算法。機器學習系統的研發是一個比較耗時的過程,所以這一塊IBM的領跑優勢比較明顯。包括知名的谷歌阿爾法狗九段,從戰五渣到全球No.1也都經歷了一個比較長的過程。搜狗想要汪仔徹底被認同成為人工智慧而擺脫「智能搜索」這個標籤,還需要更多在機器學習方面的積累。

由國內互聯網行業的大公司、獨角獸公司取得的技術創新其實寥寥無幾。就像之前寫過的,搜狗的大力推動算是在AI領域開了個好頭。至少是有益於國內AI圈的發展的。(搜狗為什麼要聯合清華做人工智慧前沿研究? - Summer Clover)上次看過了汪仔參加《一站到底》的節目,也讓我想起沃森2011年時參加《危險邊緣》的表現,同樣是人工智慧與人類對決,同樣是益智類比賽,同樣碾壓了人類,一個英文,一個中文,表現令人驚嘆。

另外說一個點,由於中英文差異,這兩者訓練的語料庫完全不一樣。開發中文語意識別和理解技術並不能照搬英文,很多時候要自己摸索新技術、新模型。美國大公司不一定就在非英語的語音識別、自然語言處理上做得好。比如日語的Cortana就做得很不好,現在微軟日本已經暫時放棄了繼續開發Cortana了。。搜狗在中文的語音識別和理解方面應該算是下了不少功夫的。

Kevin Kelly最近以「How AI can bring on a second Industrial Revolution」為題在TED上作演講。他提到了AI領域會是世界科技發展的大勢所趨。而相比較美國,國內在人工智慧這個領域仍在追趕。

盼望國內AI圈繼續努力。尤其希望國內科技公司率先攻克中文方面的技術難關。

比起IBM Watson,汪仔最大的優勢還是在中文的識別、理解。


AI參與這樣的比賽最大的難點應該還是對於語義的理解, @王小川 自己也說語言處理方面是最困難的。

搜狗的汪仔大概是朝沃森這個方向走的,目前來說我覺得有兩點區別,第一是輸入方式,語音識別方面比較強;第二是聯網,可以搜索更大範圍的信息。

另外中文語義本來就難於英文,在中文語境下,搜狗肯定佔優勢了。

最重要的是,搜狗投了知乎,完全可以把問答鏈接到知乎啊!

以後就可以問「飯碗被AI搶走是一種怎樣的體驗?」

AI就會回答你「謝邀。」


看醫學層面,汪仔還不行,畢竟沃森先起步,搜狗還沒開始。

看答題,其實雙方都差不多,都是強過人類。

但是——

重要的事情說三遍!

同樣答題,中文比英文難!

同樣答題,中文比英文難!

同樣答題,中文比英文難!

想想你家Siri的中文和英文回復差多少你就懂了,中文的混沌性遠遠超過英文,中英文識別理解不是一個量級,能做到差不多,已經算是超越了。

不服的,請翻牆去谷歌翻譯,把英文翻譯成法語,再翻回去。同樣一段英文,翻譯成中文,再翻回去。看看結果。

不多說,懂得自然懂。


現在說搜狗汪仔可愛的,你們真的這麼坦然嗎?

借用@謝熊貓君 那篇著名的《為什麼有很多名人讓人們警惕人工智慧?》的帖子里兩張圖。

上一秒,你還覺得人工智慧挺可愛(就是現在的汪仔):

下一秒,在他面前,你就是汪仔。

顫抖吧,人類!


搜狗家汪仔,太輕浮,天天撩妹,感覺不是什麼好貨,長大了,就完了。

希望@王小川 管一管,如果有天被汪仔撩到妹了,而我還單身。

那才真特么是——

人不如狗啊!


利益相關~

我們團隊去年主導開發了搜狗汪仔,最近受邀寫一篇稿子,這裡也分享一下,歡迎切磋。

搜狗汪仔背後的「大夢想」

搜狗汪仔

最近搜狗汪仔機器人亮相江蘇衛視的《一站到底》節目,引發不少關注。搜狗汪仔是搜狗公司研發的一款機器人,他能聽、會說、會看、善思考(問答和聊天),其背後集成了搜狗的語音識別、語音合成、圖像識別、深度問答和人機對話等多項AI技術。

《一站到底》是國內排名第一的知識問答類節目,主要內容是不同選手之間的知識問答淘汰賽。搜狗汪仔因為具有較強的問答能力,所以每期節目中人類選手最後的勝者會與汪仔pk問答。汪仔在節目中能夠通過語音識別和圖像識別兩路通道接收問答題目,然後利用問答系統找到答案後,再通過語音合成技術播報答案。同時利用人機對話的技術和主持人、選手能夠有些簡單的交流,活躍現場氣氛。根據當前狀態的感知,汪仔還有一些簡單的肢體動作和表情。在今年一年內,大家每周都能在節目中看到搜狗汪仔的表現。從目前已播出的十幾期來看,搜狗汪仔以壓倒性的優勢戰勝人類,其中有一期是節目開播5周年慶,選手都是往年的冠軍選手,汪仔也較輕鬆地取得了勝利。從我們研發過程中,和選手的測試中也看出搜狗汪仔已經具備在這個競賽中戰勝人類的能力。

搜狗汪仔與IBM Watson 的區別

提到知識問答的人機大戰,大多數人首先想到的是IBM Watson,它在2011年參加了美國著名的知識問答節目《危險邊緣》,並戰勝了當時的人類冠軍。很多人都好奇搜狗汪仔與IBM Watson 的區別,這裡我們就通過分析汪仔與IBM Watson的區別來介紹汪仔背後的原理。其實兩者之間還有有非常多的差異的。

1. 語言的不同

這一點非常顯而易見。《危險邊緣》是美國的節目,使用的語言是英語;《一站到底》是中國節目,使用的語言是中文。中華文化上下五千年,語言的發展比文化的發展更悠久,在漫長的歷史長河中,語言不斷演進變化,成為非常複雜的一種系統。而所有做自然語言處理的研究者都清楚,中文的自然語言處理與英文還是有較大的差大的差別,無論是從語言的特點、詞法、句法上都有顯著的差異。在相同的任務上,例如詞法、句法的分析,中文集合上取得的性能通常都比英語集合上要低10%左右。即使使用深度學習這種端到端的處理方法,這種中英語言上性能上的差異仍然存在,足以說明中文自然語言處理的難度。而搜狗汪仔確實是使用中文的知識問答競賽中首個戰勝人類的機器人,而僅從語言的差異上可以說難度就比Watson參加《危險邊緣》要大。

2. 問題的輸入方式不同

Watson當時不具備語音識別、圖像識別的能力,所以參加《危險邊緣》時,節目組給Watson一個特殊的輸入,直接對Watson輸入文本。而搜狗汪仔使用的是人完全一致的輸入方式,即靠「聽」主持人念題和「看」題板,通過語言識別和圖像(特別是OCR)技術將其感知的語音和圖像轉換成文字後再處理。這一點首先體現了兩者所處的年代不同,隨著技術的發展,特別是深度學習技術的爆發,語音識別和圖像識別取得了重大的突破,才使得機器人在這方面取得了與人相當的能力。當然在一些嘈雜環境下,機器的識別能力與人還有差別。其次,由於語音識別和圖像識別是有一定的錯誤率的,識別的錯誤會導致問答系統接收到的問題就包含錯誤,這會進一步加大問答的難度。

3. 賽制的不同

這裡的賽制重點強調是否有「搶答」這個問題。《危險邊緣》中,賽制明確規定,只有主持人念題結束後,選手才能搶答,搶到者優先作答;但題目未結束就搶答會有相應的懲罰。也就是說是當題目完整以後,選手去爭奪回答問題的優先權。而大家都看到了,在《一站到底》中,只要開始念題,在任意時間點選手都可以搶答;而高手之間的較量,通常都在題目未完成之前通過推理出完整的題目並作答,比拼的是推理的時機和搶答的比例。所以,Watson一定是用完整的問題作答,而汪仔在《一站到底》的賽制下,具備根據部分題目推理全部題目並作答的能力。一方面題目的推理較難,另一方面推理的錯誤率會和問答形成級聯錯誤,進一步加大問答的難度。汪仔的搶答能力也是投入精力較大的一塊,從無到有,最終搶答比例甚至超過了人類冠軍。

4. 問題的範疇不同

《危險邊緣》中共有六類問題, 例如 歷史、科學、政治等,每個問題也有明確的所屬類別。相反,《一站到底》不限定任何的問題範圍,且每一題也沒有明確的所屬類別。可以說,《危險邊緣》是一種封閉域測試,而《一站到底》是一種開放域測試。同時,從技術實現來說,問題所屬的類別在Watson和搜狗汪仔中都屬於重要的信息,不同的是Watson是給定類別,而汪仔是自己計算得出類別。

5. 計算方式的不同

在我看來這點並不關鍵,但之前確實有不少網友從這個角度去比較汪仔和Watson,在這裡我也解釋說明一下。Watson 當時用了90台IBM Power 750的伺服器集群,並把它們搬到了節目現場,在獨立的區域網環境中使用。汪仔呢,語音識別、圖像識別和語音合成以及部分基於知識圖譜的問答是在節目現場完成,而基於搜索的問答是聯網後利用搜狗搜索的線上服務完成檢索後再計算的。這其中的原因更多是基於成本的考慮,汪仔將參加一年的節目,獨立的集群只為節目錄製服務,從成本上來說是很浪費的。但另一方面,公網鏈路的延遲、穩定性以及於商業系統共用的檢索服務對資源的搶佔都相對獨立的區域網集群服務帶來了很多工程問題,同時給搶答時間也帶來不少負面影響。因此,Watson的不聯網與汪仔的聯網,更多是成本的考慮。

6. 閑聊

搜狗汪仔在節目中還會展示自身的閑聊能力,活躍節目氣氛,這是Watson當時所不具備的。當然,閑聊機器人也是近年來有了長足的發展,和所處年代有關。除了通用的閑聊外,為了參加節目,搜狗汪仔也對節目的背景知識,例如主持人、選手、節目等等做了針對性的學習,這點也是和人類似的。

從知識問答看人機差異

這裡先簡單介紹搜狗汪仔的問答系統。主體來說,搜狗的問答系統從技術實現上分為兩大類:一是基於知識圖譜的KB-QA,另一個是基於搜索的Web-QA。這兩種方法在搜狗汪仔中均有使用,用於回答不同的題目。

KB-QA是將挖掘得到的知識利用知識圖譜(通常是三元組)表示、存儲,問答時利用sematic-parsing的技術將問題解析成結構化查詢語句,查詢知識庫並回答問題。這種方法是與人學習知識並運用知識回答問題相類似的,也是理想的機器問答的方式。但是受目前技術水平的限制,知識圖譜在完備性、時效性、推理、sematic parsing的實用性等問題還面臨較大挑戰,所以目前KB-QA能夠回答的問題還非常有限。

Web-QA是一種基於搜索的問答,利用全網無結構化信息,搜索與問題有關的所有信息(網頁、問答對、垂直知識庫等),並從相關信息中抽取精確答案。其中為了找到準確的相關信息及準確抽取相應答案,其中運用到了非常多的自然語言處理、檢索、語義匹配、信息抽取、機器學習等技術,且由於深度學習近來在文本上也取得了一些進展,所以在搜狗汪仔中深度學習的應用也非常廣泛,這點也與Watson有較大差別。Web-QA如果與人相比,有點像人的「死記硬背」,只不過機器的存儲和計算都比人要快很多。

可以看到汪仔背後的技術方案都可以在人的思考方式找到相同的地方,那麼機器和人對戰,勝算如何呢?這裡分兩個方面來分析。

1. 問答能力,即給定完整問題下,回答的精度與召回

在這個問題上,人的優勢在於理解能力強,有常識,掌握較完整的知識體系;劣勢在於單個人的知識面有限,且在競賽過程中人的情緒易受波動。相比之下,機器的優勢在於,存儲無窮,發揮穩定,但劣勢是語言的理解、推理差。

以Web-QA為例,它在搜索的基礎之上,又新增問題的理解和答案提取等工作。這件事對人來說很簡單,但對機器來說難度不小。 例如 「電視劇上海灘之中馮晉驍的人物原型是哪位上海灘流氓大亨?」 如果將問題作為查詢詞,搜索結果已經能夠返回較多的相關網頁,但如何從搜索結果摘要或網頁內容中直接提取出答案「杜月笙」這件事,對人簡單,正常的閱讀理解能力就行,但對機器則比較難。實事是機器很容易將答案誤回答為「黃金榮」,因為它也是上海大亨之一。

單個人他掌握的知識面是有限的,如果問題屬於人的知識盲區,那麼他即使完全理解這道題,但也完全不會回答,所以人欠缺的還是機器的存儲和檢索能力。例如對於問題「按照傳統,歷屆美國總統就職時會用手抵哪本書進行宣誓?」 可能絕大部分的人都知道答案,但對於問題 「唐代畫界有「韓馬戴牛」的說法,分別是指善於畫馬的韓乾和哪位善於畫牛的名家?」,掌握「韓馬戴牛」這個知識點的人來說可能就很少了。 但這兩個問題對於機器來說,可能難度相當。

另一方面,人的情緒波動也很有趣。在搜狗汪仔的研發工作中,曾經有幾次線下與人類高手的測試,其中有一位叫徐聖明的選手,是《一站到底》的歷史戰神,答題水平很高。我就發現,他與機器挑戰的過程中,如果他的比分暫時領先,他的狀態比較放鬆,往往也是坐著答題。但如果他的比分暫時落後了,他就比較緊張了,會下意識的由坐著改為站著,精神高度集中,答題的能力也相應增強。這都是人的下意識反應,不同狀態下有著不同的答題能力,而機器顯然是沒有這樣的情緒波動影響的。

2. 搶答能力

前面介紹《一站到底》的賽制中可以看出答題的速度是制勝的關鍵點,分兩方面,首先在獲取相同信息下答題的速度要快,其次,答題的時機要盡量提前,即答題所需獲取的題干信息越少越好。關於第一個問題,我們做了不少工程工作,包括網路速度,語音識別和圖像識別做流式增量識別,檢索速度優化等等,基本做到接收一段新的語音音頻(通常100ms左右一個語音包)後,可在200ms內完成一次問答,這個耗時人已經很難察覺出來了。然而考慮到人的正常語速,主持人大約1分鐘說120字,那麼說一個字耗時500ms,所以如果能夠提前對手1個字推理出問題並作答則具有絕對的優勢。所有在汪仔的研發過程中利用儘可能少的信息去回答問題是一個重要挑戰。

人和機器在推理上的能力也有著很大的差異,印象很深刻的是,人機測試中問題「鹿鼎記中哪那種毒藥鹿鼎記中哪那種毒藥讓瘦頭陀變得身材臃腫非常矮小?」,當時人類選手非常快的正確回答「豹胎易筋丸」,而機器卻要慢一些。為什麼呢? 後來在與選手交流過程中得知,選手具備一個背景知識,即鹿鼎記中只有一種毒藥,所以當題目念到「鹿鼎記中哪那種毒藥」這裡,人就可以推理出答案正確作答了。這種背景知識的獲取和推理對機器來說還是非常之困難的。還有一個有趣的現象也反應人類思維的模式,即考詩詞的上下句。經過多次測試,我們發現,如果給定詩詞上句,考下句,通常人回答較快,基本是直覺反應,非常快;而反過來,如果給定下句考上句,人就需要相對長的時間來反應,而機器能夠穩定作答,則勝出。

通過多種演算法和工程的優化,在《一站到底》的設置下,搜狗汪仔答題的精度約為90%,召回約為90%,而歷史人類冠軍,答題精度相當約為90%,而召回約70%。有趣的是,根據Watson的公開資料,Watson當時的精度召回約為90%和70%,它也戰勝了當時的人類冠軍。可以看出幾年過去了,人類在不同的語言環境下答題能力相當,變化不大;而機器,由於技術的不斷發展,機器的能力又取得了長足的進步,未來同樣值得期待。

搜狗汪仔的」大夢想」

搜狗汪仔在節目中已經亮相了,從能力來說,汪仔對《一站到底》這種特定形式的問答已經具備了超過人類的水平。未來,汪仔還將開啟一些新的能力,例如看圖題、音頻題等等,我們也還將繼續加強汪仔的理解、推理能力。但這些遠遠還不夠。可以說搜狗汪仔參加《一站到底》是對搜狗的AI技術的一次集中展現,向觀眾展示了我們具備這樣的能力。但回到現實中,《一站到底》並不是用戶的真實需求,對人對機器,都僅是能力的一種展現。搜狗在人工智慧戰略中,一直在思索和追求的是,如何利用將人工智慧的技術落地去做出一些有用的產品,而結合搜狗的兩大核心業務搜索和輸入法,我們堅持不懈的利用最前沿的技術去打磨產品,從而給用戶帶來更好的服務。

搜索引擎已經成為人們獲取信息、知識的一個最重要的工具,審視用戶使用搜索引擎的過程,其中還有不少需要突破的地方,我們認為變革的核心是 「從搜索到問答」。 主要兩方面:

首先,問題的變革。目前用戶提交給搜索引擎的查詢請求仍以關鍵字為主,這是長期以來受技術能力的限制,用戶和搜索引擎之間的形成的一種默契,因為在早期關鍵字往往能夠得到比自然語言問題得到更好的搜索結果。隨著相關技術的突破,未來用戶將更多的使用自然語言問句,人與搜索引擎的交互將逐步走向人與人之間的交流方式,特別是在移動、語音交互的場合。

其次,答案的變革。從搜索引擎誕生的第一天起,搜索引擎返回的「答案」的一直是若干條結果的鏈接,這就需要用戶人工閱讀一條或多條搜索結果(網頁),並人工整理出答案。所以嚴格地說,現在的搜索引擎並沒有返回答案,答案的獲取是採用「人機結合」的方式得到的,即機器負責在全網信息中找到儘可能準確和多的相關信息,而由人來最終判斷出準確的答案並為人所用。這種人機結合的方式顯然是不高效的,特別是在移動環境下,尤其是屏幕小或沒有屏幕的情況下。搜狗汪仔已經在《一站到底》的特定環境下,實現了直接給出答案,但用戶在搜索引擎中的真實需求更加口語化、更加開放、情況更加複雜,所以在真實的搜索引擎中能夠針對用戶的自然語言問題直接給出答案面臨著巨大的挑戰,這也正是搜狗搜索正在努力的方向。

目前較熱門的個人助理方向也有相似之處。縱觀目前個人助理落地較多的應用有兩種:一是命令的執行,與OS結合能夠完成一些操作,例如打電話、上鬧鐘等;與垂直領域相結合,能夠完成一些服務,例如訂機票、打車等。我把這種類比為「秘書」,更多是執行用戶的命令,而談不上交流。第二種則是情感陪護的閑聊,它能夠於用戶進行一定程度的情感的交流,但針對特定的問題幾乎不能提供正確的知識與信息,例如北京市長、大學申請條件等等。我把這種交流只有感情而為是想的交流,類比為「蜜月期」,大多數人群對這種交流的需求有限。那麼,人與人之間更多的交流是什麼呢?我想最多的應該是人與自己的親人、朋友、同事之間,就他們所關心的事件、知識、經驗所進行的探討,它一定是有信息和知識來支撐的,其中除了情感維護,還有很多思想的碰撞與交流。用全網的信息與知識支撐的,能夠與用戶進行自然交互地問答,而真正成為人類的「良師益友」,這正是搜狗汪仔背後的「大夢想」。吾將上下而求索!


其實Watson的理念是公開的,就是不停的加權,理論上只要跑得足夠多就能找到近似最好的解,而搜狗的那玩意....就是個Google now啊...那不配叫人工智慧吧,除非搜狗在那裡面加了料(負面意義的

(對Watson的理解看了不少paper和research,搜狗就看了一篇看到聯網就扔了


表示一看它我就想到多年前那個什麼交通銀行機器人,完全只是後台有個人聲然後變聲後傳回來,也就是一個對講機,所以難道沒人覺得這貨是背後人為操控的?至少有一部分我覺得是很劇本的,感覺人類本身都不會那麼說話,我覺得並不是純人工智慧行為。如果人工智慧在中國已經能像這樣了,那17年的人工智慧參加高考,在主觀題評分老師不是坑的情況下,還需要什麼爭取考重點???爭取考北大????(黑人問號臉)


NLP這一領域,每個細分步驟都有很多的挑戰,並不是一蹴而就的事情。簡單做一個聯網的聊天機器人和QA系統,基於現有平台工具,分分鐘做一個。但是在細分領域,不斷提升哪怕幾個百分點都是很難的事情。

行業解決方案,除了行業數據的積累,還有很多基礎性工作,比如醫療行業的各類專業名詞,層次網路等等。大公司有先發優勢,也有基礎公關和摸索的挑戰。後期之秀可以站在前人基礎上,更快的在一個點上突破。人工智慧是一個很大的課題,還需要很多很多的投入和研究。


推薦閱讀:

為什麼那麼多人關注李世石與 AlphaGo 的圍棋比賽?比賽結果意味著什麼?
如何看待《最強大腦》第四季第三期人機大戰中不敗戰神王昱珩慘敗,最終一個也沒答對?

TAG:人工智慧 | 沃森IBM | 搜狗 | 一站到底電視節目 | 人機對戰 |