AI首次實現與人類辯論,IBM ProjectDebater真正想突破的是什麼?
來自專欄智能進化論4 人贊了文章
作者|進化君
出品|智能進化論
導讀:AI在許多特定領域已經超越人類,比如人臉識別、圖像識別、打遊戲、下圍棋等等。但是將AI帶入辯論領域還是頭一回。當AI具備邏輯推理能力,未來當我們面臨複雜問題難以決策時,聽聽AI的意見是個好主意。
2000多年前,以邏輯辯論聞名的蘇格拉底被認為是有史以來最有智慧的人類之一。現在,人工智慧正在嘗試辯論這一人類最具智慧的行為。
美國時間 6 月 18 日,首個能與人類進行複雜辯論的AI系統IBM Project Debater在舊金山與人類辯論高手展開了兩場公開辯論比賽。在事前對辯論主題沒有任何準備的情況下,AI系統不僅可以清晰表達自己觀點,反駁對方論點,還一度比較準確地指出了對手所犯的事實錯誤。
AI VS 人類的首場公開辯論賽現場
與人類高手現場PK,AI辯手表現如何?
「對方辯友的另一個觀點是,還有比太空探索更重要的事情值得投入資金。指出有更重要的事情值得花錢,這很容易。我們並沒有稱太空探索是列表上唯一值得資助的項目。……(自主太空探索)將激勵我們的孩子們尋求在科學、技術以及數學領域獲得教育和職業發展。」
這段邏輯清晰的表述,是AI系統IBM Project Debater(以下簡稱Debater)在「是否應該資助太空探索」主題下的反駁辯詞。
與她對戰的是兩位青年辯論高手,一位是以色列大四女生Noa Ovadia,她曾在2016 年獲得以色列國家辯論冠軍,另一位是以色列國際辯論協會主席 Dan Zafrir。兩場辯論分別有三個固定環節:4 分鐘陳述自己論點,4 分鐘反駁對方論點,2 分鐘總結陳詞。現場觀眾通過投票支持各方觀點。
IBM Project Debater(左)與人類辯手Noa Ovadia
據悉,現場觀眾中大部分是媒體記者和分析師。他們認為,雖然整體來看,人類辯手的表達更好,但AI辯手傳遞信息量的豐富度則優於人類。
而且,Debater已經證明了自己觀點的說服力:在主題為「是否應該增加使用遠程醫療」的辯論中,Debater最終使現場觀眾中的20個人改變了最初的觀點。
除了基於邏輯的辯詞,Debater還很幽默,比如:「今天有許多利害攸關的事情,對我來說尤其如此」,但自己不能「熱血沸騰」,因為「我沒有血液」。
IBM的研究人員透露,除了一段簡短介紹,Debater 的任何論點都沒有經過預先安排。也就是說,Debater可以在沒有針對性訓練的情況下,對任何觀點性開放性主題進行辯論。
Debater是如何做到能言善辯的?
今天的AI辯手Debater,其實是IBM 6年前一項研究的初步成果。
2011年,Watson在著名益智問答節目《危險邊緣》(Jeopardy!) 中獲勝,標誌著AI在答題方面超越人類。此後,IBM 研究人員對Watson的人工智慧技術進行了評估,以確定下一個挑戰目標。
IBM 以色列海法實驗室的研究人員 Noam Slonim最早提出希望設計一個能夠與人類辯論的人工智慧系統。2012年他和同事們正式開始了Debater系統的研發。
IBM Project Debater 的兩位研究人員Noam Slonim和Ranit Aharonov
辯論的本質不是衝突和競爭,而是民主和討論。辯論不僅能從正反多方面思考問題做出決策,還能幫助人們理解和學習別人的觀點。辯論對於沒有經過訓練的普通人有一定難度,對人工智慧來講更是挑戰巨大。要做到這些,Debater需要具備三大核心能力:
1. 數據驅動的演講稿撰寫與表達。Debater 第一次證實了,計算機能夠理解大量語料庫,若給定一個有爭議的主題的簡短描述,它能夠撰寫結構良好的演講內容,並清晰且有針對性地表達出來,甚至還會適時地展現幽默風趣。
2. 聽力理解。能夠識別長段連續口語中隱含的重要概念和觀點。
3. 模擬人類困境。通過獨特的知識表達方式來模擬人類爭議和困境,使系統能夠根據需要提出有原則的論點。
IBM Project Debater(左)與人類辯手Dan Zafrir
簡單地說,拿到辯題後,Debater首先會分析單個辯論問題,然後掃描龐大的語料庫文檔,包括維基百科和主流報刊新聞等,通過演算法找出與辯題相關性最高的觀點性內容,同時通過演算法減少重複信息。
在此基礎上,Debater會挑選出最有說服力、最具多樣性和支持最完善的論點,並對這些論點進行編排,從而形成一段完整且有說服力的敘述。
強大的語料庫是Debater展開辯論的基礎。據悉,訓練Debater的語料庫擁有3 億多個可靠信息來源,包含 2011 年以來全球商業、法律、學術和政府機構等領域的專業人士所使用的主流報紙和雜誌中的文章(以及維基百科)。利用語料庫,Debater可以將構建辯論框架,並通過引用語料庫中的內容作為論點支撐素材。
目前,IBM還將Debater訓練用的幾個基準數據集免費開放,目前已經有近 1,000 次下載。數據集包括19,276 對根據可讀性打分的維基百科詞條、5,000 個帶有情感注釋的習語、3,000 個帶注釋的句子、2,394 個關於 55 個話題的分類論點、60 篇專業辯手關於爭議性話題的演講稿等等。
會辯論的AI,能夠幫我們做什麼?
相比更熱門的人臉識別、棋藝比拼或電腦遊戲,辯論是一個全新的AI應用場景,此前還沒有公司將AI帶入這一領域。日常生活中,辯論的場景似乎並不經常出現。那麼,IBM為什麼選擇了這個研究方向?辯手AI對我們的生活將產生什麼影響?
據稱,IBM研發Debater的初衷,是為了通過中立的辯論幫助人們拓展智力(expand human minds through impartial debate),最終幫助人們更好地做出決策。
從這個意義上,雖然Debater不能直接以產品形式落地應用,但其應用範圍比人們想像的要廣泛得多。IBM以色列海法辯論技術團隊經理拉尼特·阿哈羅諾夫(Ranit Aharonov)說:「很明顯,這樣的技術與任何需要做決策的事情都有關係。」
與打遊戲、下棋這些有著固定規則的場景不同,辯論賽有廣泛的議題,而且辯論議題往往具有一定的複雜性開放性,沒有正確與錯誤之分,這點與現實世界非常相似。現實世界之所以複雜,正是因為大多數問題不是簡單的非黑即白。
IBM 負責AI的副總裁 Dario Gil 接受《財富》採訪時表示,「儘管遊戲可能很複雜,但你最終處在一個獨立封閉的體系中,有一些規則需要遵守。將人工智慧引入一個開放性問題領域非常有趣。」
在辯論中,Debater可以選擇正反兩方任何一方的觀點進行論證。這種中立的、更全面的視角,能夠幫助人們越過思維盲區,重新發現此前容易忽視的角度。同時,龐大的語料庫讓Debater為決策提供了更多有價值的信息,這些信息對於制定決策往往起到關鍵作用,比如人們此前並不了解的事實性知識。
IBM稱,未來Debater的基礎技術將在 IBM Cloud 和 IBM Watson 中商業化,該技術可應用於從教育到法律、從政府到企業等多種領域。比如,通過能夠進行辯論的人工智慧系統,老師可以用來培養學生的獨立思考能力,銷售團隊和辯護律師可以來鞏固他們的觀點,增強說服力,而企業決策者也可以從 Debater 產生的贊成和反對意見中受益。
Debater的真正目的:讓AI真正掌握人類語言
IBM把Debater列為繼1997年深藍戰勝國際象棋冠軍卡斯帕羅夫、2011年Watson 在《危險邊緣》(Jeopardy)中戰勝人類選手之後,在AI領域最新一個里程碑式的突破。
IBM稱,讓Debater學會辯論的真正目的在於,讓AI系統地掌握人類語言。自然語言理解非常複雜且高難度,也是AI科學家一直想突破的下一個邊界。藉由達到更高難度、更複雜信息、持續更長時間的自然語言理解水平,未來AI可能做到像人一樣具備真正的邏輯推理能力。
Debater系統能夠針對複雜話題進行更長時間的聽和理解,並進行連續性的演講,最長可持續4分鐘。聽懂複雜辯論內容、快速構建邏輯表達以及模擬人類在辯論中的兩難境地,Debater的這些能力已經超越了簡單的自然語言理解,而是有更深層的AI能力在支撐。
據悉近年來IBM在AI領域的探索聚焦在更高級的自然語言處理(NLP)、深度學習和推理等方面。2014年至今,IBM已經在這三大領域累計發表了30+篇權威學術論文。
IBM副總裁Dario Gil表示:「放眼該領域,它將超越信息檢索,進入到一種真正的推理模式 - 創作語言(composing language),從而給出我們從未見過的答辯。人工智慧要展示自己、並真正實現自己的潛力,它必須置身於人類所處的紛雜的世界中。」
本文為「智能進化論」原創作品,歡迎關注。
交流合作請加進化君微信:abcde363636
智能進化論是專註人工智慧領域的科技新媒體。目前已入駐微信公眾號、今日頭條、百家號、一點資訊、雪球TMT、知乎專欄、天極自媒體、界面、搜狐號、網易號、企鵝號、大魚號、騰訊看點號等十餘家自媒體平台。
進化君,資深營銷人、媒體人,專註人工智慧領域科技評論。希望用思想和文字陪伴你讀懂智能時代。
推薦閱讀:
※一文讀懂如何用LSA、PSLA、LDA和lda2vec進行主題建模
※英偉達官方解讀:Volta Tensor Core GPU實現AI性能新里程碑
※人腦是數字化世界裡最後一台模擬設備
※通用智能系統框架討論-人工智慧、神經網路與腦科學
※你應該選擇哪種領先的人工智慧課程?選了後怎麼學?