智能時代的怪獸四:語言的運算(下)

B、愛情誓言

愛情誓言中最常見、最經典的一句話是:我愛你!這句話可能是人類語言中意義最複雜、邏輯最不合理,感覺卻最為高大上的一句話。雖然沒人知道「愛」的定義,但是關於愛情的故事卻鋪天蓋地,關於愛情的「公理」卻盡人皆知,總結起來至少有如下三條:

(1)我愛你=我永遠愛你。

(2)我愛你=我最愛你。

(3)我愛你=我任何時候都愛著你。

實際上就是三個關鍵詞:永遠、最、任何,這是愛的三個條件,這三個條件是不需要證明的,因為它是「公理」。

在人類的語言中「永遠」一詞是經常使用的,「永遠」的字面意義就是無限長的時間,「無限」在人類大腦中實際上是無法計算的虛設概念,因為人類的生命是極其有限的,一個人的全部時間叫做:一輩子。我們假設有四個男生追求同一個女生,分別向她表白。

甲說:我永遠愛你(這是個無法計算的假設,而且只是「我愛你」的同義語,沒有任何新意,很難打動女生,估計甲是位憨厚的男生。)

乙說:我愛你一萬年(這是個可以計算的假設,比「永遠」好。)

丙說:我愛你一輩子(這是一個人真實的極限,這個「一輩子」比「一萬年」好理解,不用花費力氣去計算。)

丁說:我愛你,因為我上輩子就愛過你,下輩子我還愛你。你我緣分已定:我只能愛你三生三世!(這是一個簡單的假設數學題:3>1,這個男生很滑頭,難道是傳說中的撩妹高手?)

接下來再看「最愛」的問題,這裡面有兩個意思:一是在所有可愛的人中我最愛你一個(我選擇你);二是在所有能愛你的人中我是最愛你的那一個(請你也選擇我)。這是一個指定範圍內搜索最大值的運算,可問題是所謂「愛情」是超越所有範圍的。愛情比「以太」還神奇,充滿了宇宙已知與未知的空間。談戀愛的人會認為:愛情大過天,大過世界大戰。因為在愛情的戰場上,你的情敵不只有人類,還可能是頭猛獸(美女與野獸、金剛?)、某個聊天程序(Her/雲端情人?)、實體機器人(特別是硅膠外表、帶語音、成人專用的那種)、外星人(來自星星的你?)等。在無限的範圍內進行搜索相當於計算機陷入無限循環,只能死機,但實際上大腦並不會這樣,因為大腦只會搜索自己的那個小知識庫(記憶),保證不會死機。有見多識廣的女生,也有孤陋寡聞的女生,但總的來說隨著年齡的增長,知識庫肯定會隨之增長,所以有時候年長的女生比年輕的女生反而更難追求,因為她的搜索範圍廣、搜索次數多,最後甚至會對這種搜索演算法的本身都產生懷疑了。

最後再看看「任何」這個詞,它表示的是:任何時候或任何情況。也就是在各種動態變幻的條件下,保持某個信念不變。這意味著不管遇到什麼困難(比如不懼死亡的威脅、不惜花費金錢、不惜花費時間等)都保持不變,這種信念其實就是一種信仰。有關於宗教的信仰,有關於愛情的信仰,有關於科學的信仰,還有關於某種政治制度的信仰。這些信仰之所以能夠存在,其原因在於人類大腦可以理解與運算「任何」這個詞。

「不管你在哪裡,我都要找到你!不管多麼困難,我都要救你出來!」——這就是任何地點、任何情況的意思,但不代表所有地點、所有情況。這話說起來很感人卻執行不了,因為對於「所有地點、所有情況」這種虛設概念是無法運算的。轉化到行為人的實際意義是:將搜索運算的循環控制條件放寬,至於放寬多少,因人(演算法)因時(數據)而異。而且只是承諾放寬,不是立即、已經放寬,更不是允許無限循環。

「我們決不容許任何人、以任何方式分裂國家。」——這裡的「任何人」雖然有「所有的人」之意,但我們思考時不會去把所有人想一遍。我們首先想到的是正在策劃或實施分裂國家活動的人;接著是準備參與或有可能參與分裂國家活動的人;然後是對分裂國家活動持贊同態度的人;最後是明確反對分裂國家的人;其他與此事相關度不高的人,可以忽略。同樣這一句話,在不同的人聽來有不同的意義。如果是一位對時事動態不太關心的人,他覺得自己的生活很安穩,沒見過什麼人要去分裂國家,所以這話只是一句套話,沒什麼實際意義。如果是一位對國家形勢有全面了解的人,他就會想到對於分裂國家首要的危險人物是哪些人,「任何方式」又是指哪幾種最可能的方式。如果是對分裂國家持贊同或默許態度的人又不一樣,他感覺到的是自己面臨的風險,以及重新評估形勢的必要性。

「假設直線A與直線B是平行的,則任何直線C,只要其與直線B平行,必與直線A也平行。」——這是歐氏幾何的推理風格,只要前提是確定的,則推論必然正確,這裡的「任何直線」是指除A、B之外的所有直線。這種純粹的邏輯推理對於人類來說是一種進步,可以使思維與推論更規範、更高效,但是對於理解人類語言所表達的價值內涵(語義)則幫助不大,如果想依靠這種辦法實現自然語言理解,只能是水中撈月。早期的人工智慧專家許多都採用這種思路(又稱為符號主義),例如:西蒙和紐厄爾,開始他們很有信心,後來一深入才發現很難弄下去,做的「專家系統」卻不懂常識。明斯基則不同,他採用神經網路漸近學習的思路(又稱為連接主義),後來在大數據時代總算開花結果,在圖象識別、語音識別方面表現不錯,但對語義的分析和理解方面始終未有大的進展,這是一個根本性難題!

語義的理解是一種複雜的運算,本質上應該是能用計算機模擬的。嚴密的符號邏輯推理,這一西方學界擅長的方法幾乎已經發揮到了極致;基於大數據的「深度學習」方法目前方興未艾,它本質上是一種務實的數據分析與演算法設計,這種方法正是中國傳統數學長期堅持的解決問題的思路,這種思路已由中國數學家吳文俊等人發掘整理,並通過實踐取得了初步的創造性成果。

現在,我們需要一次新的思想融合,就像萊布尼茨所設想的那樣,綜合中西方文化的精華,創造一個新的關於邏輯與思維的理論和工具。這個工具在我看來,不但可以指導人工智慧的研發,還可以更新很多科學領域的研究方法以及關於「系統」問題的認識。


推薦閱讀:

自然語言處理中的Attention Model:是什麼以及為什麼[一]

TAG:自然语言处理 | 爱情困惑 | 爱情故事 |