智能時代的怪獸四:語言的運算(上)

第4節 語言的運算

前面我們談到了廣義系統論觀點,所有事物都可視為系統。

我認為:系統的輸入與輸出(反饋)如果形成邏輯對應關係,則可稱之為邏輯運算系統(智能系統);如果僅為物理能量對應關係則是物理運算系統(簡稱物理系統)。物理系統的研究是基於實際測量的連續值,這些數基本都是無理數,對於無理數當然不存在能測準的問題,所有測量都是求近似值。比如測量一枚硬幣:它的直徑、周長、體積、質量,沒有一個絕對準確的數值,只有近似值;但如果計算拋硬幣的結果是正面還是反面,各出現多少次,這就可以準確記錄了,因為這是一個邏輯值。邏輯值可以用有理數表示,是一些離散的量。

物理環境在人類的感觀中都是一些連續量,但人類能真正理解並掌握的只有離散量,連續量只是人們的一種物理錯覺。人類通過發明語言文字這一邏輯系統,可以巧妙地使用一些實際上無法掌握的連續量、無限等概念。計算機尤其善於快速處理各種離散量,或者說計算機目前只能處理離散量,對於連續量甚至都不知道該如何表示。這是一個很大的缺點,也是人工智慧遲遲未能突破的原因之一。

至於我們生存的這個宇宙,本質上到底是基於人類難以理解的連續量,還是基於人類容易理解的但極其微小的離散量(比如量子),這是一個深奧的問題,我們暫且不去討論。

下面,我們來研究一下人類自然語言中的一些常見的但不合理的概念,主要是兩個誓言的例子,因為誓言一般來說是態度鄭重、意義明確的。

A、總統就職宣誓

美國總統就職時,當選總統一般是手按《聖經》宣讀如下誓言:「我謹莊嚴宣誓,我必忠實執行合眾國總統職務,竭盡全力,恪守、維護和捍衛合眾國憲法。」

先看「竭盡全力」,這是當選總統向民眾表達一個態度,意思是積極作為、不偷懶。但是人總要吃飯、睡覺、上廁所,沒人要求總統不吃不喝24小時為國家工作,比如中國前總理周恩來大概是人類領導人勤勞工作的極限,每天工作長達20個小時是經常的事,這遠遠超出了民眾的要求。所以「全力」的說法,是一種模糊的邏輯,這種模糊對說者是有利的,同時聽者也會感到滿意。但模糊邏輯或模糊運算對於計算機是個問題,雖然已經有一些關於模糊運算的理論和方法,可是還很不完善。

更重要的關鍵詞是「忠實執行」。總統的任務是要儘力維護全國人民的利益,這個貌似沒有問題,一個國家人口數量是有限的,而且數量是整數,容易計算。但國民之間的利益經常是有矛盾的,維護A的利益就要損害B的利益,所以一個總統再怎麼努力,也只可能讓多數人而不是全部人滿意。現在,我們先不考慮這些利益之間本身是否存在矛盾,假設它是一個和諧的體系。但是請注意,國家利益是全方位的,有各種各樣的利益,政治利益、經濟利益、安全利益、環境和健康利益等等,而且國家利益這個東西很重要,任何一點也不能放棄。一旦被民眾知道:總統忽略甚至放棄了某項國家利益,這是十分嚴重的事情。可是,人們很容易忽略一個關鍵的問題:全方位的利益本身是一個連續的事物或一個連續的區間,而忠實執行就是要100%準確地複製這個連續事物,但是連續的事物至少對於現在的人類來說是難以掌握的,也是無法複製的。

萊布尼茨說過:世界上沒有兩片完全相同的樹葉。那任選一片樹葉,我們能否完美的複製它呢?顯然不行,我們人類無法準確複製任何物理實體,哪怕是一塊石頭。就算是央行發行的鈔票或標準黃金條,每一張、每一塊都是高度模仿,而不是複製——能夠複製的只有邏輯。

備註:最近幾年關於「量子隱形傳態」的研究似乎要駁倒我的上述論斷,尤其是中國科技大學的潘建偉團隊在量子通信和量子計算機的研究方面有許多進展。一般認為量子(實驗中用的是光子)之間除了運動狀態外其他(量子本身)並無差別,而實現了量子運動狀態的精確傳送與再現,就等於複製了量子。這裡面有二個疑問,一是量子運動狀態有哪些,是否全部準確的傳送了?二是量子在本質上是離散量還是連續量?

既然如此,那還存在「客觀反映外部世界」這回事嗎?我們都聽說過:一千個讀者眼裡有一千個哈姆雷特,人類的眼睛經常是不可靠的,而且是帶有主觀色彩的,那照相機或攝像機可靠嗎?

現在假設你跟一位電影攝像師在觀察同一片樹葉,你看到的內容跟攝像機膠片拍攝到的內容肯定有差別,這是所謂主觀與客觀的差別。但電影膠片的記錄未必一定客觀,一般電影膠片以24幀每秒的速度記錄畫面,當發生時長為0.01秒的事件它能記錄到嗎?你可以換用高速攝像機,比如速度高達25600幀每秒的攝像機,但對於短暫的電子現象這是徒勞的,即使是速度驚人的激光脈衝成像也有極限,無法追蹤到連續的「任意時刻」。你可以說:我認為電影膠片足夠清晰、足夠連續了,但它是可以複製的啊!沒錯,電影膠片是可以做拷貝,但不能100%準確的複製,每一份膠片拷貝都一定有差異,只有數字化的電影內容才能做到100%準確複製,因為所有數字化內容都是基於離散的邏輯值。

所以,總統面對維護全方位的國家利益這個任務,必須打折才能執行,各種100%完成任務的說法都是不嚴肅的,因為100%等於無限多的甚至有矛盾的任務,這在有限的時間內是不可能完成的。參考小學生的考試成績評分,可以認為完成60%的任務就是合格的(如果參照數學上的黃金分割比例則是61.8%)。實際上由於社會的多元化,人們的利益也多元化,執政滿意度超過50%就算不錯了,超過60%堪稱良好,比如現任美國總統特朗普的執政滿意度在上任100天時約為41%;如果一個總統的執政滿意度長期超過80%,要麼這個總統真的非常優秀,要麼這個國家的民眾還比較單純、利益關係不太複雜,又或者二者兼而有之。

因此,總統就職宣誓可改為如下更容易理解、更合邏輯的內容:

我宣誓要維護至少60%的國家利益,我要比60%的民眾更勤勞工作,以保衛至少60%的憲法。

推薦閱讀:

cs.CL weekly 2016.08.29-2016.09.02
Word2Vec如何解決多義詞的問題?
《Improving Document Clustering by Eliminating Unnatural Language》閱讀筆記
為什麼word2vec出來以後,大家還在用distributional hypothesis找近義詞?
Galactic Dependencies依存關係數據集+細粒度語言類型學預測 | 實錄·PhD Talk

TAG:人工智能时代书籍 | 计算语言学 | 自然语言处理 |