淺談人工智慧:現狀、任務、構架與統一(下) | 朱松純

淺談人工智慧:現狀、任務、構架與統一(下) | 朱松純

來自專欄風雲之聲16 人贊了文章

(接中篇)

第十節 機器學習:學習的極限和「停機問題」

前面談的五個領域,屬於各個層面上的「問題領域」,叫Domains。我們努力把這些問題放在一個框架中來思考,尋求一個統一的表達與演算法。而最後要介紹的機器學習,是研究解決「方法領域」(Methods),研究如何去擬合、獲取上面的那些知識。打個比方,那五個領域就像是五種釘子,機器學習是研究鎚子,希望去把那些釘子錘進去。深度學習就像一把比較好用的鎚子。當然,五大領域裡面的人也發明了很多鎚子。只不過最近這幾年深度學習這把鎚子比較流行。

網上關於機器學習的討論很多,我這裡就提出一個基本問題,與大家探討:學習的極限與「停機問題」。

大家都知道,計算機科學裡面有一個著名的圖靈停機Halting問題,就是判斷圖靈機在計算過程中是否會停下了。我提出一個學習的停機問題:學習應該是一個連續交流與通訊的過程,這個交流過程是基於我們的認知構架的。那麼,在什麼條件下,學習過程會終止呢?當學習過程終止了,系統也就達到了極限。比如,有的人早早就決定不學習了。

首先,到底什麼是學習?

當前大家做的機器學習,其實是一個很狹義的定義,不代表整個的學習過程。見下圖。它就包含三步:

(1)你定義一個損失函數loss function 記作u,代表一個小任務,比如人臉識別,對了就獎勵1,錯了就是-1。

(2)你選擇一個模型,比如一個10-層的神經網路,它帶有幾億個參數theta,需要通過數據來擬合。

(3)你拿到大量數據,這裡假設有人給你準備了標註的數據,然後就開始擬合參數了。

這個過程沒有因果,沒有機器人行動,是純粹的、被動的統計學習。目前那些做視覺識別和語音識別都是這一類。

其實真正的學習是一個交互的過程。就像孔子與學生的對話,我們教學生也是這樣一個過程。 學生可以問老師,老師問學生,共同思考,是一種平等交流,而不是通過大量題海、填鴨式的訓練。坦白說,我雖然是教授,現在就常常從我的博士生那裡學到新知識。

這個學習過程是建立在認知構架之上的(第六節講過的構架)。我把這種廣義的學習稱作通訊學習Communicative Learning,見下圖。

這個圖裡面是兩個人A與B的交流,一個是老師,一個是學生,完全是對等的結構,體現了教與學是一個平等的互動過程。每個橢圓代表一個腦袋mind,它包含了三大塊:知識theta、決策函數pi、價值函數mu。最底下的那個橢圓代表物理世界,也就是「上帝」腦袋裡面知道的東西。上面中間的那個橢圓代表雙方達成的共識。

這個通訊學習的構架裡面,就包含了大量的學習模式,包括以下七種學習模式(每種學習模式其實對應與圖中的某個或者幾個箭頭),這裡面還有很多模式可以開發出來。

(1)被動統計學習passive statistical learning:上面剛剛談到的、當前最流行的學習模式,用大數據擬合模型。

(2)主動學習active learning:學生可以問老師主動要數據,這個在機器學習裡面也流行過。

(3)演算法教學algorithmic teaching:老師主動跟蹤學生的進展和能力,然後,設計例子來幫你學。這是成本比較高的、理想的優秀教師的教學方式。

(4) 演示學習learning from demonstration:這是機器人學科裡面常用的,就是手把手叫機器人做動作。一個變種是模仿學習immitation learning。

(5)感知因果學習perceptual causality:這是我發明的一種,就是通過觀察別人行為的因果,而不需要去做實驗驗證,學習出來的因果模型,這在人類認知中十分普遍。

(6)因果學習causal learning:通過動手實驗, 控制其它變數,而得到更可靠的因果模型, 科學實驗往往屬於這一類。

(7)增強學習reinforcement learning:就是去學習決策函數與價值函數的一種方法。

我在第一節談到過,深度學習只是這個廣義學習構架裡面很小的一部分,而學習又是人工智慧裡面一個領域。所以,把深度學習等同於人工智慧,真的是坐井觀天、以管窺豹。

其次,學習的極限是什麼?停機條件是什麼?

對於被動的統計學習,文獻中有很多關於樣本數量或者錯誤率的上限。這裡我所說的學習的極限就遠遠超越了那些定義。我是指這個廣義的學習過程能否收斂?收斂到哪?學習的停機問題,就是這個學習過程怎麼終止的問題。就這些問題,我和吳英年正在寫一個綜述文章。

我們學習、談話的過程,其實就是某種信息在這些橢圓之間流動的過程。那麼影響這個流動的因素就很多,我列舉幾條如下。

(1)教與學的動機:老師要去交學生一個知識、決策、價值,首先他必須確認自己知道、而學生不知道這個事。同理,學生去問老師,他也必須意識到自己不知道,而這個老師知道。那麼,一個關鍵是,雙方對自己和對方有一個準確的估計。

(2)教與學的方法:如果老師準確知道學生的進度,就可以準確地提供新知識,而非重複。這在algorithmiclearning 和 perceptual causality裡面很明顯。

(3)智商問題:如何去測量一個機器的智商?很多動物,有些概念你怎麼教都教不會。

(4)價值函數:如果你對某些知識不感興趣,那肯定不想學。價值觀相左的人,那根本都無法交流,更別談相互傾聽、學習了。比如微信群裡面有的人就待不了,退群了,因為他跟你不一樣,收斂不到一起去,最後同一個群的人收斂到一起去了,互相增強。這在某種程度上造成了社會的分裂。

這個學習條件的設定條件不同,人們學習肯定不會收斂到同一個地方。中國14億人,有14億個不同的腦模型,這14億人中間,局部又有一些共識,也就是共享的模型。

我說的停機問題,就是這個動態過程中所達成的各種平衡態。

第十一節 總結:智能科學 --- 牛頓與達爾文理論體系的統一

到此,我摘要介紹了人工智慧這六大領域的一些前沿問題,希望幫助大家看到一個大致的輪廓與脈絡,在我眼中,它們在一個共同的認知構架下正在走向統一。其中有很多激動人心的前沿課題,等待年輕人去探索。

那麼人工智慧這六大領域、或者叫「戰國六雄」,如何從當前鬧哄哄的工程實踐,成為一門成熟的科學體系呢?從人工智慧Artificial Intelligence變成 智能科學Science ofIntelligence,或者叫 Intelligence Science,這個統一的科學體系應該是什麼?

什麼叫科學?物理學是迄今為止發展最為完善的一門科學,我們可以借鑒物理學發展的歷史。我自己特別喜歡物理學,1986年報考中科大的時候,我填寫的志願就是近代物理(4系)。填完志願以後,我就回鄉下去了。我哥哥當時是市裡的幹部,他去高中查看我的志願,一看報的是物理,只怕將來不好找工作,他就給我改報計算機。當時我們都沒見過計算機,他也沒跟我商量,所以我是誤打誤撞進了這個新興的專業,但心裡總是念念不忘物理學之美。

等到開學,上《力學概論》的課,教材是當時常務副校長夫婦寫的,我這裡就不提名字了,大家都知道,這是科大那一代人心中永恆的記憶。翻開書的第一頁,我就被緒論的文字震撼了。下面是一個截圖,划了重點兩句話,討論如下。

(1)物理學的發展就是一部追求物理世界的統一的歷史。第一次大的統一就是牛頓的經典力學, 通過萬有引力把天界星體運動與世俗的看似複雜的物體運動做了一個統一的解釋。形成一個科學的體系,從此也堅定了大家的信念:

「物理世界存在著完整的因果鏈條」。

物理學的責任就是尋找支配自然各種現象的統一的力。

這完全是一個信念,你相信了,就為此努力!自牛頓以來,300多年了,物理學家還在奮鬥,逐步發現了一個美妙的宇宙模型。

相比於物理學,可嘆的是,人工智慧的研究,到目前為止,極少關注這個科學的問題。頂級的工程學院也不教這個事情,大家忙著教一些技能。解決一些小問題,日子就能過得紅紅火火。80年代有些知名教授公開講智能現象那麼複雜,根本不可能有統一的解釋,更可能是「a bagof tricks」一麻袋的詭計。有一些「兵來將擋、水來土掩」的工程法則就行了。這當然是膚淺和短視的。

我的博士導師Mumford1980年代從純數學轉來學習、研究人工智慧,他的理想是為智能構建一個數學體系(mathematics of intelligence)。以他的身份做這種轉變是極其不容易的(他有很多嚇人的頭銜,包括菲爾茲獎、麥克阿瑟天才獎、國際數學家協會主席、美國國家科學勳章),而我到目前還沒有見過第二個這麼轉型的大家。 1991年我讀完大學,申請研究生院的個人陳述(Statement of Purpose)中就懵懵懂懂地提出要探索這樣一種統一框架。當時也沒有互聯網,我也沒有聽說過Mumford。記得當時科大計算機系剛剛有了第一台激光印表機,替代針式列印。我買了兩包「佛子嶺」香煙給管機房的師兄,讓他一定要幫我把這三頁紙的個人陳述好好排版、列印出來!結果,大部分學校都拒絕了我的申請,而我導師把我錄取到哈佛讀博士。同一年,科大計算機系一個師弟吳英年被錄取到哈佛統計學讀博,我們就成了室友。他對物理和統計的理解十分深刻,過去25年我們一直在一起合作。現在回頭看,人生何其幸哉!

(2)物理學把生物的意志排除在研究之外,而這正好是智能科學要研究的對象。智能科學要研究的是一個物理與生物混合的複雜系統。智能作為一種現象,就表現在個體與自然、社會群體的相互作用和行為過程中。我個人相信這些行為和現象必然有統一的力、相互作用、基本元素來描述。其實這些概念對我們搞計算機視覺的人來說一點也不陌生。我們的模型與物理模型是完全相通的,當你有一個概率分布,你就有了「勢能函數」,就有了各種「相互作用」,然後就有了各種「場」與「力」。

這些問題放在以前是沒有數據來做研究的,就像愛因斯坦講的「…不過是一個大膽的奢望,一個哲學學派成問題的理想而已」。而現在可以了,我前面已經給出了一些例子:砸核桃、坐椅子、疊衣服。我們可以從數據中推算各種相互作用的力,用於解釋人的各種行為。最近,我有兩個學生謝丹和舒天民就用「社會的力和場」來解釋人的相互作用, 舒還拿了2017年國際認知學會的一個「計算建模獎」。 我們以後會寫文章介紹這方面的工作。

智能科學的複雜之處在於:

(1)物理學面對的是一個客觀的世界,當這個客觀世界映射到每個人腦中, 形成一個主觀與客觀融合的世界,也就是每個人腦中的模型(這是統計中貝葉斯學派觀點)。這個模型又被映射到別人腦袋之中。每個腦Mind裡面包含了上百個他人的模型的估計。 由這些模型來驅動人的運動、行為。

(2)物理學可以把各種現象隔離出來研究,而我們一張圖像就包含大量的模式, 人的一個簡單動作後面包含了很複雜的心理活動,很難隔離開。況且,當前以大數據集為依據的「深度學習」學派、「刷榜派」非常流行,你要把一個小問題單獨拿出來研究,那在他們複雜數據集裡面是討不到什麼便宜的。文章送到他們手上,他們就「強烈拒絕」,要求你到他們數據集上跑結果。這批人缺乏科學的思維和素養。嗚呼哀哉!

回到前面烏鴉的例子,我在第四節討論到,我們研究的物理與生物系統有兩個基本前提:

一、智能物種與生俱來的任務與價值鏈條。這是生物進化的「剛需」,動物的行為都是被各種任務驅動的,任務由價值函數決定,而後者是進化論中的phenotype landscape,通俗地說就是進化的適者生存。達爾文進化論中提出來進化這個概念,但沒有給出數學描述。後來大家發現,基因突變其實就是物種在這個進化的、大時間尺度上的價值函數中的行動action。我前面那個疊衣服的價值函數地形圖,就是從生物學借來的。

二、物理環境客觀的現實與因果鏈條。這就是自然尺度下的物理世界與因果鏈條,也就是牛頓力學的東西。

說到底,人工智慧要變成智能科學,它本質上必將是達爾文與牛頓這兩個理論體系的統一。

2016年我到牛津大學開項目合作會,順便參觀了倫敦的WestminsterAbbey 大教堂。 讓我驚訝的是:牛頓(1642-1727)與達爾文(1809-1882)兩人的墓穴相距也就2-3米遠。站在那個地點,我當時十分感慨。這兩個人可以說是徹底改變人類世界觀的、最偉大的科學巨人,但是他們偉大的理論體系和思想的統一,還要等多久呢?

這篇長文的成稿正好是深秋,讓我想起唐代詩人劉禹錫的《秋詞》,很能說明科研的一種境界,與大家共賞:

「自古逢秋悲寂寥,我言秋日勝春朝。

晴空一鶴排雲上,便引詩情到碧霄。」

附錄

中科院自動化研究所舉辦的《人工智慧前沿講習班—人機交互》報告的互動記錄(修改整理版)。

時間:2017年9月24日上午

主持人: 王蘊紅教授介紹辭(多謝溢美之詞,在此省略)。

朱 開場白:

感謝譚鐵牛老師多次關照和王蘊紅老師的盛情邀請。今天是星期天,非常不好意思,耽誤大家休息時間。我知道大家平時都很忙,你們堅持聽到最後一講,非常不容易。所以,我給你們帶來一點乾貨,作為「精神補償」。

今天的講座是個命題作文,王老師要我談人機交互。到底什麼是人機交互,它要解決哪些問題?我就花了一周時間整理了一個比較長的講座,給大家介紹人工智慧的發展,和人機交互的體系結構。這個問題非常大,而且研究工作剛剛起步,大家需要把很多問題放在一起看、才能看出大致的輪廓。我給大家提一個思路,啟發大家思考,我並不想直接給出一個解答方法。那樣的話就剝奪了你們思考的空間和權利。

2017年初我在《視覺求索》發表過一篇談「學術人生」的文章,講到做學問的一個理想境界就是「清風明月」,也就是夜深人靜的時候,你去科學前沿探索真理。今天的講座,希望把大家帶到這麼一個空曠的地方,去領略一番。

報告後的提問互動:

提問一:朱老師,機器怎麼通過學習讓它產生自我意識。剛才您演示的那個機器人,門口有個人他要進來,Ta怎麼知道自己後退把路給讓出來?

朱:自我意識這個問題非常重要。我先簡要介紹一下背景,再回答你的問題。

自我意識(self-awareness,consciousness)在心理學領域爭議很大,以至於認知學會一度不鼓勵大家去談這個問題,這個方向的人多年拿不到研究經費。人工智慧裡面有少數人在談,但是,還不落地。自我意識包括幾點:

(1)感知體驗。我們花錢去看電影、坐過山車、旅遊,其實買的就是一種體驗。這種體驗是一種比較低層次的自我意識,形成一種表達(可以是我上面講到的解譯圖)。事後你也可以回味。

(2)運動體驗。我們雖然有鏡子,可是除了舞蹈人員,大家並沒有看到自己的行為動作。但是, 我們對自己的體態和動作是有認知的。我們時刻知道我們的體態和三維動作。比如,心理學實驗,把你和一群人(熟悉和不熟悉的都有)的動作步態用幾個關節點做運動捕捉,記錄下來,然後,就把這些點放給你看,你只看到點的運動,看不到其它信息。你認出哪個人是你自己的比率高於認出別人,而且對視角不那麼敏感。所以,我們通過感知和運動在共同建立一個自我的三維模型。這兩者是互通的,往往得益於鏡像神經元(mirror neurons)。這是內部表達的一個關鍵轉換機制。

機器人在這方面就比較容易實現,它有自己的三維模型,關節有感測器,又有Visualodometry, 可隨時更新自己在場景中的三維位置和形態。這一點不難。

(3)自知之明。中國有個俗語叫做「人貴有自知之明」。換句話說,一般人很難有自知之明。對自己能力的認識,不要手高眼低、或者眼高手低。而且這種認識是要隨時更新的。比如,喝酒後不能開車,燈光暗的時候我的物體識別能力就不那麼強,就是你對自己能力變化有一個判斷。我們每天能力可能都不一樣其實,這個相當複雜了。

比如,機器人進到日本福島救災場景,核輻射隨時就在損害機器人的各種能力。突然,哪一條線路不通了,一個關節運動受限了,一塊內存被破壞了。它必須自己知道,而後重新調整自己的任務規劃。目前人工智慧要做到這一點,非常難。

剛才說的人進來、機器人知道往後退,那就是一個協調動作的規劃。你規划動作、首先要知道對方是什麼動作。比如,人與人握手就其實是非常複雜的互動過程。為了達成這個目標,你要在腦內做模擬simulate。

提問二:謝謝朱教授,感覺今天聽到的都是我以前從來沒有聽過的東西。我有一個問題就是像機器人這種自我認識都很難,像您說的交互他還要去理解對方那個人的想法,這種信息他怎麼來獲取呢?也是通過學習還是?

朱:靠觀察與實踐。你看別人做事你就觀察到,你就能夠學到每個人都不一樣的價值函數,你就了解到你周圍的同事,比如你們共享一個辦公室,或者觀察你家庭裡面的人,你跟他生活的時間越長,你就越來越多的知道他怎麼想問題、怎麼做事,然後你跟他在交互的過程中越來越默契了。除了觀察,還有實踐,就是去試探、考驗對方。夫妻之間,剛結婚會吵架,之後越吵越少了、和諧了,價值觀融合大致收斂了、或者能夠互相容忍了。實在無法收斂,那就分道揚鑣,到民政局辦手續。這兩種情況都是我說的「學習的停機問題」。大家之間不要再相互交流、學習了,要麼心領神會、心照不宣;要麼充耳不聞、形同陌路。

提問三:他也是通過他自己觀察到,它裡面建立一個圖嗎?一個解譯圖(parse graph)嗎?

朱:在我看來是這樣的。就是我必須把你腦袋裡面的很多結構盡量重構出來,表達層面就是解譯圖,至於人腦如何在神經元層面存儲這個解譯圖,我們不清楚。人腦肯定有類似的表達,我腦袋裡面有你的表達後,我就可以裝或者演你的對各種情況的反應。

文學作家創作的時候,他腦袋裡面同時要裝下幾十、上百號人的模型和知識表達,那些人知道什麼、什麼時候知道的。讀文科的人一般觀察比較敏銳。表演藝術家在這方面能力肯定也特彆強。

提問四:像我們剛接觸機器學習,你有沒有什麼推薦的,因為現在大家都在追蹤訓練深度網路,有沒有一個推薦的,就是概率模型還是什麼東西,一個數學理論或者一個數學工具。

朱:我的想法是這樣的,首先讓大家端正思想,就是你想學,探索真理和未知。就是說在夜深人靜的時候你探索真理,等你心境沉靜下來,你自然就看到一些別人忽略的東西。不要讓我推薦某個工具、代碼、秘籍,拿來就用。我今天講的東西都不是來源於某一個理論、工具,是融會貫通後的結果。

我反覆告誡學生們,做科學研究不是過去那種到北京天橋看把戲,哪裡熱鬧就往哪裡鑽。我以前也談到過一個「路燈的隱喻」,科學研究就像在一個漆黑的夜晚找鑰匙,大家喜歡聚在路燈底下找,但是很可能鑰匙不在那個燈底下。

提問五:朱老師好,非常慶幸來聽這個報告,我最後一個問題很簡單。您說那幾個時期,我想問一下秦朝到底什麼時候能到?到秦朝的時候,數學的哪一塊你認為,可能會被用做秦朝的武器或者最厲害的那個武器是什麼。

朱:問得很好。什麼時候會達到統一?這個事情中國有兩個說法,都有道理。

一種說法叫做「望山跑死馬」。你遠遠望見前面那個山快到了,你策馬前行,可是馬跑死都到不了,中間可能還有幾條河攔住去路。那是我們對這個事情估計不足。

第二個說法是「遠在天邊,近在眼前」。能不能到達,決定於你這邊的人的智慧和行動。什麼時候統一、誰來統一,這決定於我們自己努力了。春秋和戰國時期,思想家是最多的,諸子百家全部都出來了,那是一個思想激烈碰撞的時代。我今天講的這些東西其實都在我腦袋裡面激烈的碰撞,我還有些問題想不通。

我們現在談這個事情和框架,你覺得世界上有多少人在做?我的觀察是:極少,也許一隻手就可以數得過來。

你的第二個問題,如果要統一,那最厲害的數學工具是什麼?我們要建立統一的知識表達:概率和邏輯要融合,和深度學習也要融合。我們看看物理學是如何統一的,他們裡面各種模型(四大類的力與相互作用)必須融洽,然後解釋各種現象。簡單說我們需要搞清楚兩點:

一、什麼地方用什麼模型? 對比經典力學、電磁學、光學、統計物理、粒子物理等都有自己的現象、規律和使用範圍。我們這邊也類似,各種模型有它們的範圍和基礎,比如我們常常聽說的,吉布斯模型往往就在高熵區,稀疏模型在低熵區,與或圖語法用在中熵區。這一塊除了我的實驗室,世界上沒有其他人研究。

二、這些模型之間如何轉化? 前面我講了一個例子,我寫了一篇關於隱式(馬爾科夫場)與顯式(稀疏)模型的統一與過渡的信息尺度的論文,投到CVPR會議,結果,三個評分是「(5)強烈拒絕;(5)強烈拒絕;(4)拒絕」。大家根本就沒想這個問題,眼睛都巴巴地看著數據集、性能提升了多少。刷榜成了CVPR科研的重要範式。在某些人眼中,刷榜成了唯一方式。我以前是批判這個風氣,後來一想,其實應該多鼓勵。我對那些把大眾帶到溝里去的學術領軍人物,以前是批評,現在我特別感激Ta們。這樣我自己的學生才有更多時間去實現我們的思路。你們都一起涌過來踩踏、亂開亂挖,我都躲不開。我做研究喜歡清靜,不去趕熱鬧,不去追求文章引用率這些指標。

王蘊紅教授總結(整理):今天朱教授的報告,大家可以感覺到兩點。

一、縱橫捭闔、舉重若輕。縱論、橫論整個人工智慧六大領域很多深刻的題目,在很多層面上縱橫交叉的線,他理得非常清楚、舉重若輕,收發自如。非常幸運能聽到這樣的報告。

二、授人以漁而不是魚。他講的是如何去思考問題,如何去看世界,如何研究一些真正本質的東西。近幾年深度學習被過多強調之後,有很多博士生還有一些研究者過於依賴工具,思考的能力被損壞了。其實研究的世界那麼大,你一定要抬起頭來看看,仰望星空。(全文完)

鳴謝

感謝微軟研究院郭百寧、華剛、代季峰等博士2016年9月在北京組織的研討會。2017年6月湯曉鷗、王曉剛、林倞等教授邀請我在香港中文大學所作的報告。沈向洋博士在2017年7月西雅圖組織的碧慧論壇。2017年9月在譚鐵牛教授關照下、王蘊紅教授在中科院自動化所舉辦的人工智慧人機交互講習班、並指派速記員和北航博士生劉松濤同學整理出報告的中文初稿。假若沒有他們的耐心、催促、鼓勵和協助,這篇中文報告是不可能產生的。報告中的部分圖片由VCLA@UCLA實驗室朱毅鑫、魏平、舒天民等人協助整理。

感謝中科大阮耀鍾教授、楊志宏同學幫我找到那本珍藏的《力學概論》電子掃描版。其緒論被摘錄在文中。我的思想受到這本書的啟蒙。

感謝《視覺求索》公眾號編輯部周少華、華剛、吳郢、羅傑波等同仁的協助。

感謝美國多家機構對文中提及研究的長期支持。

聲明:本文限於純屬學術觀點的爭鳴,不針對任何組織和個人,切勿對號入座。本文僅代表個人觀點、不代表機構立場。

背景簡介:本文作者為加州大學洛杉磯分校UCLA統計學和計算機科學教授,視覺、認知、學習與自主機器人中心主任朱松純。本文2018年7月27日發表於微信公眾號視覺求索mp.weixin.qq.com/s?),風雲之聲獲授權轉載。

責任編輯:孫遠

歡迎關注風雲之聲

知乎專欄:

zhuanlan.zhihu.com/feng

一點資訊:

yidianzixun.com/home?

今日頭條:

toutiao.com/m6256575842


推薦閱讀:

人工智慧軍備競賽:一文盡覽全球主要國家 AI 戰略
王星澤:打造AI+光電的「視覺魔法」 | 「35歲以下科技創新35人」中國榜單專欄
人工智慧的未來 ——記憶、知識、語言
Ian Goodfellow等人提出對抗重編程,讓神經網路執行其他任務

TAG:科技 | 人工智慧 | 人工智慧演算法 |