類比人腦-理性和感性的量化和認知的訓練過程
來自專欄 自動駕駛與群智感知
思維上的理性和感性是二元對立的衝突,過多的感性會損害人的理性運用,而只有運用理性才能做出正確決定。顯然,這種理性永遠優越於感性的論調並不符合現代科學的發現。缺乏感性可能使人完全無法作出任何決定:一個智商和認知能力都正常的病人,因為腦部創傷而無法體驗到任何情緒,他就陷入了更大的麻煩,他基本無論任何大小事情都不能決定,這令他近乎無法正常生活。
(所有結論來源於 think about think)
考慮自動駕駛的結構類比,感性更像是DNN的線性映射過程,一般位於層次模型的下層;理性更像是貝葉斯的過程,或是邏輯設計的過程,一般位於層次模型的上層
我們需要時刻擁抱不確定性(embrace uncertainty),不要因為感覺不舒服就提早關閉掉自己大腦內部的模擬辯論(mental debate),總是在分析時先作出兩個截然不同的假設,再為它們各自尋找足夠的理據,強迫自己從不同角度來看待同一事實;同時,還有不斷提醒自己還有什麼是你所未知的,因為任何理論模型也會有出現漏洞時,時刻提醒自己的未知有助於你更快更高效地找到問題所在。
任何一個時刻,我們都在確認感性和理性之間的一致性。實際上認知的過程在感性和理性的過程之上。類似於粒子濾波的假設來源於底層特徵的獲取和頂層的先驗假設。不同假設的組合,可以獲得一種認知上的評分,和這個評分所代表的環境模型結果
某程度上,決定論者是對的,因為我們的情感部分是如此強大,幾乎主導了我們日常生活的決策流程。我們的決定、喜惡、慾望都由我們的基因、身處的環境和過往的種種經驗匯合塑造而成,我們的一舉一動,下一步是向前走還是向左走,早已在我們的潛意識深處決定了,很多時候我們是已經確定要向前走然後在想出一個理由來補充說明自己的舉動。但,Thank God,我們的大腦還有prefrontal cortex的構造,我們還有進行理性分析思考的能力,當我們的意識察覺到我們要向前邁進時,它能夠發出信號指令來阻止limbic system的運作。我想,這就是自由意志的最大意義,我們雖然受困於許多先天上的缺陷,但我們起碼能夠知道我們是不完美的。不斷反思我們的決定是基於這樣或那樣的原因而做出的,究竟是一種情感的直覺的判斷,還是理性推敲的過程?一方面我們有經過千百萬年演化而來的感性部分,我們知道它是一部強大的決策機器,同時也是極佳的訊息搜集裝置,能夠注意周遭我們意識層面上注意不到的變化,除了快捷敏銳的優點外,某些時候準確率還高於理性推理(前提是在某一個特定方面要有長時間的訓練和高強度的注意集中,就像前文「成為專家」那段提到的那樣,大腦的感性部分幫我們處理了理性部分所負荷不了的過量信息,像世界撲克冠軍在打牌的時候或者隱形戰機駕駛員在執行任務時,他並不需要進行像幾何證明那樣一步一步的推理,只是簡單地跟隨自己的直覺反而有更好的結果)。但理性分析是幫助我們認識到自己的不足,彌補我們的先天缺陷。在解決一些簡單的問題,或者涉及到數字、金錢的問題時,要著重運用理性去檢驗自己的決定是否合理。
在機器認知的初期,同嬰兒一樣,不具備對這種感性和理性錯誤的判斷。可能底層的錯誤(手燙傷就不會再觸碰)是可以形成判斷的(自動駕駛可能不允許這種過程吧),基因里我們會認定一個「領路人」 是我們對於評分所代表的環境模型是否合理的一種評價,這種評價可以來源於人的設計或是某種GAN的鑒別器一樣的網路。對這種評價的設計或訓練,將幫助我們首先意識和觸及到某種問題的確發生了。(沒有媽媽,嬰兒不一定能夠意識到某些行為是錯誤的)
感性的優勢(迅速判斷):而我們的感性部分就是大腦用來解決這個問題的。簡單點來講,感性的優勢就是快、敏捷、高效。因為大腦的感性部分是過去億萬年演化過程中累積的經驗,而且還會自動搜集你平時意識層面上沒有注意到的各種信息,並總結歸納出一定的模式,在這個基礎上對未來作出某種預測——而這是最重要的一步——當之後出現的結果與期望不一致,也就是有意想不到的事發生時,大腦一種叫dopamine的物質就會突然增多,它是用來刺激人的情緒反應,這是用來提醒你可能有潛在的危險或者值得注意的事情發生了。dopamine扮演著非常重要的角色,通過它的數量浮動來轉移人的注意力集中的方向,不斷更新大腦對外界行為模式的「資料庫」,將新的資訊利用情緒的變化而儲存下來,從而修正自己的預測。所謂專家就是對某一特定類型的信息極端敏感以至於能在大腦產生瞬間的本能反應,來作出判斷,像華爾街的交易員,每天看著電腦上密麻麻的股票名稱和價格變化,數據之多早已超越了大腦理性分析部分運行的負荷上限,但是他們就是能夠在極短的時間內作出要買賣哪一隻股票,該賣出還是買進,在什麼價位買,買多少,以什麼方式買等等一系列複雜問題。他們在意識層面上也無法解釋他們決定的理據。
感性的缺失(錯誤樣本的導入):感性反應只不過是我們在演化過程中和日常經驗累積所形成的組合包裝的事先分析,當中一個最顯然的例子就是賭博。人們沉迷賭博,甚至成為病態賭徒其實有著很深的病理學和心理學根源。一個患有柏金遜症的女英文教師,忽然之間迷上了玩老虎機,全然不顧其他事情,害得自己失去了工作、丈夫、家庭,原因就在於她的醫生開給她治療的一種藥物中含有dopamine的成分。感性的缺失(關閉了對於多樣性的假設):loss aversion,簡單地來講,就是人們不喜歡失去錢的感覺,即便者在長遠讓他們有更大的收益,在付出或失去金錢財物的當下這一剎那,他們大腦的感性部分還是會普遍產生不快的感受。這充分解釋了一個經典經濟學所不能解釋的一個迷思:根據經濟學家統計,從1926年開始,股市的平均年收益率有6.4%,而債券只有不到0.5%,而且從整體來看,只投資股市的投資組合表現總是優於既投資債券又投資股市的投資組合。這就產生了一個非常奇怪的現象,為什麼還會有人買債券呢?
上述對於感性的優劣勢的描述,和DNN訓練過程中存在的問題完全一致,在錯誤樣本導入,或者缺少樣本的情況。和人的感受一致
理性的優勢(可對不一致做出識別):一旦我們意識到眼前的危機並不在經驗範圍內,就會馬上克服本能的情緒反應,因為這時的情緒反應已經是一種過時的資訊,再糾纏下去只會干擾甚至誤導自己下一步的行動。書中那個遭遇山火的消防員就是最好的例子,他沒有像他的隊員們盲從內心的恐慌,一味地往山上跑,因為他意識到自己逃跑的速度跑不過山火擴散的速度,這樣做除了浪費體力外,只是死路一條。在冷靜思考了一陣以後,他想出了一個大膽而冒險的方法來解決面前這個他之前從未遇過的重大危機,他決定停下來,掏出身上攜帶的火柴把自己周圍一圈草地上的乾草都燒光了,然後用微濕的手巾掩蓋口鼻,半蹲在他自己燒出來的一小圈旱土上
理性的缺失(過度假設,假設錯誤):一個簡單的例子就是,兩個外觀上一樣的碗,但其中一個的底部比較淺,換言之就是有一個碗容量大點,有一個容量小點。兩個碗都裝滿了M & M巧克力豆,先給測試者分量少的那碗,這是在他們正常食量範圍內,他們把巧克力豆吃完了。第二次測試,測試者得到較多的那碗,他們同樣也把全部的巧克力豆都吃完,如是者循環幾次,測試者結果吃了比他們平時消費量多66%的巧克力豆。這也可以部分解釋了為什麼現代消費社會的肥胖率普遍偏高,因為我們的思維模式傾向於用可以看見的具體物件來作為量度事物的度量單位,如果我們看見用兩隻看上去一樣的碗裝著的巧克力豆,我們很容易就認為它們的分量是一樣的。理性的缺失(無法窮儘可能性,速度慢):一個人之所以無法按照柏拉圖理想國般的純然理性地生活,是因為世間萬事萬物互相影響的相關因素無窮無盡,要一一將它們細細分析是不可能的事。
上述對於感性的優劣勢的描述,和概率假設類方法過程中存在的問題完全一致,在假設設計不合理時存在一定的問題。
無論作出怎樣的決定,一定要意識到你的決定和你是經過了一個怎樣的過程才得出這個決定的,理性分析的,感性直覺的,都不重要。重要的是,當你一旦出現錯誤時,你能立即追蹤當初的思維軌跡有哪一部分出來了差錯,事實證明,經驗——錯誤的歸納模式是人類最根本也最可靠的學習方法。書中最後提到一個例子,就是空難事故率在1940年至1990年期間一直維持在一個相當穩定的水平,但到了1990年以後,事故率驟然大降,使乘搭飛機成為最安全的出行方式(比駕車的事故率低得多),當中最重要的因素就是電腦化的模擬飛行駕駛器的出現,飛行員能夠在逼真的模擬環境不斷操作練習各種突發事件的應對方法。
當我們在獲得對頂層不一致性的判斷的時候,要做的實際上是兩件事情,在不一致發生時,識別是感性的問題(下層問題)還是理性的問題(上層問題)。並利用中間的斷面數據,對出現問題的位置進行系統性的訓練。
求點贊,求關注,求打賞。你棒棒噠!
推薦閱讀:
※人工智慧學習筆記:自然語言處理(一)
※深度報告 | AI新職位「人工智慧訓練師」
※人工智慧時代 我們該如何生存
※商用智能炒菜機已橫空出世 網友:這樣炒出來的菜是沒有靈魂的
TAG:人工智慧 | 深度學習DeepLearning | 自動駕駛 |