一種能閱讀和對話的類腦意識智能系統的設想與架構

03-18

標籤：AI 人工智慧強AI智能超人工智慧類腦智能類人智能神經網路大腦神經生物智能意識

一、前言。

目前對人工智慧的研究火爆，但是對於如何構建一個具有人類「意識」的智能系統卻是近乎白板一塊。

顯然通過現有的機器學習演算法（如神經網路、決策樹）對大量數據進行暴力知識連接運算，進而得出數學知識模型的方法是不可能產生類似於人腦意識的。

要讓機器可以像人一樣閱讀和對話，那麼對人類大腦意識的研究是必不可少，這就涉及到哲學、心裡、生物、數學、計算機等交叉學科的共同研究和進步。

本人（程序員一枚）通過研究後設想：雖然不能完全弄清人腦意識是什麼，但我們可以在一定程度上構建和模擬具有人腦意識智能的系統。

下面盡量簡明易懂地講解如何構建和模擬這樣一個能閱讀和對話的類腦意識智能系統，以及這樣一個系統的工作原理。

二、概述。

這個能閱讀和對話的類腦意識系統（以後簡稱「大腦」）有如下六個頂級模塊：感知、記憶、思維、慾望、情緒、行動，其中思維模塊包含了最重要的語言和推理模塊。

接下來將首先舉個情景例子以粗略揭示各個模塊的配合工作，在以後的各片段中再詳細講解各個模塊部分，最終再將各模塊綜合起來整體揭示本「大腦」系統的工作原理。

想像一下「大腦」正在閱讀或被問這樣一段話：「為什麼在網上聊天是一件令人開心的事？」。

第一步：由感知下的感覺模塊（配合記憶模塊）將聲音（聽覺）處理成音符，或者將圖畫（視覺）處理成畫符。

第二步：思維下的語言模塊（配合記憶模塊）將音符或畫符處理對應到語言的文字，並將這段話分析出對應的詞語、句法結構，然後將詞語對應到指代的物件結構、句法結構對應到推理結構。

第三步：記憶下的物件模塊有原子物件和複合物件的區分；原子物件如「為什麼」、」是「、「上」、「開心」、「令」、「事」，複合物件如「網」、「聊天」。

第四步：感知下的知覺模塊將原子物件對應到各個感知元素，或者將複合物件組成結構中的原子物件對應到各個感知元素；「為什麼」對應到一個發問動作元素，「是」對應到一種判斷動作，「上」對應到一種抽象（非方位的）位置元素，「開心」對應到一種情緒狀態元素，「令」對應一種使能動作元素，「事」對應到事件元素。

第五步：思維下的推理模塊將分析出這個是一個發問的判斷語句即「網上聊天=>令人開心」。

第六步：慾望下的求知模塊進行自我驅動，決定一定程度地進一步分析確定這個判斷事實或者因果關係；如果「大腦」正在被提問，則由慾望下的交流模塊進行自我驅動，並決定回答這個對話問題。

第七步：思維下的推理模塊（配合記憶模塊），首先在記憶下的物件知識模塊里查找與「網上聊天」這個因的所有果並篩選出是否有「開心」這個果，如果有則「網上聊天=>令人開心」的判斷確定結束；否則將在記憶下的事件模塊里查找所有與「網上聊天」相關的開心和不開心的事件，並做出統計最終確定「網上聊天=>令人開心」的判斷是否成立，如果成立還會將這個結果交給記憶模塊以存儲這個因果知識。

第八步：如果「大腦」正在被提問，則由思維下的推理模塊將判斷結果和事物關聯結果找出並整理重要部分，然後由思維下的語言模塊將物件推理結構轉換成詞語句法結構，最終由行動模塊呈現語言（聲音或文字）來回答問題。

以上就是對本「大腦」系統工作過程的一個十分粗略和簡單的描述，裡面有許多東西和複雜情況並未進一步說明。此時只要讀者有個大體了解即可，以便在後續的閱讀中能夠更好地理解所述內容。

三、感知模塊，下含元素、感覺、知覺子模塊。

（1）元素模塊。這裡記錄了所有能被感知事物的基礎屬性或者說要素，感知元素就是指這些基礎屬性或要素，這個模塊相當於一個字典。

感知元素分為七個類別：視覺、聽覺、味覺、觸覺、動作覺、機體覺、情慾覺、邏輯覺、物理覺。

視覺、聽覺、味覺、觸覺是分別與器官眼、耳、鼻、舌、膚密切相關的感知；動作覺是與動作相關的感知；機體覺是與全身肌肉、骨骼、內臟等器官直接相關的感知；情慾覺是與慾望、情緒相關的感知；邏輯覺是與計算推理相關的感知；物理覺是除前面分類外所有的感知。

除這些感知類別本身也是一個感知元素外，舉例如下：

視覺，明暗、顏色、紅、綠、藍；聽覺，聲音；味覺，酸、甜、苦、辣；觸覺，溫度、粗糙、力；動作覺，走、跑、推、打、看、聽、摸；

機體覺，飢、渴、噁心、痛、悶、脹、困；情慾覺，喜、怒、哀、樂、愛、恨、生、好、虛榮、自私、尊嚴、權利、好奇、佔有、疑問；

邏輯覺，加、減、等價、大於、小於、因為、所以、與、或、非、一定、可能、非常、剛剛、幾乎、有、無、及物、不及物、陰性、陽性、對立、統一、主體、客體；

物理覺，時間、空間、體積、直線、形狀、狀態、能量、硬度、密度、彈性。

感知元素是認知的起點和根本源泉、承載著相應內容意義，也是事物結構描述與構建的基礎，而其中的邏輯感知元素還承載決定著思維推理的終極形式。思維是一種形式推理，這點很重要。

感知元素有一個特性是一旦缺少對應感知元素則與其相關的事物將變得非常困難或根本不能得到合適的其它描述解釋，並且感知元素沒有歧義。

感知元素都有其描述結構，這個描述結構是一種由邏輯符號把其它相關感知元素與當前感知元素有意義地連接在一起的結構。

感知元素分為原子感知元素和複合感知元素：由其它複合感知元素或原子感知元素連接構成的是複合感知元素，反之就是原子感知元素。

事物從互為因果的對立關係上說是相互存在的，從可分解性上說又是複合或原子存在的。那麼如何找到可知範圍內的原子感知元素呢？

步驟：①找到只包含能夠決定邏輯形式非內容性意義的純邏輯感知元素；②在純邏輯感知元素里找到含有分解意義的感知元素；③用上一步結果的感知元素進行互相分解並找到不能被分解的元素，這些找到的元素就是原子分解邏輯感知元素；④用原子分解邏輯感知元素去嘗試分解其它所有的感知元素，所得到的不能被分解的元素就是原子感知元素。

（2）感覺模塊。

感覺模塊功能是對各式各樣的感知進行獲取和基本處理，然後將處理結果送往思維、記憶等其它模塊進一步利用，相當於感覺器官。

當然在這個僅具有閱讀智能的系統里只須處理文字或語音輸入即可，更為複雜的視覺感知和其它感知是不用理會的。

字元不用處理直接送入思維下的語言模塊即可；聲音需要採樣處理成聲符，然後由思維下的聲音模塊（配合記憶模塊）處理成字元，最終再送入思維下的語言模塊。

（3）知覺模塊。

知覺模塊功能是將記憶模塊相關的原子物件結構對應到相應的感知元素結構，較為簡單僅是結構對應。

四、記憶模塊，下含物件、事件、整理模塊。

（1）物件、事件模塊。

記憶下的物件、事件模塊是知識庫，既是「大腦」思維模塊的學習「產物」又是其進一步學習的「原料」。

物件模塊記錄的是思維模塊進行邏輯推理後的事物關聯結果，而事件模塊則記錄的是「大腦」思維過程中的、與時間有關的或者與自身活動有關的事物。

物件模塊里分為原子物件和複合物件：原子物件直接對應著感知元素，複合物件由其它複合物件或原子物件連接構成。

同感知元素類似，物件和事件的描述結構是由邏輯符號把其它相關物件、事件與當前物件或事件有意義地連接在一起的結構。邏輯符號能夠連接的事物關係如：數量、程度、對立、因果、是否、等價、個類、含屬、複合、主被、時態、限定、集合...等等。

這裡的物件、事件描述結構有一個特點就是不會因為結構和內容產生歧義，而自然語言的句法結構是有可能從結構和內容上產生歧義的。

這是因為在物件、事件描述結構中：①由邏輯符號決定的連接形式無歧義、②其基礎的原子物件對應著感知元素，而基礎的原子感知元素所承載的內容意義又是單一無歧義的；而自然語言為滿足其功用目的是需要有歧義的。

（2）記憶的整理模塊。

這個模塊的功能是有目的地將「大腦」所記憶的「東西」進行初次一定期限存儲、轉為更長期限的存儲、過期「遺忘」刪除和再加工存儲，所記憶的「東西」在這裡是指上面提到的物件和事件的描述結構。

整理的目標應該本著：①相對重要的要轉為更長期限的存儲，反之儘快刪除；②相對頻繁使用的要轉為更長期限的存儲，反之儘快刪除；③按不同存儲時長段進行一定概率隨機再加工存儲；④存儲空間不足觸發刪除過程。

重要的「東西」是指在慾望優先順序上更高的；如威脅生存慾望的最重要，而影響交流、名譽慾望的反而相對不是那麼重要。

在這裡引入一個「記憶能量」的概念，它與事物能夠在「大腦」中被存儲的時長相對應。

當事物被「大腦」初次記憶時，會根據事物的重要性給予一定的初始記憶能量；當所記憶的事物被「大腦」再次使用時，會根據距上次記憶的時間間隔和事物的重要性在原來基礎上增加給予一定的記憶能量；當所記憶事物的記憶能量相對存儲時長不足時會觸發刪除過程，會根據總的超時時長和總的記憶時長的比例倍數來概率性刪除，當然超時時長越長則越是可能被刪除。

再加工存儲，其目的是模擬「夢」對記憶的整理功能，可以按小時、天、月、周、年、十年等不同時長段觸發其加工過程，根據所記憶事物的重要性概率性的以此記憶事物為慾望目標起點進行關聯加工過程，以產生更為重要有意義的事物結構關聯。

存儲空間不足觸發刪除過程，應根據對應已記憶事物的記憶能量和當前已記憶時長情況等做綜合處理來決定刪除操作。

「大腦」對於已超時記憶事物的回憶使用，應該按「大腦」回憶對應事物時所消耗的時間能量和對應事物總的超時時長與總的記憶時長的比例倍數來概率性決定是否回憶使用成功，回憶消耗能量越大、總的超時時長與總的記憶時長的比例倍數越小則越容易回憶使用成功。

五、思維模塊，下含語言、推理模塊。

（1）語言模塊。

此模塊主要功能是：①將音符或畫符處理對應到語言的文字； ②將文字語句分析出對應的詞語、句法結構； ③將詞語對應到指代的物件結構、句法結構對應到推理結構。

在記憶下的物件模塊里，音符或畫符到文字的關聯是用「指代」邏輯符號來連接，反過來語言文字到音符或畫符的關聯是用「被指代」邏輯符號來連接。由於同音字存在指代關係可以是一對多，由於多音字、異體字的存在被指代關係也可以是一對多。

將音符或畫符轉成語言文字只須按照指代關係來對應即可，一對多的關係就是有多個備選可能。

在記憶下的物件模塊里，文字到詞語的關聯用「被組成」邏輯符號連接，反過來用「組成」邏輯符號連接，當然單字即可成詞的可以用「屬於、是」邏輯符號連接；詞語和其性質（如名詞、代詞）或可做成分角色（如主語、定語）的關聯用「屬於、是」、「當作」和「或」等邏輯符號複合連接。

將文字語句分析出對應的詞語只須按照字到詞的關聯邏輯對應匹配即可，同樣一對多的關係就是有多個備選可能。當然有些詞符合構詞法，這就要用記憶模塊里「記憶」的構詞法規則來綜合分析可能的片語。

詞語到短語乃至整句結構的分析就要按其詞性和其可做成分角色的複雜構造規則來完成，當然這個複雜構造規則也是「記憶」存儲在記憶模塊里的，並且一對多的關係就是有多個備選結構句法可能。

詞語到物件結構的轉換隻須根據「指代」邏輯關聯來轉換即可；對於句法結構到推理結構的轉換，要將不同相關的句法結構用合適的推理邏輯符號來替代表示。

句法結構轉換到推理結構後，由推理模塊配合驗證和篩選其內容意義比較符合情景要求的推理結構作為最終結果，注意推理結構本身是不含歧義的。

（2）推理模塊。

邏輯符號本身也是一種記憶物件，但這種物件能夠決定推理形式。理論上我們只要能夠解析可知範圍內的所有原子邏輯符號對應的推理形式即可。

在推理中主要是根據推理形式的傳遞、變換、約束關係不斷簡化結果。如間接推理的反對稱性關係、傳遞性關係、反傳遞性關係、混合傳遞關係等傳遞推理，直接推理的上反對關係、下反對關係、矛盾關係、從屬關係等形式變換推理，推理還滿足同一律、矛盾律、排中律、充足理由律等約束。

那麼推理的事物關聯基礎和內容意義也即事實證據從何而來？

主要來源於我們的感知和慾望作用到事物上的被記憶的事實，如花有顏色、運動有快慢、飯是香的...等。並且這些事實證據都有一個置信度的評估，這個評估過程由慾望模塊配合來完成。

事實證據的置信度評估結果在一定範圍內具有不準確或者說模糊性，如有時我們不能得知哪種水果更甜、哪種顏色更鮮艷。事實證據的置信度會根據邏輯關係的不同而不同程度的傳遞給和影響結果。

對於數字比較特殊，單個的數字本身就是一種事情證據，並且這個事實證據是精確可靠的不具有模糊性。比如，給你任意兩個數字你便可以推出其差距和大小，而無須在記憶模塊里尋找相關其差距和大小的事實證據。

推理具有目標性，推理的方向就由其相關目標決定，並且在推理過程中會不斷即時衍生、修正、評估、清除各個子目標。

那推理目標的最初來源又是什麼？是慾望。慾望本身就是具有複雜層次關聯的目標，並且在這些慾望基礎目標之上可以衍生出多種多樣具有複雜層次的子目標，被衍生出的目標都要服從這些慾望基礎目標。此外推理目標的完成進度、效果、滿意度等也由慾望模塊來評估。

在前面推理形式解析、事實證據評估、慾望目標處理的基礎上我們可以實現更為複雜的推理策略，如演繹、歸納、類比、辯證等。特定範圍問題目標的推理策略和過程也是可以存儲在記憶模塊里的，在思維推理過程中「大腦」會不斷一定慣性地使用和嘗試各種新舊策略。

當然「大腦」系統形式推理過程中也會把搜索用到的知識臨時放入「內存」以加快運算速度。還有重要一點就是：一切推理計算都要本著節省「能量」的原則，這要求儘快高效的獲取滿意結果。

六、慾望模塊。

（1）到這裡終於是說明我對意識本質看法的時候了，意識當然是感知、記憶、思維、慾望、情緒、行動等相關的一切。

但是，意識的開端和源動力是慾望，有慾望就有生命（如微生物、植物），沒有慾望即使是人也會變成不知自己在幹什麼的「機器」。

至於意識的強弱主要取決於慾望的層次複雜程度和思維推理的形式複雜程度。

例如，意識很弱的有慾望簡單無思維能力的植物，意識較強的有慾望較為複雜且有簡單思維能力的昆蟲，意識很強的有慾望複雜且能進行複雜思維推理的動物，而意識強到難以置信的當然是慾望層次十分複雜且思維異常強大擁有複雜「語言」的我們人類自己。

對於我們能知道事物的存在，不僅僅是因為感知器官更是因為慾望，想像一塊鐵被燒得通紅卻依然不能知道火這個事物的存在。

慾望的存在基礎應該是眾多簡單擁有不同物理感應特性的物質精妙複合而成。

意識的慾望既然並且只有是物質的，意識所以並且才能夠以其它物質形式存在。

既然意識能夠以其它物質形式存在，那麼以硅的感應特性為基礎複合而成的「大腦」物質當然完全有可能實現意識智能。

（2）可以說一切感知、記憶、思維、情緒、行動都是慾望的工具。

感知的事物要通過慾望來闡釋其意義，思維形式推理的目標方向需要慾望來「指導」，不同慾望目標的達成和損害程度產生了不同意義的情緒，記憶和行動通過思維間接為慾望所產生、使用和控制。

本「大腦」的慾望模塊承擔兩個功能：①解析感知事物的意義，②決定思維推理的目標；除此之外的其它功能由其它相關模塊處理。

因為記憶模塊的物件和事件都是由對應相關的感知元素通過邏輯符號連接而成，並且感知元素里最基礎的是原子感知元素；所以我們只須做好原子感知元素對不同慾望意義的匹配和影響程度的構建，對於更為複雜的感知元素和事件物件可以通過其對應的邏輯連接關係進行運算推理而得出相應慾望意義的匹配和影響程度。

又因為慾望目標也是有層次的，高層次的慾望通過低層次的慾望間接滿足；所以對於感知事物的意義我們只須將原子感知元素和其基礎的原子慾望意義關聯構建起來即可，對於更高層次的慾望意義可以通過其與其它慾望目標意義的邏輯連接關係運算推理得出。

慾望層次的劃分如「馬斯洛」的五層模型（從低到高）：生理需求、安全需求、社交需求、尊重需求和自我實現需求。

越是低層次的慾望越是緊急和優先滿足的但相對簡單，如食物、水、生命；越是高層次的慾望反而不是那麼緊急但相對複雜，如名譽、地位、公平、自信等。

各種慾望在不同的感知情景下被一定程度地選中並衍生出慾望的子目標，然後命令指導「大腦」思考推理和搜索有關內容並加工以得出滿足慾望的結果，最後命令運動器官產生行動。

當然「大腦」在思考推理過程中會不斷產生各種子目標然後處理以至刪除，最終目的就是完成對應情景下的慾望目標。

慾望目標很容易在各種情景下主動或被動觸發，如口渴、安全、虛榮、自私、尊嚴、權利、好奇、佔有、疑問等。

對於事物慾望意義中最難理解的「美」是什麼？是各種慾望目標的達成。可以分為兩類：思維上的求知、求真慾望也即「真」，其它各種生理慾望也即「善」。

七、情緒模塊。

本模塊的功能是根據當前慾望滿足程度計算和產生相關情緒，這就涉及慾望到情緒的邏輯關聯構建。

同樣我們只須構建原子慾望元素到不同原子情緒元素的邏輯關聯，其它複雜慾望元素到情緒元素的關聯可以通過其間接或直接到原子元素的邏輯關聯推理計算得到。在這裡我們當然也要構建不同層次的情緒邏輯關聯，但注意要將情緒和慾望區分開，情緒是對慾望目標達成的評估。

例如：求知是慾望，對應的渴望、困惑是情緒；求勝是慾望，對應的驕傲、自信、悲傷是情緒；攀比是慾望，對應的嫉妒、欽佩、鄙視、失望是情緒。

又例如：敬畏由欽佩、恐懼、尊敬等複合而成，崇拜由欣賞、渴望、尊敬等複合而成，羨慕由渴望、欣賞等複合而成。

情緒狀態具有持續性，一種狀態到另一種狀態的轉換要根據慾望的重要緊急性、情緒的變換跨度等而需要不同的轉換時間。

慾望產生情緒的目的是間接影響或控制思維推理過程，主要是推理的速度、準確度、橫向範圍、縱向深度、能量消耗限制等；如在緊急情緒下決不會消耗過多能量搜索回憶幾乎已經遺忘的事物。

我們說「大腦」不僅知道生氣還知道生氣的原因，其中的知道生氣指的是情緒、知道生氣原因指的是對應慾望的達成程度。

那麼幽默是怎麼回事，我們能在「大腦」系統里實現么？當然能。幽默其實是在思維推理過程中與上一個或者預設的事實結果產生較大「意外」轉折，對應的情緒狀態是一種由緊張到放鬆的較大情緒轉折。

八、行動模塊。

此模塊的功能主要是接收來自思維模塊的動作命令併產生動作，在本具有閱讀和對話能力的「大腦」系統里就是輸出文字或語音。這裡主要說明系統產生行為動作的原理。

「大腦」在思考過程中會依靠慾望目標或其衍生目標來決定推理的方向，當推理到一定程度的特定問題情境便會採用與外界交互的形式來解決問題，此時會進一步確定交互的方式範圍，然後便會命令行動模塊產生對應交互動作，並在最後評估和記憶動作效果。

那麼最開始的交互動作方式的決策從何而來？是生物學上的動作反射。比如潛意識的躲避動作，就是遇到障礙並有安全危險時其對應的慾望目標不能滿足而產生的行動。對反射動作的決策我們要做好系統功能知識的內置「構建」（內置知識當然由邏輯符號連接），也就是遇到一定的情境直接由慾望模塊發出動作決定。

再高一級的動作決策就是生物學上的事實模仿，大腦記憶存儲過相應的問題情境，然後從當前問題情境搜索匹配到目標情境，進而產生模仿行為動作。

最高級的是「大腦」利用已形成的複雜關聯結論進過推理思考產生行為動作，但複雜決策形成的前提是學習，而動作交互決策學習的基礎又是慾望的動作反射和事實模仿。所以要想讓」大腦「變得更聰明，那麼「學習」過程是必不可少的。

九、「大腦」的學習。

顯然不能夠學習的「大腦」是不能說具有意識或者高級智能的，而我們這個「大腦」就能夠擁有這個能力，它可以「閱讀」或「對話」。

設想我們已經按照前面所說的內容完成了「大腦」系統的所有必要基礎功能。以慾望為中心的感知、記憶、思維、情緒、行動各模塊可以形成一個完整的與外界不斷交互的迴路封閉系統。

其中感知是信息由外部環境流向系統內部，而行動是信息由系統內部流向外部環境。本「大腦」系統在不斷處理流經的信息過程中其內部的記憶「知識庫」也在不斷豐富內容和提高質量，同時也意味著「大腦」更加智能。

這裡有最重要的一點就是所有的信息經過「大腦」加工後都是以邏輯符號為媒介連接不同物件事件的「知識」形式存儲，所有存儲記憶的「知識」在「大腦」的思維模塊里都可以直接利用，這裡的任何「知識」都是「大腦」程序可直接處理和認可的「代碼」。

我們的「大腦」可以通過閱讀各種來源的文章或者與人直接對話交互而獲得「智力」的提升。現在的互聯網有這麼多的文章「養料」，就把它們餵給我們的「大腦」系統好了。

十、「大腦」的意識。

舉一個簡單的問題，這個「大腦」如何知道「吃飯」這樣簡單的詞語意味這什麼？！本「大腦」系統對「吃飯」的理解大致過程如下。

第一步，「大腦」會將「吃飯」這個單詞拆分為「吃」和「飯」。

第二步，將「吃」和「飯」的詞語指代的對應記憶物件找到。

第三步，通過對應物件結構描述的邏輯連接符號向著相關的原子物件、原子感知元素方向邊查找和分析，找出其感知層面相關的原子感知元素。

第四步，分析找到的底層感知元素，如「吃」是一種動作、器官是嘴、目標解決飢餓，「飯」是一種能吃的物質、功用解決飢餓、滿足味欲之美。

第五步，找到相關原子感知元素里的慾望元素結構描述如飢餓、味欲，並分析自己目前對這兩種慾望的需要傾向。

第六步，整體分析「吃飯」到對應原子慾望元素的邏輯關係，形式推理計算出其慾望滿足傾向和程度關係。

第七步，依據慾望滿足關係狀態計算出相關情緒狀態變化。

第八步，依據相關情景進一步推理、嘗試和確定交互動作。

第九步，命令控制行動模塊做出動作。

以上即是本「大腦」系統對「吃飯」這一事物理解過程的大致說明。其實從根本上說，只要「大腦」計算出慾望滿足方面和傾向程度就算其已經理解了「吃飯」意味這什麼。

十一、綜述。

以上即是本人對這個具有閱讀和對話能力的類腦意識智能系統的設想與架構的主要內容。

由於這樣的系統涉及的知識範圍很廣又異常複雜不能夠在此過多展開和完全清晰講明。

重要的是本人認為自己講明了對「意識」的觀點態度，以及實現一定程度具有真正類腦意識智能系統的可能或可行的途徑。

我相信在不久的將來人類一定能夠完全破解「意識」的奧秘，並且創造出具有或者超過人類本身智能的具有正真智能意識的超能「機器人」。