通用智能系統框架討論-人工智慧、神經網路與腦科學
通用智能系統框架討論
基礎神經網路與概念融合認知系統(一)
一、前言
這是一篇討論如何實現智能系統通用化的文章,內容主要從計算機、電子信息、生物與腦科學等領域展開,也進行了一些關於CV(計算機視覺),NLP(自然語言處理),DNN(深度神經網路),大數據網路等細分領域或抽象概念之間如何有效融合的討論,並以此初步描述一個通用智能系統架構,僅供有興趣的朋友參考交流。文章不涉及複雜公式定理,基本通俗易懂,也希望大家在閱讀之前已經對現代計算機架構、通信原理、編譯原理、計算機語言,生物學、腦科學等學科的基礎理論有一定的了解與自己的看法。
由於通用智能的概念涉及較廣,許多方面有待完善,歡迎各專業領域朋友提出相關意見與建議,共同討論。個人認知難免有局限,文章內容也並非一成不變,系統框架也將隨著認知拓展和完善,期待與各位共同探索。
二、通用人工智慧系統(AGI)相關現狀
目前關於人工智慧(AI)的各種消息層出不窮,其中有關通用智能(AGI)的討論不多,也難以找到相關資料,或許因為人工智慧概念已被過度宣傳使得通用智能的概念顯得更加脫離實際,也可能是大家喜歡各自鑽研,沒有時間精力分享溝通。
我們應該正視智能與通用智能系統未來的發展潛力,哪怕短期內不能達到預期效果,向其推進的過程也將會是推動社會發展的一股重要力量。相信大家也已經認識到,連接是一切的基礎,通用智能這一領域涉及面較廣,更是需要社會廣泛力量通力合作,眾人拾柴火焰高。
人工智慧概念提出於1956年,之後幾經起落,隨著如今社會和計算機網路與硬體的發展,終於迎來前所未有的爆發期,真正走進社會主流視線,也發展出了許多具有實際意義的智能系統,如圖像識別,語音識別,自然語言處理,大數據神經網路,智能助手,各領域專家系統等。
如今人們對人工智慧都已經形成了一定的個人看法,無論好壞,其都已經在事實上影響並推動著社會發展。
通用人工智慧則在人工智慧的基礎上提出了(或者說強調了)通用的概念,然而通用本身並不好界定,本文將其看作能夠涉及人類認知中儘可能多乃至一切可拓展的領域,各領域達到甚至超越基本生物認知水平,其中遷移學習的能力十分關鍵。
使用通用人工智慧AGI的概念或許只是為了與日漸代表細分領域的AI概念相互區分,我們可以將AGI簡單理解為各領域AI能力的功能合集,類似生物體負責各項功能的腦區共同連接協作,組成生物大腦。
目前全球範圍內已有許多通用智能研究項目,研究方向包括了邏輯連接,語義匹配,神經網路,認知學習等,其中較早期的項目如CYC已立項近三十年,其目標是將人類主要知識作為關鍵詞條錄入電腦,通過一定的推理斷言系統加以連接,用以描述人類常識並達到一定程度的可用性。也有分層級模仿生物神經網路的項目如HTM,Neurogrid Project等。
三、神經網路與概念融合基礎認知系統(NCBL)
目前流行的人工智慧項目大多隻針對單一領域甚至單一環境變數集,或許應該稱為專用人工智慧系統。一些有實力的機構或許已經構造了一定的通用智能系統軟硬體體系,並從最基礎的領域(CV,NN)開始實踐驗證與推進融合,而其他大多數組織推行的項目卻仍然只是初級的模式識別。
當然我們知道通用或許都由專用發展而來,然而在系統設計之初如果沒有考慮其功能實現的底層基本邏輯,只是為了應對單一環境調整出一套似是而非的結果優先系統,除了難以較好實現其功能外也幾乎無法解析與拓展。
單一的神經元系統模擬工作幾乎都從人類某個相對先進的具體能力或生物獨立系統出發,比如視覺系統,個人認為視覺理解系統在人腦里牽涉到許多其他複雜系統(概念區分,邏輯區分,三維空間理解等),不適合單獨構建。而哪怕在某方面取得了不錯的成績,還是會因為其局限性無法遷移與適應智能需求。這對通用智能需求而言,就像建設空中閣樓,沒有基礎。
現在我們已經可以通過一定量的訓練,讓一個系統很好的辨識某種動物,或者對一篇文章做匹配型的閱讀理解,然而到目前為止,這種辨識只是模式識別,並非真正理解。當我們看到一隻貓或聽到別人談論貓,我們理解的是貓本身,而不單只是它們看起來長什麼樣或單詞怎麼拼寫。我們需要一個更統一的架構,能夠連接畫面,聲音和語義這些被分散的概念,或者說真正理解這些概念。
怎麼設計這樣的系統呢?如果暫時沒有頭緒,我們可以先觀察一下周圍的世界,看下是否能夠找到靈感。不難發現,生物大腦本身就是一個很好的智能例子,我們或許可以參考生物神經網路進化與嬰兒學習過程搭建我們的系統,並通過綜合調控與訓練,循序漸進的完善這個系統。
【題外話】生物所有系統功能都是在統一的基礎框架下發展而來的, 在功能上,生命任一單一功能或非最優解,但都是在系統已有結構的基礎上發展而來,生命形式就整體而言目前仍是自然與人為選擇中的最優解,未來我們或許可以找到相對現在整體生命形式而言的更優解,但這無疑將會建立在我們對自身認識的加深與AGI系統一定程度的探索與實現上。
為方便交流,本文將提到的神經網路與概念融合基礎認知系統可以簡稱NNCCBL或NCBL(Neural Network Conceptual Connection Basic Learning)。
生物神經網路與概念融合認知系統(NCBL)是一種結合生物神經網路起源與進化過程中的有效啟示,通過各種計算機神經網路系統模擬生物初級神經網路系統,參照生物大腦構造,按生物神經網路進化過程逐步完善,通過接觸,整合併學習真實世界數據(視聽觸等各種感測輸入數據),完成基礎概念到計算機神經網路映射,訓練能夠實現各種功能的計算機神經網路連接形成有效概念與邏輯,從而獲得類生物認知能力的學習系統。
自然生物如此多種類的神經元與如此複雜的神經網路是怎麼發展出來的呢?或許不是什麼已知的智慧設計的,至少人類暫時也沒有這個能力,我們只能假設這是適應外界環境發展出來的。
我們的AGI系統也應該通過各種感測器儘可能多的接觸外部世界,以生物起源中樞神經到現代智人大腦為參考模板改進硬體基礎,同時參考人類嬰兒到成人的學習過程描述複雜世界,真正映射整合自己的概念意識。
當遠古早期生物的光感系統說要向左走,溫感系統卻說要向右走時,怎麼辦呢?這或許就是神經決策系統出現的原因,或者說最初的「我」出現的原因。假設適者生存的環境已經教會我:光線影響能量獲取,溫度則影響生存,還有其他許多條件有待發現,而我必須找到一個平衡,那麼我將越來越精於此道,直到成為現在的我。
或許AGI系統的神經元設計與網路模塊整合,可以依靠改進適應環境的規則與大量連接現實世界的實踐演化得到。學習生命起源是為了更好的模擬意識起源,應該指出的是,仿生並非完全照搬,只是為了在推演的過程中找到我們真正需要的東西。我們需要獲得足夠詳細的信息,才能知道什麼才是需要被了解的。
本系統將從生理到心理上直接面對生物起源這一基本問題,並從中得到啟發,下面用一些篇幅對相關概念做出解釋,通過生物學與腦科學的視角,描述個人理解的神經網路之所以稱作神經網路的原因。
關於生命起源
連接是生命第一個,也是貫穿始終的關鍵,從共價鍵到DNA、單細胞到多細胞、神經元到大腦、個人到社會、社會到星球,星球到星系、乃至浩瀚星河,連結是一切存在的基礎。
生命起源科學界暫無定論,下面是一些個人對生命起源的看法。
生命物質起源的故事無時無刻不在發生,今天地球上仍有原始物質的聚合分化。如果我們把某種生命物質生存主導的環境叫做某種生態位,最初的生態位從第一批生命形成時就開始被佔據,之後一級級推進,生物大致經歷了原子分子生態位、大分子生態位,細胞生態位,多細胞生態位,多器官生態位,多組織生態位直到今天。生態位競爭激烈,且會相互影響,一個生態位若無空缺,後來者難以居上。有生命物質存在的地方,基礎物質會被相對高效地轉化成生命物質,直到環境允許的上限。生命形式受各種環境指標(基礎物質種類配比,溫度,引力,電,磁)影響,並非生命神奇的適應了如此的環境,而是既定的環境造就了既定的生命。
我們暫時認為生命的發展過程從無細胞結構(包括病毒)到細胞結構,原核生物,真核單細胞生物,植物(真菌,植物(藻類,裸蕨,蕨類,裸子,被子),動物(原始鞭毛蟲,多細胞生物,脊索,脊椎,兩棲,爬行,鳥,哺乳動物,智人)。
DNA是自我複製系統的關鍵物質,是一代生物傳承的起點,也可以說是所有生命的起源物質。
如今地球生物DNA作為一種長鏈聚合物,編碼組成有四種脫氧核苷酸:腺嘌呤脫氧核苷酸(dAMP,C5H5N5 )、胸腺嘧啶脫氧核苷酸(dTMP ,C5H6N2O2)、胞嘧啶脫氧核苷酸(dCMP ,C4H5N3O)、鳥嘌呤脫氧核苷酸(dGMP,C5H5N5O ),脫氧核糖(C5H10O4)與磷酸分子由酯鍵相連,組成其長鏈骨架,排列在外側,四種鹼基排列在內側,成分均為環境相對富含物質。
我們可以認為DNA的每一個基本組成部分都可以在自然界里直接聚合出現,從宇宙誕生開始,幾乎無盡的基礎物質根據各種規則相互演化作用,在某個相對平和的環境里,基本化學作用使這些原子分子可以較穩定的連接聚合 ,這或許就是類DNA的前身。
原始物質大分子向類DNA過渡的關鍵是複製能力,掌握複製功能的類DNA可以很快的擴張勢力,佔據第一個生態位(原子-分子空間生態位),第一個生態位很快被佔滿,複製難免出錯(或許也為了適應環境),卻成了進化的主要促成部分,大量原始類DNA物質提供了充足的複製變異基數,某些類DNA開始變異,合適的變異可以調控各種蛋白質大分子,獲得存續優勢,另外一個關鍵的作用是聚合,不同的類DNA可以相互聚合或自生長以形成有效的長鏈,長鏈之外也可以聚集各種物質,經過億萬年的發展,出現了無細胞結構的生物大分子個體(例如各種病毒)與單細胞生物。
病毒的生存方式依賴於入侵其他細胞,有些人稱其為細胞結構前的生命物質,卻由於其特性難以獨立發展。
單細胞生物向多細胞生物發展的過程類或許有些似於類DNA大分子向DNA發展的過程,DNA由於結構特點聚合生長形式為不斷變長,單細胞生物佔據細胞生態位後卻能組成更大的團體群落。
單細胞群落中的個體隨環境穩定的時間變長開始分化:單細胞生物DNA持續變異,某些細胞得到了新能力,其分裂的後代能夠依外部環境或分裂模式不同而表達出不同性狀,比如群落頂端的細胞有更多的葉綠體,群落底端的細胞則有更強壯的鞭毛。
我們知道,大部分情況下群落生存優於單打獨鬥,各種表達不同的細胞承擔了細胞群落里的不同分工單位,比如趨光,趨暖,位移等,這些或許就是器官的雛形,而如同DNA最關鍵的功能是複製,初期的器官雛形中最關鍵的則是類生殖器官。
又是億萬年的進化,類生殖器官也逐漸成型,這是一種快速複製單細胞族群的器官,也是多細胞生命出現的關鍵器官。最初或許只是源於分化群落的某個分化細胞功能傾向於分離並且獨自發展成分化群落(孤獨而浪漫的流浪者), 如今生殖器官的複雜功能就這麼一步步進化而來,而那個不安分的細胞種群就是如今的精子,卵子等生殖細胞雛形(社會發展永遠需要探索未知邊境的個體,或許我們不能說這其中沒有什麼關聯,只是目前暫時不是討論的重點)。
自從有了生殖器官,後面的故事相信大家已經有所了解。DNA完成了單細胞生物的遺傳複製,生殖器官則提供多細胞生命的共享DNA表達場所,或許還參與表達規劃,其中最為關鍵的生殖細胞,則是生命延續的實際載體。
【資料】一般認為多細胞動物起源於原始的單細胞鞭毛蟲類,因為它們有許多種類表現出向多細胞狀態發展的傾向,如團藻、空球藻等。在胚胎髮育中多細胞動物是由受精卵開始,經過卵裂、囊胚、原腸胚等一系列過程逐漸發育成成體。多細胞動物的早期胚胎髮育基本上是相似的。根據生物發生律,個體發育簡短地重演了系統發展的過程,可以說明多細胞動物起源於單細胞動物並且說明多細胞動物發展的早期所經歷的過程是相似的。
關於大腦進化
前文簡單描述了生物進化歷程,本章以此為基礎描述生物大腦進化過程,涉及內容與生物乃至人類認知實現關係密切,後續我們也將以此為基礎,描述通用智能系統(AGI)設計思路。
我們暫時認為單細胞生物只具有一定程度的應激行為,對於多細胞生物而言,重要的能力除了繁殖,還因為個體複雜性的增加與生存周期的延長(單細胞生存周期以日記,多細胞動物生存周期以年記),進化出了一類器官負責統籌行為,以便於適應更廣泛的生存需求。
我們將這類器官稱為神經中樞系統,其於動物體內逐漸發展匯聚,並因處理效率所需,在腔腸動物距離眼睛與取食道較近的地方匯聚成一系列組織,經過億萬年進化,成了如今哺乳動物大腦。
而隨著後來的智人大腦皮質日漸發達,認知功能發展完善,慢慢成就了如今的人類王國。
大腦進化史上同樣經歷了許多重要時期,為了方便描述與理解,本文亦按時間與進化程度將其描述為爬行動物腦,邊緣系統-古哺乳動物腦,新皮質-新哺乳動物腦。
爬行動物腦是生物基礎腦,為生物進化史上最先出現的腦區,這些腦區負責身體的基本控制功能,諸如維持呼吸心跳,控制普通運動及身體平衡等,許多腦區睡眠中也保持運作,但是幾乎可以說沒有運動以外的學習能力。
爬行動物腦的生理構成包括腦幹-延髓、腦橋,小腦,中腦以及最古老的基底核-嗅球與蒼白球。
如今自然界可供參考的代表動物有蛇,蜥蜴,鱷魚等。
邊緣系統-古哺乳動物腦是生物中間腦,其可以看作在爬行動物腦的基礎上新生長出了一系列腦區,這些新增腦區在實際大腦中也基本覆蓋於爬行動物腦外,與生物的情感,直覺,性等行為有關,是古老的喜、怒、哀、樂與注意力系統所在之處。
貪婪,暴怒,偏執、自卑與慾望也都可以在這個腦區找到生理基礎,其幫助生物判斷事物基本價值與特別之處,進行簡單的趨利避害活動,這些功能又與第三層腦區新皮質有著十分緊密的合作,乃至衝突,我們可以看到,古代智人甚至現代一些人類個體在衝突中都有偏向以其作為行為主導的現象。
邊緣系統主要腦區包括:
下丘腦:參與控制心率、呼吸與應激響應,調節激素水平。
海馬體:形成記憶,存儲短期記憶,是意識組織的內存。
杏仁核:參與各種情緒活動。
如今自然界可供參考的代表動物有老鼠,兔子,老虎等。
新皮質-新哺乳動物腦是生物高級腦或理性腦,其可看作在前兩種腦的基礎上再次發展出了一層全新的腦區,在大腦的物理層面也再次將前兩個腦區完全覆蓋。這一腦區由一種進化程度較新的皮質組成,也包括皮層下的神經元群組,其所提供的高階認知與理性思維是靈長動物的創造力之源。
如今許多哺乳動物都已經發展出這一腦區,大多相對較小而少溝回,人類新皮質卻佔據了腦容量的三分之二,在腦殼與古代腦之間的狹小空間里曲折分布,外觀滿是褶皺。或許與其他腦區結合太緊密,人類失去皮質將與植物無異,相比之下,老鼠失去皮質仍可運動。
新皮質分左右半球,也就是俗稱的左右腦,左腦控制右側身體,更多負責邏輯,理性,語言;右腦控制左側身體,更多負責空間,抽象,藝術。
又可按位置與功能具體細分為額葉、頂葉、顳葉、枕葉四個部分:
如今自然界可供參考的代表動物有狗,海豚,猩猩等。
我們可以看出,這幾類腦可以說是生物進化不同階段的產物,新系統在大腦內部也基本如同物理疊加般覆蓋在舊系統之上,每一個新階段均是在前一個階段的基礎上完善已有系統功能或新增更多高級系統功能發展而來。
需要指出的是,分階段描述只是為了方便理解,實際上生物進化歷程漫長而循序漸進,各個腦區或新舊系統之間大多有不同程度的連接,這些子系統各司其職,共同完成如今的生物大腦功能。
四、生物神經網路與概念融合認知系統設計
討論一切問題都應該有範圍與參考系,也應該有一個起點,或稱為系統錨點。
由於現在需要解決的是創造一個能夠認知的「我」的問題,方便起見,這裡便以「我」為起點。我之於外部世界,首先是一個實體,實體是一切存在的基礎,無論可見的未來如何發展,實體基礎不可或缺。更具體些,我就是一套實體的硬體系統,與其上運行的軟體系統。
硬體系統概述
硬體是一切的基礎,下面簡單描述類生物系統映射,具體視情況選配與使用替代即可。
1.決策系統
主機(類似生物大腦,類計算機)
可以簡單看作一台計算機,如常見的個人計算機。
目前計算機體系結構以圖靈機理論為基礎,屬於馮·諾依曼體系結構。本質上,圖靈機理論和馮·諾依曼體系結構是一維串列的,而多核處理器則屬於分散式離散的並行結構,系統運行中經常需要解決二者的不匹配問題。
而因當下計算機系統不能滿足百億級神經元並行處理的計算需求,大量傳統與初創公司已經開始設計布局新一代計算機晶元。從CPU到GPU,FPGA到ASIC,甚至未來的量子計算機,改進計算機體系,設計一個合適的結構,將不再是僅限於被動匹配或掛起的問題。
決策系統若因為性能原因導致移動不便,以無線連接方式連接其餘系統。
可拓展
2.輸入系統
類計算機(決策系統的自反饋,中斷等,生物無時無刻不受自我影響)
類攝像機(類似生物眼睛,感受光線,視覺輸入系統)
類麥克風(類似生物耳朵,感受波動,聽覺輸入系統)
類覆式壓力計(類似生物皮膚-軀體感應器官,觸覺輸入系統,分時段確定系統常態量)
類覆式溫度計(類似生物皮膚-軀體感溫器官,溫度輸入系統,分時段確定系統常態量)
類化學輸入系統(嗅覺味覺輸入系統)
類陀螺儀(平衡與加速輸入系統)
類天線(無線電接受系統)
等......
可拓展
3.輸出系統
類屏幕(表情語言-畫面輸出系統)
類音箱(語音輸出系統)
類輪式或足式移動肢體(位移系統)
類機械臂(物理互交系統)
類無人機旋翼(飛行系統)
類天線(無線電發射系統)
等......
可拓展
4.能源系統
為各系統提供能量。
5.信號傳輸系統
連接輸入-決策-輸出與其他所有系統,整合感測器所有輸入信號傳輸至決策系統,將決策系統輸出傳輸至輸出系統,包括有線系統,無線系統(非物理連接器官)需保證帶寬。
例如決策系統若因為性能原因導致移動不便,則以無線連接方式連接其餘系統。
6.整體維持系統
綜合維護整機系統運行。
設計原則
1.當我們利用計算機模擬認知進化系統,首先要給出環境變數,如果環境變數規模太小,進化不了多久就到頭了,規模太大硬體會很吃力,且易陷入混亂而無意義的糾纏。
我們暫時沒有能力模擬高質量的世界,只能從簡單三維世界的模擬搭建開始,逐步訓練與完善我們的世界系統與智能系統。兩個系統之間應該是相互獨立的,從簡單到困難,世界系統的規模與規則設計是得到正確智能系統進化路徑的關鍵,我們將在以後詳細討論這個問題。
除了設計虛擬系統,我們也可以使用感測器導入儘可能詳細的真實世界的變數,這是真實世界大數據的意義所在。
未來我們的智能系統或許應該是在虛擬與真實的世界中交叉訓練的,我們將會搭建並逐步完善一座連接虛擬現實的橋樑。
當然,一個相對完整的硬體系統至少不會是一件壞事,其中取得大數據的各種感測器不可或缺。
2.輸入與輸出系統可選配,為了更好的理解(概念映射)真實世界,得到足夠的大數據支持,方便人機雙向獲取同感,原則上以一個模擬目標生物為藍圖進行配置,比如我們可以首先嘗試設計一個類昆蟲或爬行動物智能系統。
現在製造技術無法給出高性能實體,只能使用替代方案,沒有替代的可暫時使用假體,並留出拓展空間,未來逐步完善,可多配,不少配。給定實體有利於理解現實世界,而給定類人實體,則幫助融入人類體系。
3.所有生物體額外硬體系統均按實際需求設計,各部分區分並不獨立,例:
觸覺溫度輸入系統可覆蓋全身所有外露部分包括機械臂;
機械臂輸出系統可隱蔽性兼顧化學輸入(嗅覺味覺輸入系統)系統;
屏幕輸出系統可兼顧輸入系統(觸摸屏);
等......
軟體系統概述
關於軟體
平衡各感官輸入並做出決策輸出或許就是早期神經決策系統出現的原因,或者說最初的「我」出現的原因。
《淮南子》里說:「昔者倉頡作書而天雨粟,鬼夜哭。」古人以此表述文字的神力。
短短几字便可在腦里構造奇異情景,文字概念確實擁有神奇的力量。
而我們的文字與世界都是以一個個概念去表達,理解與聯繫的。
十數萬年前發明語言之時,我們用一個「我」字找到了自己,如今通過腦神經科學,計算機與從生物進化史起點開始的概念映射研究,則可以幫助我們更好的認識自己,或者說,認識(找到)真正的自己。
軟體系統為精神上的「我」,實現決策與各硬體系統的管理,存在於硬體決策系統之中,存續時間內保持多任務處理狀態。
本系統並非一開始便要完全解開神經元與神經網路的一切迷團,我們目前也無法做到,本系統將通過學習與改進,首先給出一個可以自行工作,學習,進化的初始狀態,逐步修改參數,使之在一定的系統架構中,在規則的完善與適應外部的大數據中學習進化。
系統有一定許可權,可以自行更改或增加神經元,甚至一個系統腦區,只要認為需要,我們要做的就是設計讓系統如此運行的方法。
生物總體輸入的大數據構成了感知輸入的一切,等同個體的全外部世界,比如生物在沒有進化出眼睛時,外部光線沒有太大意義,沒有類天線時,無線電與宇宙背景輻射沒有太大意義。
這裡強調數據輸入的重要性,所有神經元,無論是面向外部還是內部系統,最終都是為了處理真實世界數據,此聯繫不可分割。
單神經元與神經網路設計(參考生物神經元,單細胞生物個體,多細胞生物個體)
我們希望設計一個軟硬體整體系統,可以在越來越少的人為干預下於外部環境中自行學習,進化,改進神經網路。
例如嘗試設計一個利用鞭毛移動,趨光避高溫寒冷的簡單多細胞生物。
神經網路設計
1.設計神經元節點,通過連接組成神經網路。
2.每個神經元有一定運行方式,比如高溫敏感神經元在溫度40度左右觸發,低溫敏感神經元在4度左右觸發,均向控制同側鞭毛活動的神經元傳導擺動信號,單個容量設置初始空間大小,設置處理空間大小上限。
3.每個神經元有許多輸入,只有一個輸出(我們知道信號篩選是信號處理中一個比較重要的環節,實際上也貫穿信號處理的始終,神經網路中單個神經元多進少出的連接方式有利於在結構上實現篩選功能,放大到整個神經網路,在大自然資源有限的情況下,專註往往是優於分散的,對於作為決策者的我們而言,大致可以反映為一心不能多用),根據所有上一跳信息處理下一跳信息。
4.類生物大腦方式(神經元群落激發神經網路)理解,儲存,提取,對比與連接各種概念。
5.當神經元增多(接近人腦需百億級別),無法避免計算局限,需要逐步優化軟硬體系統,目前這是一個關鍵局限。
神經元結構圖示,我們無需模擬神經元的一切,只需認清我們需要的功能並加以實現,例如飛機無需開發鳥類翅膀。
系統初始化與拓展
下面以生物大腦解剖學為基礎,按各腦區主要功能為參考設計一些系統,各系統包括但不限於這些功能,整體智能架構也不限於這些系統。各系統功能間也相互連接與融合,目前的區分只是為了方便理解。
1.時序運行與自反饋系統(類爬行動物腦主要功能)
給定離散時序處理單元,每一刻的我為上一刻的我的輸出與外界輸入的延續映射,主要完成基礎自我認知、應激反射、注意機制與運行維持功能。
2.概念系統(對錯判斷,邏輯思維繫統,類皮質)
如同神經網路的一切都是神經元的功能與連接,生物意識的一切則都是基本概念的定義與連接,較高級的自我認知與行為指導系統。
3.情緒系統(好壞判斷系統,類杏仁核)
原始生物用以判斷事物的好壞,指導自身行為,較原始的行為指導系統。
4.注意力控制系統
輸入篩選,中斷響應
例如可以多進程處理系統,同時處理多層級,多線程事件。也可以單線程集中系統,集中處理單線程事件。
5.二維-三維空間系統(類枕葉前端)
作為外部世界的映射區,幫助映射與理解世界
6.視覺處理系統(枕葉)
人類的視覺都是二維輸入,三維認知。視覺處理系統連接三維建模系統,用於直觀理解世界。比如理解貓的形象,不是一幅平面圖,而是一個立體模型。
7.聽覺處理系統(從腦幹到皮層)
8.記憶系統(海馬體,額葉)
存儲並完善生物的認知庫,類似一個巨大的先驗庫。
實驗一
1.在腦里想像一匹馬。
2.從各個方向想像這匹馬的細節,包括正面、後面,側面、背部,腹部,體內等。
3.請盡量完善這匹馬的細節,你可以想像的多清晰?馬蹄馬嘴具體長什麼樣?肚臍在哪?
結論
1.一般人對一個三維事物的印象是三維的。
2.一般人對一個事物的印象都是相對模糊的。除非有過專門的記憶訓練(比如素描),你甚至連自己每天用的鑰匙和手機都無法在腦里精確重現,一切記憶都只有不同程度的模糊印象。
3.哪怕確實素描過一匹馬,你也無法在想像整匹馬的同時保持細節的精細,你只能一次重構有限的部分,人腦處理三維空間的物質經構成是有限的,只能支持一定的工作量。
拓展
1.一般人所有記憶都是模糊的,包括重要的記憶,比如畢業那天的場景,很多人的畢業典禮都會出現學士帽,你是否能夠準確描述當時你的學士帽的樣子?還是在許多年後的回憶里只能描繪出幾乎可以出現在所有畢業場景里的,一般的學士帽的樣子?一些不重要的細節或許早就丟失在時間裡。
3.我們的回憶,只是概念的模糊三維空間重組。
4.大腦印象存在著某種類似下意識(模糊)匹配機制,雖然不能主動想起細節,但是真實世界的細節變動達到一定程度仍會引起察覺。
5.......
9.學習系統
發現並學習新概念,有一定的自主變動能力。未知是生物恐懼的主要來源,而學習未知事物是生物生存期間需要一直保持執行的。
10.運動與軀體控制系統(小腦)
活動控制與各種預設區。
11.其他系統等,所有系統相互連接與融合
系統綜合,例如:平時看到的一切,系統判定有需要便可以建立並逐步完善三維資料,對需要注意的新事物映射概念。
12.世界系統,與智能系統相獨立,用於訓練智能系統。
訓練場景一、虛擬世界LV1
設計一個以真實世界規則為基礎,初始環境簡單的虛擬三維世界,智能系統在此世界中進行生存遊戲,完成後升級虛擬世界(加入更複雜的事物與生存難度),不斷完善虛擬三維世界。
訓練場景二、真實世界三維記憶迷宮
1.訓練目的
模擬一個類生物,電量少則找地方充電,電量充足則不停探索房間。
2.策略
系統通過觀察房間,記憶系統生成並完善房間印象,完成對陌生事物的觀察學習。
例:按規律每次鈴響後提供不同的充電地點,只有限定時間內克服障礙接近充電地點才能充電。
3.主要硬體系統
決策系統:計算機等
輸入系統:視覺,聽覺,溫感,壓感等
輸出系統:位移系統,機械臂等
4.定義系統
定義場景主要目標,生成概念,生成概念連接邏輯。
拓展:一些物體與概念不明意義可先儲存,作為印象,日後再連接其他概念與實際行動進行學習。
5.過程......
以上訓練目標是找到合適的神經網路運行模式,完善智能系統設計理論,對軟體到硬體設計提供改善方向與理論支持。
基礎世界概念
所有這些系統中,概念系統可以類比為皮質前額葉,是我們認知世界的關鍵。
如同神經網路的一切都是神經元的功能與連接,生物意識的一切則都是基本概念的定義與連接。
而尋找神經元網路到生物概念的具體映射方案,則是本系統需要解決的主要問題之一。
下面對基本概念學習(BL)做一些解釋,或許你會發現許多觀點與人工智慧初期延續至今的符號學習不謀而合。
我們用各種概念理解這個世界,概念之間相互連接與融合可以組成新的概念,所有這些概念組成了我們的概念世界。
一切事物都有起點,概念也不例外,本文將最初的概念稱為定義概念或基本屬性概念。
這是一類重要的基礎概念,基礎的意思是他們大部分屬於真正客觀的概念,不只是人類,哪怕是原始爬行動物也可以理解,與應用。
而如今人類世界如此多的概念就是在原始概念中引申出來的。
當然,隨著智力的提升與對世界的深入理解,基本屬性概念可以不斷拓展增加亦非不可被融合引申,牛頓發現萬有引力,或許便是引申了物體下落的基本屬性概念。
下面對基本屬性概念舉例說明,這些概念在這裡並不只是一個語言符號,而是真正客觀世界的度量:
1.對於原始智人而言,描述一個石頭的關鍵點不是它叫什麼,而是這個物體的外觀,大小,輕重,軟硬。無論今天人們給它的定義是花崗岩還是玄武岩,原始人根本不在意這東西的名字,只關注它是否足夠堅硬,是否可以用來砸開堅果,或者磨成石器。
2.對於古爬行動物而言,描述一顆樹的關鍵同樣不是「樹」這個字元而是一些外觀,大小,與觸感方面的特徵,考慮到爬行動物還無法全面充分理解樹的所有屬性,樹在它們眼裡可能是:外表相似的棕色的杆子上頂著一團綠色的玩意,無法移動,一般較高大,觸摸硬度光滑度適中,食物(好處)聚集之處。
我們就是這樣,用各種概念理解這個世界,概念之間相互連接與融合又組成新的概念,所有這些概念組成了我們的概念世界。其中一類基礎概念本文稱為定義概念或基本屬性概念,也是上文原始生物用來認識世界的基本概念。(重要的概念表述多一次)
我們或許可以這麼說,一個定義概念如同一組神經元,只要定義完成(對一組神經元而言就是連接與遞質環境調控完成),日後達到條件就可以理解(通電),(一般)不再多問緣由。
當然,實際上一切定義皆可引申。
下面簡單總結一些定義概念(基本屬性概念),在這裡其代表的含義同樣並非字元本身,而是其背後意義。
1.初始定義概念:我(區分我與外部世界,自我意識與系統錨點)
2.生存定義概念:好,壞(趨利避害)
3.程度定義概念:多,少(程度判斷,甚至是微觀量子到宏觀物理的跨越)
4.感官定義概念(在一個參考錨點下的一切度量單位):
視覺描定義念:遠近,大小,明暗,顏色,花紋(平面立體幾何特徵),
觸覺描定義念:大小,冷熱,軟硬與材質(各種觸感)
聽覺描定義念:遠近,大小,尖銳與低沉
嗅覺描定義念:好壞(香臭,主要食慾相關)
時間描定義念:遠近,長短
空間描定義念:相對大小,相對位置
5.拓展基本屬性概念:例如各種進位規定,1+1=2,男女(原始古老生態環境不具備,一定意義上的基本定義)等......
我們知道,生物的一切都基於感官描述概念,其甚至應該放在其他所有概念之前,這裡因為一些結構性原因作加粗處理。
以上每種描述概念都可以按具體程度區分等級,比如電腦的明亮度可以簡單分256級,大小與長短程度又可以各種單位(米、平方分米,等)區分,所有這些定義概念相互結合共同構成了各種認知概念。
例如:對一隻烏鴉來說,人這種生物可以描述為:人形(綜合感官描述),壞(生存描述-接近有危險),好(生存描述-接近有吃的)
人形、好、壞等又可以細分成各種概念組合,直到基本概念組合......
我們可以看到描述中存在著好與壞這兩種矛盾的屬性,需要用各種概念程度具體區分,現代理性大腦的主要意義就是處理這種矛盾,烏鴉似乎也學會了一些。
五、總結
前面簡述了個人的一些粗淺想法,稍做記錄只為拋磚引玉。AGI項目涉及學科十分廣泛,包括且不限於傳統意義上的數學,物理,化學,生物工程,計算機工程,通訊工程,材料工程、社會學,哲學等。實際上基於通用定義而言,AGI與人類過去、現在乃至將來的一切認知都將有所關聯。
每一門學科的存在都是用來完成相關領域工作與研究的,所有學科就像不同器官組織,共同組成了人類社會認知,如今我們想要開發通用智能系統,依靠少數學科是不夠的,甚至可以說,缺乏任意一門有實際意義的學科都是缺陷。
傳統社會注重工匠精神,木工鐵匠流連作坊,編程人員專精演算法,研究員埋頭實驗台,一項工作做到極致當然是好事,卻也難免成為個體難以逾越的局限。少數人掌握的知識,不管微不足道或是彌足珍貴,依舊只在小範圍流轉,意義甚至難以驗證,就像缺乏外部連接環境的神經元,難以發揮應有的作用。長期有效的系統從來都需要一定程度的平衡,所謂專精誠可取,博識不可拋。
比如我們知道計算機語言是一門與計算機交流的語言,其一切設計均基於目前計算機軟硬體架構,然而現行軟硬體標準有其局限,也難以長久滿足需求,整個體系背後涉及到的解決問題的實際方法才應該是我們關注的重點所在,而想要解決問題,只有不斷學習與探索,並於實踐中得出結論。
人類社會發展至今已經擁有相對海量知識,或許任何個人都難以在有限時間裡大量掌握。如果我們可以連接各學科,形成認知統籌系統,社會認知效率將得到有效提升。這種系統構成哪怕不如任一學科深入,卻能如人類大腦思維在不理解身體具體運動機制的情況下做到整體認知統籌,應是有利於人類社會發展的系統,甚至可類比於社會認知統籌大腦。
Google Brain負責人Jeff Dean說過:如果我可以對一個智能系統說:「找到所有關於機器人技術強化學習的論文,並對它們進行總結。」這個系統便可以自己運轉,在二十秒內完成任務,這系統將對人類非常有用。
現在我們還沒有這樣的系統,總結的事情暫時只能靠自己了。而研究通用強智能系統是一種對人類認知理解需求廣泛且深入的工作,其將來的成果也足以起到統籌社會認知的作用。
由於篇幅所限,討論內容暫時只涉及認知與方法論,也存在一定程度不嚴謹的猜測,總體是為了找出一個解決問題的辦法與系統框架。歡迎大家參與討論,共同完成接下來學術與實踐上的深入探索。
目前國內外主流AI項目之間的基本概念亦有許多重合之處,這些系統在實現方法上又與深度神經網路(DNN)與自然語言處理(NLP)多少有關聯,所有這些方法又多少都依賴於大數據與對抗訓練(GAN),或許也是條條大路通羅馬而恰巧探索者所見略同。
為方便交流,本文提到的神經網路與概念融合基礎認知系統可以簡稱NCBL(Neural Network Conceptual Connection Basic Learning),其在如今各種主流的神經網路與概念融合AI系統基礎之間增進融合併作了一些拓展描述,而其中最主要的不同之處在於強調了基礎與學習。
深度學習強調深,然而有效的結論或許不在於深而是規則探索,所謂化繁為簡,深度更像一個過程,無論是生物神經網路起源還是生物概念起源,其根本都在世界的基本規則。如果側重於代入並非嚴謹的人造概念搭建一個空中閣樓,對真正客觀世界的基礎構成視而不見,無異於緣木求魚,買櫝還珠。
現實的系統重點在於學習世界原本真實的規則,不強調灌輸人為概念或特定環境擬合,而是致力於區分真正的客觀與主觀,人類語言與認知屬可拓展部分,應在搭建好的基礎上進行學習。比如漢語和英語完全可以在同一認知架構上學習,無需分別構建基礎。如果在另一個世界也有高等智慧,他們亦只需要遵守基本物理規則,於外部環境大數據中進化,其餘或許無需多言。
我們的未來不必依靠現在的大腦思考,就像我們不必長出翅膀,依舊可以飛翔。
關於擔心智能技術失控的看法,個人認為技術本無罪,一切都是人們自己的選擇,我們需要做的,是不斷開拓認知邊境,並對掌握的知識與力量做好規劃管理。或許那樣的未來還有些遙遠,而人類自身亦可改進......
不知不覺寫成了長文,卻也難以面面俱到,其他留待日後探討吧。下一篇計劃嘗試討論計算機視覺與自然語言在神經網路中通過概念整合的具體細節,不管是視覺上看到,還是語言上聽到,最後都是理解與表達的問題,to be continued。
最後以小段文字畫面作結,致敬所有勇於探索與拓展人類認知邊界的前輩與朋友。
當你按下快門,時空於此坍縮;
哪怕山巒海壑,密林遼原,
蒼野積雪,流沙飛星;
我們學習世界的規則,
以規則定義我們的世界,
朝曦日暮,人流熙攘。
哪怕遺失時間,
滄海桑田素未謀面。
或在不同世界,
無法用距離作為概念表示遙遠。
我們相信,
宇宙無盡時空,
會有如同暗能量般的補丁,
填補一切,
不可能的因果。
六、彩蛋OMT
竟然看到這了,是不是因為字幕太短?
那再聽我為你描述一個科幻機器:
1.這是一個看不出作用的東西,或許很大,超過一棟別墅;或許很小,就像一頂帽子。
2.機器的統一外形下有著可以完成生物大腦不同功能的系統,從前的人們叫他人工智慧。
3.現在我們沒有讓他到處亂跑,而是戴在了頭上。
4.帽子完全覆蓋了我們的大腦,就像過去的新皮質覆蓋古老大腦。
5.生物大腦一切的腦區功能都可以在這頂帽子里找到映射。
6.不只是映射,一切都變的更清晰。
7.人們開始習慣帽子的存在。
8.一些人發現了帽子的拓展功能,還使用一些甚至覆蓋全腦的物理介面,更快的連接意識。
9.又一些人開始將大腦皮質與其他關鍵腦區的神經元信息複製到帽子的虛擬神經元里。
10.複製後來變成了剪切,剪切後模擬神經元仍模擬保留原來的一切連接。
11.他們每次只剪切很少一部分意識,甚至不到百分之一,卻花費更多的時間去適應。
12.經年累月,直到最後一次剪切。
推薦閱讀:
※【Neural Networks and Deep Learning】3.改進神經網路的學習方法(過擬合)
※【可解釋 AI 重大突破】DeepMind 構建心智理論神經網路讓機器互相理解
※從下往上看--新皮層資料的讀後感 第一部分:皮層細胞
※論文解讀 | 基於神經網路的知識推理
※《麻省理工科技評論》全球十大突破性技術,阿里巴巴正研究其中4項