如果把人類的所有功能動作都用程序編寫出來,要多少容量?

例如一個跑步,如何平衡,能不能量化?


@Lancemu 的答案,有對也有不對的地方。

DNA 是一個非常緊湊的結構,它的解釋是多層的。也就是說,部分 DNA 定義了其它部分的「解釋器」,而且這個定義還可以是多層的。也就是,如果把 DNA 看作一個程序的定義,那麼這個程序需要幾年才能 boot 起來,這個和一般我們直觀上的 runnable system 有區別。而且這個系統在 boot 過程中還需要不斷填入數據進行訓練。如果我們要定義一個 self-contained 系統,這些數據也是系統的一部分。那麼容量就不止 DNA 的編碼量了。

所以 @Lancemu 和 @Milo Yip 的答案,一個是可以發起 boot 的最小數據量,一個是系統已經 ready-to-run 的數據量。


成人的突觸數量大概是 10^{14} 的數量級 [1],那就是 100T 的數量級。當然這是整個神經系統的量,可把這個當作上限,如果只需要做跑步,需要的數量少得多。具體需要多少,可用人工神經網路來模擬所需運動,從而作出估計。

[1] Drachman D (2005). "Do we have brain to spare?". Neurology. 64 (12): 2004–5. doi:10.1212/01.WNL.0000166914.38327.BB. PMID 15985565.


ai狗:我們需要很多的計算資源。

軟工狗:經過合理抽象,我們發現很多時候很多人的功能意外的少。

硬體狗:程序總會寫出來的,我們所欠缺的是各種感官的感測器。


@Lancemu @馮東 @Alyc

手機實在不好圈人 圈了幾個名好打的先==

單獨開個答案討論一下

lancemu這位答主說的,其實沒錯,人和其他物種需要的東西已經包含在DNA里了,再考慮到轉錄也就是編譯器的問題就可以了

而變異的問題,如果我們已經弄懂編碼規則的話,直接按需求寫就好,不需要變異來提供物種多樣性和內部的不同

爭論最大的部分,環境和後天影響,根本就不屬於人自身所能控制的,本問題不涉及

如果非得要考慮,現成的例子是aida的framework,包含了環境、交互、家庭、人際關係以及一切能對行為產生影響的東西,不過這已經遠遠超出本題討論的範圍了


如果僅僅指肉眼可見的運動,我看過這麼篇文檔:

The Physics of the

Human Body

Companion Manual

Physics 3110

Autumn Semester 2002

裡邊包含了主要肌肉運動的模型,要跑和跳雖然做不到,但是用來模擬人體運動展示大體是夠用的


1G足矣!

DNA就是四進位數,人的基因組3.16億個鹼基對,3.16*10^8對,一對相當於兩個二進位數,四對既是一個位元組,所以全基因組共790*10^6位元組,也就不到800M,一個優盤輕鬆裝下。比windows xp還小,驚不驚喜?

更新

早晨隨手寫了一個答案,沒得幾個贊,獲得了大量的評論。

我覺得還是有必要補充說明一下的。

這個問題首先有些跨界,涉及了程序和人。碼農朋友們可能不了解生物,生物汪們可能不了解程序。討論的什麼方向都有,確實有些尷尬。

面對一些多次出現的問題我也給予了我的理解,為了讓更多人看到完整的答案思路,在此更新。

關於基因的表達需要環境

基因的表達,就是DNA的轉錄翻譯,的確需要環境,但是這個環境的信息,完全都在基金組裡。目前生物的基因組信息的流轉,也就是中心法則的運行,從信息角度講是一個自給自足的閉環系統。

關於環境與記憶

的確,一個人基因組裡的信息沒有父母的記憶,生下來不會走路,但是基因組的信息決定了他有走路的能力,在不同的環境刺激下,他會自發地學習走路的技能。這對於題主要求的,動作功能的程序實現,已經足夠了吧。

有人說基因組運行起來的信息量要遠遠大於此

是這樣的,我們討論一個程序的大小,可以討論他源代碼有多少行,編譯器編譯之後的安裝包有多大。然而這個程序運行會生成多大的緩存文件,需要多大的內存是這個程序本身的體積么?

有位兄弟和我說基因組裡大量序列重複,從數學的角度講仍可以壓縮,我覺得是這樣的。但是1g已經足夠驚人,非編碼區和內含子的作用我不是特別清楚,如果壓縮了,還需要包含另外的解壓演算法信息才能閉環。所以沒有討論。

很多人想的人工智慧就是通過現有的機械原理去模仿人,有沒有人想通過人的原理來模仿人呢?

ps

回答這個問題的初衷,只是給大家一個思考方向,雖然看起來遙不可及,但是這件事情在你我每個人身上都在發生,我們每個人從父母那裡得到了1G的信息,然後彼此影響,生活在豐富多彩的世界裡。

現在互聯網世界蓬勃發展,程序員們無所不能,有it大佬發話要幾年之內攻克某某疾病。看到這種新聞我只想說,他把醫學,生物學看的太簡單了。現在一個遊戲動輒幾十G,塞爾達曠野之息11個G大家都在高呼黑科技。其實我們自己才是真正的黑科技。

pps

有人嘲笑我一定是高中生。說實話,我能回去就好了……我為什麼要和xp比較呢?因為這是我初中生物課無聊心思的結果。想想昨晚剛裝的系統安裝包都比這個大,吃了一驚。今天,把這一驚分享給大家,希望有人能實現我所想。


實名反對 @Lancemu 的回答

該回答的一個主要觀點是「人的一切都是由基因決定的」 就好像是在說「我幹了很多壞事我這輩子沒有取得成功都是因為爹媽的遺傳物質不好」

動物的腦很複雜 行為也很複雜 從出生時就被註定了的先天行為只佔動物全部行為的很少一部分 且存在種間差異

舉個例子 鳥類的先天本能極其發達 許多鳥類無需親代教學長大後自然能學會飛行 捕食 育雛等行為 經觀察發展鳥類腦部的紋狀體相對而言比較發達 紋狀體即是主管本能的結構 可是腦的其他結構也具有著控制複雜的行為的能力 行為單純受遺傳因素所控的行為可能也就僅僅是先天性行為而已了.剩下的行為都是在生長和發育歷程中經外界因素共同作用而形成的.在這些後天形成的行為里基因起著一定的影響作用,但卻不能說是基因決定了這些行為.


這會陷入死循環的。因為編寫這個程序這個步驟本身,也是一個人類的功能動作,所以這個程序的動作中也要包括有一波程序員編寫這個程序的動作,然後就這樣陷入了無限循環,多少容量也不夠。


編程要分析人的運動系統,系統的複雜度,是關節的自由度決定的,而人體結構的自由度是無窮的,僅一隻手臂至少有七個自由度(不包括手指),可見有多複雜。運動學分析要解複雜的方程,佔用大量的資源。(跑題了 )總之就目前技術而言,容量是夠的,分析計算還不行.


16G 硬碟,足夠大的運存,足夠快的處理器。

人類基因組計劃測序得到的染色體組數據下載下來總共約 5GB

然後你只需要一個物理模擬器,還有硬碟

哦對,好像除了細胞核內遺傳信息以外還要蛋白質運行環境... 姑且認為再加上 5GB

然後跑你的蛋白質摺疊去吧... 我看你受精卵第一次分裂需要算多久


用統計學應該能夠更簡潔迅速


入海數沙徒自困


我… 中午睡午覺之前還在想這問題 包括各種器官功能實現 外界環境影響等等 結果一覺醒來???直接推送了這個問題??現在腦子裡想想都會被搜集隱私?


如果在應用層面討論這個問題,基本上容量是無限的。因為跑步跑的不單是邁步、甩臂這個動作。

你每跨越一個坑,或一個台階,都是獨一無二的,或者說,都是大腦隨機應變現運算出來的。這種運算量遠遠超出你能往程序里輸入的量。

打個比方,你給一個機器人輸入了劉翔拿金牌的跑步模式,那麼這個機器人在同一條跑道,用同樣的跨欄,可以跑出完美的效果。但只要稍微把其中一個跨欄挪動一點點,就撲街了。


腦洞太大,沒人嘗試過。

第一,信息處理的層面,跑步為例,如果從肢體的層面描述,非常簡單,參見古墓麗影2。但是上升到肌肉和關節的層面,信息量暴增,再以進步到細胞行為的描述,要了親命,細化到官能大分子角度,要瘋,再貼近現實去描述官能分子的動力學,就算你內存夠大,也夠目前的超算跑幾百年了。你確定要用計算機程序來實現?太看得起現代計算機技術了。

第二,很物理又很玄學的一點,行為除了是個複雜的因果過程還是個「隨機」過程,你需要一個起點或者專業點講叫邊界條件才有可能解出後續的結果,但其間的過程又是「隨機」的,想破解隨機過程,就要包含到非常非常高的級數。你需要非常爆炸的信息量才能接近真理。

所以,描述現實世界的一塊石頭,已經是非常耗能的問題了,你竟然要玩高等生物。你就算有這個信息量,演算法能不能做出來,就算有演算法去描述,你有硬體能執行這種複雜程度的計算么?

從信息的角度,這就跟加密一樣,你之所以是你,是因為你的密鑰長度長到現實世界無法破解,所以不會有第二個你。


題主本想知道的是人工智慧需要什麼樣的晶元,結果被活生生演變成了一個生物學話題。。。

表達下個人拙見:

1.從傳統人工智慧角度來講,是很複雜的,除了模仿人基本的生物行為外,還有社會行為。生物行為模仿得越細節當然空間越大,怎麼得幾個G是肯定要的,但不封頂,做得非常細n個T也不夠,比如說話這個動作可以只是說話,但是為了逼真可以加一些其他細節,比如咳嗽、清嗓子、推推眼鏡、賣關子、神秘一笑、捋捋鬍子、肢體語言……這些都是非常非常細節的東西,而且每次都不太一樣,你要用程序去設定、刻畫相當費空間,但若真的做到也會逐漸邁向高強度AI,那種人工智慧可能會非常像人類。這個暫時只出現在電影中,倫理問題、科技難題、社會接受度問題還有很多。相反,簡單的機器人,工業機器人,晶元才多大?總之,越複雜肯定越大,大到不封頂。

2.高強度AI。前面叫「傳統AI」,說白了就是考「題海戰術」讓機器人死記硬背地模仿人類。那麼,很多東西它只能學得其行學不到精髓,永遠只能模仿,哪怕是高水平模仿。但是,如果AI段位高點,除了死記硬背一些基本肢體行為以外,能通過高度代入人類思維方式,從歷史、地理、人性、感情、生理、社會……當面全方位主動學習所在的人類社會,那就不得了了,它的存儲空間會一直膨脹(到時候可能是5G雲時代,存儲空間可以和物理軀殼分離,你家的伺服器承包了家裡所有的機器的存儲、運算、行為),空間不夠了你就得加硬碟或者上網買雲盤,反正所需空間也是大的不得了。這類高強度AI,一直在學習的路上。

3.第三條我說了你們都不信了,反正也是我猜想的。我覺得以後會出現半生物半機械的存在。人機合一,人就是機器人,機器人就是人。基因、生化反應、機械有機結合在一起,人類進化。


對這個問題比較感興趣,因為這引發了我的猜想,但這些猜測並不嚴謹,水平低微,還請見諒。

從受精卵開始思考,其具有DNA、RNA,還有一個細胞內環境,包括有蛋白質、多糖、多肽等。如果把DNA核酸當做系統內核,那麼那個細胞內環境包括了必要的「輪子」、一些庫、一些必備軟體、腳本、模塊、軟體。

從控制精度上來看,核酸(基因)控制的是分子微觀層面,其輸出的信號或者信號傳導略過,其輸出的結果「基因表達」,可以是功能分子。那麼,現有的編程式控制制什麼呢?我感覺,可能需要一個新型的語言,這種語言相當於「低級語言」,其以分子為對象。其輸入輸出不是那麼的直觀,而是達到多維的交互,比如,通過編寫一個庫,控制合成某一類的蛋白質分子。

高並發。受精卵的生命活動也是複雜的。其劇烈而又旺盛的生命活動是並行的,這裡面引入了一個思考,CPU有計算能力,那麼受精卵的計算能力在哪?其代謝系統是基本闡明了,但計算呢?那麼一種猜想,受精卵中具有計算功能分子(群),或者,核酸本身就不是源代碼,因為受精卵已經是一個活的細胞生命了。

受精卵開始複製(分裂),細胞開始向組織過度。從微觀到宏觀。基因的差異表達構建出不同的細胞。人的發育開始推進。

生命的編程包含了若干層抽象,分子、細胞、組織、器官、系統、機體、生命活動,而我們直接從生命活動著手,那是相當複雜的,這類似對生命進行反向工程。

生命以物質世界作為運行環境,物質世界有其要調用的庫。

人是可以為了解決問題而「編程的」,我認為「機器學習」還處於「受激」反應的層面,對於模仿智慧活動可能乏力。

我們假定,參照人體。創造一個語言,寫一個細胞模型,用計算機模擬細胞的外環境,構建一個生態環境(必要生存環境)。我們開始「機器學習」,用大量的細胞分裂去訓練我們的受精卵,但過程中會發現我們的受精卵虛擬模型缺乏組件,很多函數只有函數名,沒有內容本身等等。經過修正。以及不斷的學習。我們的細胞要完成第一次繁殖,再次迭代訓練二個細胞的再次分裂(以現實為參照),這裡面就會引發新的思考,一套協議,應當是具有的,這個協議有可能是底層具有的,也有可能需要我們模仿而構建一個。通過修改,添加必要的協議組件,反覆的訓練模型,二細胞再次完成了再次繁殖。

上面的過程具有了一個假定猜想,就是按照人類發育過程發育的人,其大概率具有人類的智慧活動。(不痴獃等)

通過多次的迭代訓練,不斷的加入各層次的庫,不斷加入協議族。代碼量會不斷增加。最終我們重構了一個「嬰兒」。然後,人類開始上帝的訓練,將這個虛擬的嬰兒「撫養」成人,假定「他」經過了人類的過程,開始具備了智慧,成為了一個成年人。如果想省事,那麼下面繼續,生成多個「不同的受精卵」,然後快速發育成「嬰孩」,讓我們訓練的「智慧成人」訓練這些嬰孩,形成虛擬社會。讓他們產生知識、文化、社會關係,重構一個地球給他們(虛擬的)。然後,就有了「智慧的人」。將這個「智慧的人」植入一個機器人的存儲中,那麼,這個機器人就具有了人類的思考和智慧過程,但這又涉及到倫理問題。甚至思考這個問題,都有些讓人苦惱。

這裡面的思考超越了我的水平,無論是技術水平、邏輯水平、語言表達能力等,都不足以表達這個問題,所以異常的混亂,我也無法寫的通暢,甚至無法表達。

總結一下,如果說重構人類活動的代碼量是多少,我想大約和人差不多大小吧。


你說的是這種嗎…………


上帝在給人類編碼的時候會一個個寫好人以後會做廚師,會做老司機,會作死嗎?所以上帝把這些無法預測的人類行為進行了高度抽象,賦予了人類學習能力,並把這個能力編碼在基因里,所以真按程序設計來的話,設計一個有超強學習能力的智能系統,顯然比一個個寫行為科學。


代碼模擬跑步?少年莫不是沒玩過沙盒遊戲?


推薦閱讀:

機器學習跨領域到生物信息學怎麼樣?
螞蟻是由蜜蜂進化來的么?
如何保證轉基因作物的新基因片段的啟動轉錄表達及與宿主其他基因蛋白等交互作用不會產生非預期的物質和變化?
以前聽說21世紀是生物學的世紀,但是那得是後半葉。生物學研究到什麼樣的程度能說它的世紀到來了呢?
大數據時代下的生物信息學專業與生物信息學職業?

TAG:人工智慧 | 人屬動物人類 | 編程 | C編程語言 | 生物學 |