定量生物學(系統生物學、計算生物學、理論生物學)是否將成為未來生命科學研究的熱點?
定量生物學(系統生物學、計算生物學)指的是運用數學知識,建立數學模型,定量解釋生命體內複雜的生命現象。比如,生物體內調控原理,蛋白質摺疊原理與功能預測,大腦思維本質研究等。
「一門學科只有當它用數學表示的時候,才能被最後稱為科學。」十六、十七世紀以來,開普勒、牛頓等人使用數學描述行星運動規律,物理學真正進入了可以被定量理論描述的時代;十九、二十世紀以來,隨著原子物理與量子力學的發展,化學反應得到了更科學的解釋,化學正式成為真正的定量科學;然而,生命科學一直由於其高度複雜性,至今仍處於實驗至上的時代,相關專業學生由於長期只會從事實驗研究,缺乏理論知識,被冠以「偽化生」頭銜。隨著複雜網路理論等數學物理工具的發展,隨著交叉學科研究的不斷深入,未來生命科學的理論研究是否會有突破。(PS:目前世界各大院校與研究機構已經開展此方面研究,也出版了不少論文和書籍,但整體看來沒有實質性突破,甚至不知道前路何方。之前數學在生命科學上應用最多的是生態學,使用數學模型研究種群增長等問題)
自問自答一下,說一下個人的看法(繼續編輯問題介紹擔心產生誤導)。個人認為,生物學引入理論的最困難一點在於,以往研究自然科學(物理、化學)等的理論都是研究一些簡化模型,將自然現象納入一個理論框架當中,尋找共有規律。即使有的時候用到的數學工具比較複雜,但框架和思路都是清晰簡單的。生命體的高度複雜性,決定了不可能使用過分理想或簡化的數學模型對其進行描述。也就是說,之前物理學的很多研究方法在研究生命體時或多或少會失效。研究生命科學的理論若想突破,必須要建立全新的理論體系,開發新的研究方法。
不邀自來,我從一個外行人的視角看看生命科學的發展吧。首先,現在生命科學已經進入分子級別(也就是分子生物學),我覺得根據現在從新聞報道,各個科普新聞的角度出發(普通老百姓能對生物的了解也就這麼多了),我覺得目前生命科學大多還是處於發現或者處於實驗的角度上面看。我想觀察某個東西(比如蛋白質?)的結構才是目前做得比較多的事情,至於生命科學使用數學手段系統研究這樣的事情,暫時,我覺得至少是目前,做這樣工作的人還是很少。因為,生命系統的環境比較複雜,甚至是不可預測的,在不同背景的情況下,使用某一個數學語言去描述,是不是有一定的難度呢?而且,我覺得生命系統的複雜,是無法使用物理學或者工程學的近似來處理。我個人覺得,生命本身就是一項最偉大的工程,比人類任何一個工程都要偉大,以至於我們現在都無法琢磨透徹!
以普通人視角來說,或者以數學系視角看待生物學這個新生「嬰兒」,題主定義的定量生物學是必然的生物學科的發展路徑。只是現階段由於 基礎數據的缺乏【相對於現世界中的所有生物物質構成】,所以定量生物學沒有丁點「起色」(作用),所以如果說是 未來的話,在收集到了足夠的數據後,定量生物學將會是生物學中的熱門學科。
沒有前人的奉獻,也就不會有收穫的果實。畢竟參天大樹,也需要先 根繁葉茂。以我的觀點而言,目前的生物學的確處於描述大於預測的階段,而如果真想成為一門理科,未來的生物學必然是朝著計算和預測的方向奔跑的。但是這個「未來」到底有多遠,我並不樂觀。
目前的生物學的局限在於,生物體高度的複雜性導致了分割研究的科學方法無法準確地描述單個基因/蛋白/信號肽等等的全部功能,更不用說細胞層面了。代謝組學和蛋白組學的進展十分緩慢,也就基因組學借著二代測序的蓬勃發展和遺傳學的基礎做了點東西。但是基因層面能解釋的事情實在是太少了。轉錄、翻譯、摺疊、蛋白修飾等等等等,都影響了這個基因在生物體內的真正功能。
基礎的薄弱限制了計算生物學的發展,這就是我想說的。近些年也有很好的理論思想,系統生物學等等概念的提出也說明生物學家意識到了學科的發展需要朝著整體論和計算化的方向發展,但是不解決基礎理論知識薄弱和基礎數據缺乏的問題,這些在近幾十年內,就只會是概念而已。關於系統生物學,在PHD剛開始時候,我還是想搞點偏這方面的東西,不過現在越來越偏forward engineering了。原因主要是下面兩個。
- 系統生物學並不系統,很多人系統生物學的研究方法是看到一個現象,然後發展一個唯象模型,然後調整幾個變數(參數)驗證一番,很大一部分是在蹭熱點。目前用理論/數學理論描述的比較好的只是很多孤立的小島,但不能連成體系。出現這個問題的原因很多,具體到題主「生物體內調控原理,蛋白質摺疊原理與功能預測,大腦思維本質研究」,這些都是最本質的內容,難度也各不相同。生物體內調控原理:這個問題在簡單層次上(不構成網路),在短時間內有望取得重大突破,原理,實驗條件,數據,分析方法都已經逐漸成熟。在複雜層次上(網路調控),難點目前有兩個,一個是簡單層次的東西還沒完全搞清楚,這個在個人觀點裡是可解決的,一個是現在數學工具太過複雜(基本都是ODE PDE SDE DDE從頭模擬),導致預測能力有限(當然也有些比較好的模型,但不能解決一般問題),這個問題難度因為樣本和實踐太少,暫時沒法說(不過這個在描述層面上至少是可解決的問題,憑個人直覺猜測這個以後也是能基本解決的問題)。蛋白質摺疊原理與功能預測:這個問題更難一些,當然難度也和預測要求的精度有關,目前做得最漂亮的是David Baker。摺疊這個層面邏輯上隨著計算能力加強,近似演算法逐漸提高(包括AI找pattern能力的進步),以後能解決的可能比較大。功能預測和正向設計難度大了一個P到NP的距離(比喻),有高效演算法可能很低,感覺極限就是基於已有模塊改造(定向進化目前能做一部分這種東西)。大腦思維本質目前沒有任何可以接受的模型/假說,完全未知難度,在生物實踐領域,受限於數據獲得,實驗方法,個人看法這是無底洞,不知道以後AI能不能從理論上搞出點什麼名堂。
- 實踐水平不足以驗證理論預測,在開始了解這個領域後,實踐水平之低讓人汗顏。對於一個模型,最重要的就是可預測性,現在很多東西在預測完後只能調兩下參數然後看是不是符合(很多發得很好的文章都是些非常顯然/trivial的調整),連根據模型搞一個設計都做不到,作為科學理論只能是空中樓閣(在第一點裡說的怎麼處理那些複雜的數學方程,怎樣通過方程找到結構也是問題,但這種問題如果有實踐印證要好處理很多)。關於實踐的話,穩態向我之前說的,這個問題在近一段時間內應該會逐步解決,進一步是在時間軸上網路的動力學,更進一步的是空間結構。這點我要提醒下LZ,在目前的階段,實踐對於處理問題是必須的,不然只能落入一般系統生物學家的層次,東處理一個問題,西蹭一個熱點。「未來生命科學的理論研究是否會有突破」 這種突破如果出現,從個人觀點來看,不會是簡單的,統一的理論,而是大量可以處理的唯象理論的疊加(當然在一些層次上可以找到漂亮的結構),而且對於不同研究對象,也需要從不同角度來選擇可以計算的模型,從這個角度來說,我不是很認可「實質性突破」這個詞。
以上一點個人的粗淺觀點,有些東西不是自己方向的,只是粗略看看或者同別人交流的想法,很可能不對。不過有一點可以支持下LZ,至少從你的提問看,你關注的都是問題的本質,而不是很多系統生物學研究搞得不知所謂的東西。
我覺得這個還是要取決於實驗手段的進步,脫離數據講故事是很難走的遠的。
生物在相當長的一段時間內,還會是一門基於實驗和試錯的學科。但是由於技術手段的進步,數據數量和維度的不斷積累,是可以給理論提供足夠的養料以及生長空間的,但是現在還是差的很遠。至少現在在我所知的範圍內,理論上漂亮的功能模型,要麼就是太寬泛,對具體現象缺乏建模能力,比如複雜系統;要麼就是太過於具體,缺乏泛化能力,難以大規模應用在不同層面,例如ODE。畢竟生物系統在不同層次上湧現不同規律,難以均一的進行描述。
所以暫時我還是看好高通量,先把數據堆起來再說,當然高通量也有自己的一堆問題,就不在這裡詳述了。
生物走向定量幾乎是必然,可是大家都反對轉基因…這條路註定不好走啊不管怎麼說,國家轉基因的經費是越來越少了……
目前存在重要問題就是生物的元件都是一種網狀調控的,你像蛋白連個標籤根本沒辦法預測那個標籤不會影響它的功能,表達了A蛋白結果系統中CDEF又發生了變化
如果有大量的能夠互不干涉的元件拼成一個生物反應器那真是牛逼了總的來說就是認識太淺,物理啊化學啊儀器啊精密設備微電子啊你們能不能跑快點……你們快一點我們就有機會有技術給你們續命+1啊瀉藥就。。。就算我是要選理你邀我回答這個問題也不合基本法吧?
下面是我們對抗體與病毒抗原相互作用下的一些分析圖表(篇幅所限僅列幾張),不知算不算屬於你所說的定量生物學? 上圖是某型流感病毒抗原對多種抗體的劑量-反應曲線。 上圖是某種抗體對多種流感病毒抗原的劑量-反應曲線。 上圖是某抗體對不同流感病毒但屬相同基因片段抗原的劑量-反應曲線。關鍵是這些劑量-反應曲線並非根據現有的藥效動力學公式計算而得,而是必須先將現有的互作關係概念延伸至高維的生物空間中,再由高維的藥效動力學數學表達進行降維處理。理論生物學,系統生物學或生物數學現在停滯不前的原因在於大家還在三維以內的空間思考問題!
不會。作為做過實驗生物學和你說的理論生物學這兩者的的研究者,可以明確的告訴你,你說的理論生物學只能給實驗生物學打雜。生物學中的大部分最重要的問題,只能由實驗生物學解決。剩下的問題,基本上實驗生物學做主角,理論生物學做輔助。
具體細節懶得說了。結論就是這個。
突破會有的,熱度也會有的,我就準備用自己的職業生涯放一把火。
看了一些回答,覺得作為在實驗、理論都有些經歷的人,我補充一下自己對目前生物學現狀與將來的一點看法。
先談談目前實驗、定量學科各自的局限性
目前理論工具對具體實驗的幫助還不大,實驗的確仍然是主流,但如果一些實驗生物學家藉此鄙視理論就很可笑了:
- 論思維水準,偽化生說的就是這種,可是實際上化學一直、也進一步跑到前面去了,計算模擬在藥物化學中已經大行其道;
- 論學科法發展,如果理論工具不能成功,這種小作坊的路數不但離認知生物學的本義相去甚遠,還將繼續耗費、甚至浪費極大的智力、財力資源——沒有系統性框架,很多看似確鑿無疑的實驗結果不過只有Artificial的意義,而真正的科學家絕對不會面對黑箱操作心安理得;
- 即使論實驗生物學現狀,各種計算工具已經在生命科學中起到不可替代的作用,高通量篩選、預測目的基因再去做功能比查文獻瞎蒙的都高到不知道哪裡去了,國內高水平的機構都在融合實驗、統計和計算等多方面的力量,迷信實驗只能說格局真不行。TX下:你還想不想發好文章了?
如前面孟祥溪君所言,其實定量生物學已經是非常熱的方向了,畢竟門檻高,方向多,比起實驗其實很容易做出讓人驚嘆的東西,很多做數學、物理和計算的人在生物學領域的確已經做了很多有趣、有深度的作品。不過問題在於,這裡面很大程度上都是在拿著手電筒找問題,而不是建立真正可以在生命科學中大行其道的標準解決方案。那些偏微分方程很美,但生物學的結構註定經典數理不會有大的作為,圖靈的工作就是一例,斑點模型很精彩,但僅此而已,他絕頂的數學天才在生物學上的大量投入和牛頓在化學上的努力一樣,整體上無功而返。這不奇怪,人都不願意走出自己學術上的舒適區,如果用自己的方法就能發一些亮眼的工作,又何必直面生物學的挑戰?我認為當今這個領域的確缺乏真正有學科擔當與雄心的頂級科學家。定量生物學家在發展理論工具的時候像經典的數理雙修的科學家一樣發展對物理學/生物學有重大影響的數學/計算方法,不然就像古希臘學者跟隨歐幾里得等幾何學派而不是阿基米德一樣,大大延滯了可以改變科學面貌的方法論的發展進程。
好在希望當然有,一些理論工具已經有意無意地觸及到生物學最本質的東西,只要加以發展真的前途無量。這主要集中在複雜網路領域,它在生物學、經濟學中都已經頗見功力。像神經科學已經發展到理論計算工作的成就已經非常厲害了,如今與人工智慧深度互動,更是不可限量,在這個智能科學改變一切的時代,神經科學的理論工具每進一步都深度影響著整個世界。
對了,理論物理學的情懷在理論生物學可能要打些折扣,大統一的理論基本不可能,每一種工具都只能適用於特定的層次、類型,有些像凝聚態物理學。當然,在領域發展的初期,簡潔優美的框架性理論還是會有的,有眼光的可以入手了。
整體而言,任重道遠,但機會也就在眼前(恕利益相關,只能對一些東西秘而不宣。不是小氣,我喜歡這種秘境之旅的感覺)。我相信理論生物學工具必然會對實驗、合成生物學的意義會在將來像數學之於物理學那麼根本,實驗構成理論架構驗證、實現的手段(當然,實驗也一直是理論發展的挑戰和靈感之源)。否則,如果一門學科做實驗的覺得自己就是統治階級、而且將來也不可顛覆,那真是這門學科的悲哀,好在理論、計算生物學家並不這麼想。
推薦閱讀: