系統生物學和生物信息學 ——寫給每個人

原作者:立花克里斯(Chris Tachibana)

原載《科學》業務專欄(AAAS/Science Business Office Feature)

翻譯: @鏡子文明

系統生物學和生物信息學誠摯邀你入坑。這些需要高度協作的領域渴求各種人才:生物學家、工程師、化學家、數學家和程序員。加州大學聖迭戈分校(USCD)的伯恩哈德· 帕森(Bernhard Palsson)說道:「如果你能夠適應多元團隊里的工作,這將會是一個機會空前的時代。」塔夫茨大學聖伊麗莎白醫學中心癌症系統生物研究所主管,林恩·拉特基(Lynn Hlatky)表示贊同:「對於轉行人士和新研究員而言,這些領域贊助豐厚,並且世界各地都在興建系統生物學研究中心。」

工作機會不一定被捆綁在某個特定的地理位置。項目合作者遠程工作也不甚稀奇。團隊成員可能在千里之外藉助互聯網分析某處產生的濕數據(指實驗室獲得的第一手數據)。「把合適的人們聚集在一起解決問題更重要,而不是他們在哪裡。」拉特基說道。系統生物學家只需要「總觀大局、眼界開闊」。「任何人都可以參與這場遊戲。」

實際上,根據瑞典哥德堡查爾姆斯大學(CTH)系統生物學教授傑斯·尼爾森(Jens Nielsen)的觀點,每個研究人員都應當參與進這場遊戲。「工具、技術和系統生物學進路在研究界和工業界都趨於標準化,」他說道,「要想在未來10到20年獲得一份生命科學的工作,行業肯定會要求你在這些方面擁有競爭力。」

高科技和傳統學術的結合

系統生物學的細分領域清單長到爆炸,囊括從計算機科學前沿到傳統生命科學的方方面面。幸運的是,在這個領域,這場遊戲的內核就是合作。加州大學聖迭戈分校生物工程Galetti教授,伯恩納德·帕森認為,系統生物學包括「對網路、生物系統和線性代數、基因組與遺傳學、基因產物的生物化學以及它們如何整合成細胞內三維結構的理解」。拉特基說道,要想攻克生物體非線性的本質性難題,我們需要「一個全員對傳統生物學和定量科學無不了如指掌的團隊,橫跨細胞生物學、分子生物學、物理學、化學、計算機科學和數學。」

系統生物學甚至需要一些「落伍」行當的專業技能。記得林奈嗎?「分類學的重要性日益凸顯,尤其是它與分子技術融合的部分。」賓州州立大學比較基因組和生物信息中心、生物化學和分子生物學系的史蒂芬·舒斯特(Stephan Schuster)如是說道。「適逢定量和分子工具的興起」,生理學知識大放異彩,拉特基說道,「我們同樣需要能從種群層次考慮問題的科班人才——發育生物學專家、物理學家和生態學家。」

拉特基解釋道:「多學科交叉的系統生物學團隊就像一個多細胞生命體一般,由專門化和分工形成魯棒性(控制論術語,指控制系統在異常和危險情況下維持某些性能的特性)。」成員的多樣性使得團隊可以處理多變數的動態問題。她舉例道:「在癌症生物學領域,我們過去往往認為若干原癌基因、抑癌基因和DNA修復基因驅動著整個過程,但現在我們識別出了癌症中數以千計的遺傳變動。這意味著我們僅僅追著幾個到幾十個不等的遺傳終點(遺傳物質的改變,國際環境誘變物致癌物防護委員會(ICPEMC)1983年提出遺傳學終點有5類:DNA完整性改變(加合物、斷裂、交聯)、DNA重排、DNA鹼基序列的改變、染色體完整性的改變和染色體分離的改變)不可能搞明白它們是怎麼回事。我們需要計算和生物信息學方法去解開癌症之謎的這一子謎。」

像身體的兩個器官一樣,系統分析和生物信息學彼此分立,又彼此依存。「生物信息學從數據中挖掘的知識是系統生物學的基石,從而使得後者可以創立假說、建立模型。」歐洲分子生物學實驗室歐洲生物信息研究所(EMBL-EBI)主管珍妮特·桑頓(Janet Thornton)說道。生物信息學是個成長中的領域,桑頓說,因為「現在幾乎所有實驗都涉及多數據源,需要研究人員有能力處理數據並獲得推論和知識。自15年前,生物信息學方興未艾,如今已成燎原之勢。」

服務與探究領域的生物信息學機遇

生物信息學的生涯選擇可以在應用與服務領域,也可以在基礎研究領域。這兩個領域的工作理念和實踐相去甚遠,提供迥異的機遇,吸引風格不同的人才投入其中。有條理、做長期、大尺度規劃的人擅長服務領域。「這些人需要提供專業服務,所以他們必須開發強大可靠的軟體,有一個清晰的發展流程,」桑頓解釋說,「他們為一個大的用戶社區提供服務,所以他們不能一拍大腿就改變主意。改動需要提前幾個月計劃,在運營的24小時內完成,並且接受來自世界各地的數據。」這個領域尤其需要開發和測試人員。「業界流傳一句話,一月寫好一程序,十月才能變穩定。」桑頓說。生物信息學服務也包括(數據)管理,或者說基因、蛋白質、代謝物和其它生物元件的注釋。對於這點,桑頓又補充道:「注釋者必須遵守明確的流程,每個基因每個蛋白都要一致處理。你不能哪天突然換個流程。服務的宗旨在於可靠、穩定、實用、易用。」

生物信息服務的研究機遇通常在於給資料庫提速和提效率。但服務方的底線是預定發布和數據交換,並且遵循明確定義的標準、實驗方案和截止日期。桑頓同樣承認:「服務生物信息學家必須萬分確定數據沒有被遺漏,這是研究科學家們一直在做的事。」

桑頓說道,生物信息學發現是準備給那些「純粹的研究者們」(不考慮未來實際應用的純理論研究者)的,他們可以想到生物信息技術應用的新渠道,或者開闢研究前進的新潮流。「生物信息研究者需要回答生物問題的好奇心。他們需要寫一個好的軟體,但並不需要做到盡善盡美,這通常並不是首要的目的。對於研究者來說,問出正確的問題更加重要。在我看來,大部分好的生物信息學研究都建立在如何回答一個特定生物學問題的基礎上,但這些問題可能相當龐大——比如說,為什麼分化後所有基因的表達就改變了?」生物信息研究者可以隨他們的想像和興趣天馬行空。「他們可以自由地探索多種生物,這是實驗生物學家通常做不到的。」桑頓說,「對於一個計算生物學家來說,數據是蛋白質的相互作用還是代謝過程並無所謂,方法都是一樣的。這個領域的一大亮點就是你不會把人生耗費在一個微生物或者蛋白質的觀察上,而是靈活貫通、著眼更遠。」

未來的職業生涯充滿的鼓舞人心的可能。賓州州立大學的舒斯特表示:「與基因組一道,生物信息學將產生最為重要的研究:將時間剖型、基因組特徵與化合物、質譜分析和遺傳信息關聯起來。這真的為許多來自不同研究方向的人打開的機會的大門。」但當下此刻,桑頓說:「生物信息學需要由生物問題驅動、希望從計算路線解答問題的人。」

生物工程師、企業家和學者的機遇

在查爾姆斯基大學的尼爾森看來,系統生物學需要綜合性研究人員。他建議他的學生和博士後儘可能多地接觸實驗,「從工程到統計分析到分子檢驗」,並把它作為項目的一部分(真變態)。USCD的帕森贊同道:「最好的訓練可能是班級合作進行定量研究,同時在一個實驗室親自上手做實驗,這樣的環境可以予人對生物學總領性的深度理解。」

對於那些技能滿身的科學家,尼爾森說道:「考慮到現在世道不佳,他們現在在工業界的職業前景相當之好。」他的許多學生在工業界接受過應用項目的職業培訓,處理一些為商品化工公司改良真菌品系之類的問題。尼爾森認為,藥物開發公司、製藥公司和商品製造公司已經「投資給了系統生物學技術,所以現在他們需要人來使用它」。這個需求尤其利好於「能分析數據,跟隨定量潮流推動生物學、從不同方面整合信息的人才」。

帕森已經參與進了數家新興小企業,掌握著28項美國專利。他認為現在系統生物學企業的需求在於「通過生物過程和代謝工程製造商品和好的化工產品、生物聚合物」。帕森和舒斯特都把可再生能源和生物燃料視為挑戰不斷但潛力十足的成長領域。「我們已經見證了可持續能源領域的盈利,而他們需要環境和生物多樣性領域廣泛的系統生物學研究信息。」舒斯特說。EMBL-EBI的桑頓同樣看到了生物信息學家們的商業機遇,「製藥巨頭內部的生物信息資源正在被放棄,」她解釋道,「數據太多了,他們解決不了存儲問題,並且找不到足夠的運營人員。中小型企業可以開發軟體方案來有效處理這些數據,這可能成為這些企業的機遇。」

隨著系統分析師和生物信息學家需求的增長,學者和教育者也不會被落下。「在十到二十年之內,系統生物學將會成為整合生物學教育的一部分,所以這些領域的教職需求將會在未來暴漲。」尼爾森說。「大學同樣需要生物信息學家,」桑頓說,「每個生物研究部門都需要計算專家。」

系統生物學和生物信息學時代的醫藥

另一個蓬勃的領域是系統生物學醫藥。如今的臨床應用受到層層限制,但行業領頭人相信衛生保健和醫藥研究即將面臨激烈變革。塔夫茨大學的拉特基預言道,隨著發展,生理網路分析過程、多層次的數據整合和生物變化監控會起到主要作用。未來的生理學家們,請記住,「我們會更多地把注意力放到整體層面上,並識別不同醫學學科之間的聯繫,比如癌症學和心臟病學,」她說道,「醫學正在趨近於它該成為的樣子——一種個人定製的綜合性治療。」拉特基認為,幹細胞生物學是另一個有很大可能實現系統生物學進路的領域,這是因為細胞高度的複雜性以及它們廣泛的作用效應,從神經疾病到慢性癥候、再到再生醫學。

系統生物學醫藥也會在生物信息學領域創造工作崗位。桑頓說:「在未來,我們需要中介資料庫和臨床試驗的人才,需要能處理此類所有計算工作的人才。那些數據會被用於許多不同用途,從識別和測量相互作用到決策專註方向,不一而足。我們需要開發能處理那些數據(包括變異體數據)的計算工具。」

從一個更個性化的角度,李·胡德(Lee Hood),西雅圖系統生物學研究所創始人,在最近的談話中提出了他關於未來診斷的構想。他描繪了「一種年度的健康評估,通過指尖血採集可以分析2500個蛋白質生物標記物(一類與細胞生長代謝增殖密切相關、可用作標記的生源化合物),可以產生一份逐器官描述的個人健康狀況報告。」隨著時間積累的個人數據點能夠用來實現一點全人群的縱向研究,並且「每個病人都可以掌握他們自己」。為了實現這個藍圖,科學家需要推進納米科技和成像技術,並創造新的計算工具。對那些青睞商業導向職業的人,胡德預言了「一次重點從疾病到健康的遷移,以及與之相伴隨的一場衛生保健公司的爆發」。

賓州州立的舒斯特對於系統生物學家和生物信息學家如何推動人類健康福利有著不一樣的視角。「環境改變會影響植物區系、動物區系和微環境,並可能有地質方面的影響。這可能會改變病原體的格局,而病原體的改變會影響人類人口和食物供應。這將會人類健康和社會穩定性的隱患。」意識到環境變化對健康以及社會的影響日益凸顯,給系統生物學家提供研究機會,「我相信環境項目的周期撥款不斷攀升」。(不知道川普砍基研經費有沒有戳破……

縱觀大局

要想找到系統生物學和生物信息學其它的擴張領域,你不必走的太遠。對於互作組——或者說細胞組成分子與它們的鄰居相互作用的總和——的分析,「已經在領域內發揚光大了」。查爾姆斯理工大學的尼爾森說:「這將尤具挑戰性,因為這不是一個靜態不變的東西。蛋白質A可能與蛋白質B協同,但它們之間的相互作用取決於我們如何設置實驗。」

塔夫茨的拉特基補充道:「我們需要發掘分子、細胞和組織間多尺度、動態的相互作用,並把它們編織成一個定量結構。」EMBL-EBI的桑頓也認為不同層次間信息的整合是下一階段的任務,尤其是處理、存儲和解釋影像數據。「我們正在發展細胞水平、器官水平乃至全生物體水平的先進影像工具。」這些方法得是自動的,並且產生的數據需要被處理、整合和分析。桑頓說:「機會已經顯現——從不同層次理解生物學,橋接分子、細胞、組織和全生物體的信息,以及如此得以可能的全方位統籌——簡要地說,就是在全水平上解釋全基因組。」

這個領域需要與全水平數據工作相合的研究者,以及能夠統一理論的傑出思想者。拉特基說,下一步的目標在於找到系統數據的中心原理,也就是能允許研究者「解釋和預言」的若干模型。在任何情況下,我們都離不開系統生物學和生物信息學的力量。對於尼爾森所述未來系統學方法和生物信息學將會成為標準工作的評論,拉特基回應道:「我們現在就已經是這麼做的了。」

主要參與機構

查爾姆斯理工大學(Chalmers University of Technology, CTH)

www.chalmers.se/en

歐洲分子生物學實驗室歐洲生物信息研究所(European

Molecualr Bioglogy Laboratory, European Bioinformatics Institude;EMBL-EBI)

www.ebi.ac.uk

系統生物學研究所(Institude for Systems Biology)

www.systembiology.com

賓夕法尼亞州立大學(Penn State University)

www.psu.edu

塔夫茨大學(Tufts University)

www.tufts.edu

加州大學(University of California)

www.universityofcalifornia.edu

作者立花克里斯是居於美國西雅圖和丹麥哥本哈根的科學作家。

註:打下劃線的括弧是注釋補充內容


推薦閱讀:

什麼花能吸收有害氣體?
為什麼冥王星會從行星降格為矮行星?
黃色粘球菌對大腸桿菌聚集地的佔領
【原著解讀】丹尼特的《心靈的演化》:理解的演化
人類如果消失,那麼地球是否會退化到遠古時代?

TAG:生物學 | 生物信息學 | 科普 |