解讀人類基因的百科全書

解讀人類基因的百科全書 日期:2012-09-27 作者:張文韜 來源:文匯報

解讀人類基因的百科全書

  在過去5年中,歐洲分子生物學實驗室的計算生物學家尤恩·伯尼和同事們為「DNA元件百科全書」(ENCODE)計劃收集了大量的基因組數據,最近他準備把這些數據列印出來。然而,要找個可以放置這份列印文件的地方可不容易。即便每平方厘米能容納1000對鹼基,但文件還是高達16米,至少30公里長。

  

ENCODE:志在「荒漠」墾荒

  當人類基因組計劃完成之後,儘管科學家為揭示人類生物學藍圖作出了巨大的努力,但很快便意識到,讀取這份藍圖的「操作手冊」還很粗略。研究人員可以確定,30億對鹼基中有很多蛋白質編碼區,大約2萬個基因,僅占整個基因組的不到1%,這僅僅是在一大片未知領域中識別出一些稍稍熟悉一點的對象而已。很多生物學家甚至懷疑,真正體現人類遺傳的完美和複雜性的精華部分,可能正隱藏在基因之間那些未探索的「荒漠」之中。於2003年啟動的ENCODE計劃,正是為探索這片「荒漠」而建立起的一個巨大的數據收集工程,其目標是為潛伏在「荒漠」中的那些「功能性」基因序列編製目錄,了解它們位於哪些細胞中、何時被激活,而基因組又是如何被合成、調節和讀取的。

  目前,研究已經接近尾聲,《自然》等雜誌公開發表的30篇論文,已經確認大約80%的基因組都具備某種特定功能,包括約7萬個「啟動子」區域(位於基因上游),負責蛋白質綁定並執行基因表達的位點;約40萬個「增強子」,負責基因的調節和表達。

  伯尼在ENCODE計劃中負責協調數據分析,他表示ENCODE計劃的工作遠未完成。他說,一些繪製基因圖譜的工作還在進行中,而對於基因組到底能做些什麼及進一步的深度特性分析,才僅僅完成10%。而正在執行的第三階段計劃,將最終完成閱讀人類基因的指導手冊,並提供更多的細節描述。

  許多人已經從人類基因庫的巨大數據流中獲益,並被其巨大的前景所鼓舞。ENCODE計劃點亮了人類基因研究的黑暗角落,為進一步理解基因變異是如何影響人類遺傳缺陷和疾病而創造新的機遇。進一步探索項目中所揭示的神秘調節因子以及比對其他哺乳動物,一定會重塑人類關於自身進化的科學認知。

  

填補空白:抑或路途漫漫

  ENCODE計劃目前產生的數據正在幫助研究人員進一步了解疾病遺傳學。從2005年開始,全基因組相關研究(GWAS)已經發現了數以千計的可能致病基因,而其中僅僅一個鹼基的不同或變異就會導致疾病的風險。由於大約90%的此類變異都不是蛋白質編碼基因,科學家目前對於它們是如何導致疾病的發生還沒有任何線索。

  ENCODE繪製的基因圖譜揭示,多數遺傳基因的致病區域包括「增強子」或其他功能序列。而細胞類型也非常重要。目前,牛津大學的計算生物學家克里斯領導的小組針對一些與系統性紅斑狼瘡高度相關的突變進行了研究,這種疾病往往導致患者的免疫系統主動攻擊自體的正常組織。他們注意到,GWAS所發現的遺傳變異傾向於分布在只有對免疫細胞才活躍的調節區域,但對其他類型的細胞並非如此,克里斯的博士後盧卡斯·沃德為此構建了一個HaploReg網頁,旨在讓研究人員比對GWAS和ENCODE數據之間存在的不同之處,並以系統的方式進行處理和顯示。克里斯說:「非常感謝ENCODE計劃,可以針對如此複雜的遺傳疾病發起攻勢,我們現在能夠解析更為複雜的病症。」

  對於已有的ENCODE數據,研究人員還要花費很多年對其進行研究。加州大學聖克魯茲分校網站上展示出ENCODE計劃的進展,其中一個表格顯示了目前24種實驗所獲得的進展,差不多180種細胞已被測定。這只是九牛一毛,包括實驗室里常用的HeLa和GM12878細胞研究得比較完整,可這僅僅是針對少數細胞系進行的檢測。至於其他部分,也就僅僅完成了一次實驗而已。

  ENCODE計劃前期工作估計花費了5500萬美元,擴大規模後投入大約是1.3億美元,美國國立人類基因組研究所為下一階段募集的資金為1.23億美元。

  耶魯大學計算生物學家馬克·格斯坦說,人類花費大約半個世紀才從獲知DNA是人類的遺傳物質進展到人類基因組測序,你一定可以想像,真正理解並掌握基因組將成為本世紀或下世紀的一項重中之重的大科學工程。

  (張文韜 編譯)

推薦閱讀:

『百科知識』人類一直沒弄不明白的九件事
腦垂體—搜狗百科
【食物百科】最強排毒食物 吃了皮膚瞬間變好 - Qzone日誌
性激素六項檢查、正常值_查性激素六項多少錢_親子百科_太平洋親子網

TAG:基因 | 人類 | 百科 | 解讀 | 百科全書 |