標籤:

500年1300萬人,史上最大人類譜系圖公布!科學家意外發現,人類長壽竟與基因關係不大

近日,研究人員公開了迄今為止世界上最大的譜系圖——橫跨五個世紀,涵蓋約 1300 萬人,他們通過親緣或婚姻關係相互連接著。

這份譜系圖不僅向我們展示了基因與長壽間的特定聯繫,還揭曉了祖先們選擇婚姻配偶的原因。

「這項研究成果令人震撼,是眾包 (crowdsourcing) 思維應用於科學研究的典型範例。」昆士蘭大學遺傳學家 Peter Visscher 評論道。

未來,這份譜系圖有望幫助科學家研究更多遺傳病的遺傳機制。

建立譜系圖

七年之前,哥倫比亞大學的計算遺傳學家、MyHeritage.com 公司現任首席科學家 Yaniv Erlich 正式啟動這項研究。

起因是他收到遠方堂侄的一封郵件,其中介紹了一個人們自發分享譜系圖的網站——Geni.com。他當即決定寫信給網站的首席技術官,獲准下載了數千萬的用戶數據,包括姓名、性別、出生地、出生和死亡年月、近親屬的相關信息 (不包含 DNA 數據)。

圖丨哥倫比亞大學的計算遺傳學家、MyHeritage.com 公司現任首席科學家 Yaniv Erlich

對於研究者來說,要建立起這樣一張規模浩大的家族譜系圖,實在是相當冗雜且乏味。通常他們需要先從各個教堂、法院搜集記錄,然而大多數情況下這些記錄都記載於古舊的紙張,要用這樣的記錄來追蹤遠距離親緣關係簡直就是一場噩夢。

然而,回報是豐厚的,因為通過追蹤人們的親緣關係,我們可以縱覽文化和經濟趨勢,以及遺傳學變化和人口變遷。對於那些將系譜圖與遺傳、健康相關數據相結合的研究者來說尤為如此。

紐約基因組研究中心(New York Genome Center)的遺傳學家Joanna Kaplanis與其同事表示,他們已經找到了一種更簡單的辦法來匯總所需的龐大數據集:將任務「眾包」(crowdscource)給各大公眾系譜網站。該團隊從系譜網站Geni.com收集了個人數據,每一份數據都包括了個人的姓名、其與數據集內其他人的關係,以及諸如出生時間、出生地、是否婚嫁、是否死亡之類的其他信息。

該網站的軟體能檢測每個用戶的譜系圖分支與其他譜系圖是否有重合,然後將這些小譜系圖合併為更大的譜系圖。這一功能結合起研究者們的分析處理,研究者們最終將這些數據彙集成 530 萬份譜系圖,其中最大地連接了 1300 萬、從 1650 年至 2000 年的 11 代人,絕大多數為歐洲血統,包括著名遺傳學家 Sewall Wright、演員 Kevin Bacon 等。

研究的過程中,他們曾將數據和美國佛蒙特州 80000 例死亡案例中的教育背景相匹配 (其中 1000 例也出現在 Geni.com 的資料庫),試圖證明對譜系學研究感興趣 (並上傳數據的) 人往往家境殷實、學識廣博。遺憾的是,研究人員並未發現其中的關聯。

經過曠日持久的數據挖掘後,Erlich 的團隊於四年前公開了這份譜系圖的初稿。時至今日,譜系圖不斷完善,囊括了多達8600 萬個用戶節點。

通過對這份譜系圖的觀察研究,專家們還從中總結出了不少有關人口增減的動態走向,例如在美國南北戰爭和兩次世界大戰期間成年男性的數量一直呈下降趨勢,直到進入 20 世紀尤其是二戰以後,新生兒的出生率和存活率才開始上揚。

而隨著時間的推移,人類在地球上的分布也越來越廣泛,在這份譜系圖上就明確地標出了世界歷史上的主要遷徙事件,例如 1620 年英國清教徒抵達了美洲大陸,登上了如今的馬薩諸塞州,以及 1788 年英國殖民者開始將囚犯流放到澳大利亞,等等。

圖丨上述譜系圖中有70000個親屬, 通過婚姻(紅色)和共同的祖先聯繫在一起

長壽基因?也許並沒有

此次這份譜系圖還另闢蹊徑,得出了另外一項較為重要的評估成果——我們的壽命與基因的關聯程度究竟為多少,科學家們給出的答案是:16%。在北歐地區,這一數字為 25%(研究剔除了雙胞胎樣本)。

這意味著,自我們每一個個體出生以後,我們能活多長時間主要取決於後天的環境和我們自己的行為,基因對於我們壽命的影響反而變得更小了。

以往的猜測中常常認為,遺傳基因對於人的壽命可能有很重要的影響,而今的研究結果卻表明,這種論調言過其實。

研究人員調查了譜系圖中各個研究對象的壽命——即實際壽命和預期壽命。譜系圖中關係複雜,聯繫眾多,研究者排除同一家庭生活下的環境影響,從中尋找由遺傳基因主導的那部分模式。

「我們的分析結果表明,以往的研究高估了長壽的遺傳性,」他們在文中寫到,「因而,我們也許應該降低對從基因組數據中預測壽命的預期。」甚至說,我們根本不應該寄希望於發現與長壽直接相關的基因。

丹麥歐登塞雙胞胎登記處的負責人 Kaare Christensen 對此評論道,「北歐地區長期和平的環境使得人們的意外死亡減少,(長壽)基因就開始起作用了。」不過,他也指出,僅僅憑藉雙胞胎的數據來支持這項研究還是會多少有些不足夠。

而那個 16% 的研究數字也意味著,尋找傳說中能夠「延年益壽」的長壽基因對於科學家來說還是十分困難的事情,起碼比我們想像中的要難上很多。

基因與婚姻的關係

領導此次研究的 Erlich 團隊還提出了一個十分有意義的項目——「我的摯愛,你在哪?」(who and where is the love of your life),用以探究歷史中基因與我們的婚姻之間的微妙關聯。

他們發現,在 18 世紀的時候,人們通常會和 10 公里外「五服內」的家族表親結婚,而從 1850 年代開始,人們婚姻之間的遺傳關係就減少了,專家們往往會認為,出生距離和交通工具的發展結束了近親結婚。不過,對於這一現象,還出現另外一種解釋,文化和文明已經無法接納這種行為了。

「但不管怎麼說,這些都有助於我們理解基因是如何在一定範圍的地理區域內傳播的,」Erlich 說。不過,這份譜系圖畢竟還只是基於人們的親緣關係所編織的「人際網路」,一切的分析和應用還是太流於表面,並沒有實際上的基因數據的支持。而為了徹底地探究出其中的奧秘,Erlich 的團隊已經開始使用一個名為 DNA.Land 的網站對譜系圖進行再分析。

其大致的操作過程是,志願者們利用 23andMe 和 MyHeritage.com 等公司的基因分析服務獲取自己的 DNA 數據信息,將這些信息上傳到 DNA.Land 上,並填寫一份健康調查問卷,然後 Erlich 的團隊基於這些數據開始構建基因數據集,同時,這些數據集也會向其它研究人員共享。

不難想像,這些數以萬億計的活著的、死去的人類個體的遺傳信息疊加在一起,足以讓研究人員們確定遺傳因素在疫病、身高等性狀中所發揮的作用。

正如冰島的 deCODE Genetics 公司結合 DNA 和健康數據為全國國民打造的譜系圖一樣(冰島全國人口約為 32 萬),這 1300 萬人的龐大譜系圖將會成為科學家們處理人類生育和遺傳問題的「強大資料庫」。


推薦閱讀:

為什麼彭祖活到700多歲, 現代人50多歲就一身病? 如何養生是關鍵
【醫藥趣談·第二話】癌細胞是如何躲過免疫攻擊的?

TAG:長壽 | 基因 |