基因家譜的研究動態

基因家譜的研究動態

11 人贊了文章

譜牒又稱家譜、 家乘、 宗譜、 族譜和世譜,是家族的歷史書。譜牒、 方誌和正史是我國史學研究的三大基石,故有「家乘猶國史」 的美譽。譜牒反映了中國宗法血緣文化,在我國有著悠久的歷史。

遺傳學究其本質是一門歷史科學。遺傳突變世代相傳,並因為隨機性或者選擇作用在群體和物種間/內積累下來。人體內有23對染色體,其中22對常染色體中,每一對染色體都有一條來自於父親,一條來自於母親,兩條染色體在傳代過程中會發生部分重組。另一對性染色體,包括X染色體和Y染色體。在女性體內,X染色體成對出現,也會發生重組現象。但是在男性體內,X染色體來自母親,Y染色體只能來自父親。因此,Y染色體具有父子相傳的特點,嚴格遵從父系遺傳的方式,傳遞過程中不受社會文化和自然因素的影響。

遺傳物質的傳遞規律

基因家譜研究是遺傳學在傳統譜牒學上的應用,它試圖通過DNA檢測,特別是 Y染色體標記體系,弄清家族內部個體間的遺傳關係。基因家譜研究極大地彌補了傳統譜牒學的不足。在我國,家族、宗族都是指父系制度的同姓親族,是以婚姻和血緣關係結合成的社會單位,因此,相比其他遺傳標記體系,Y染色體是研究基因家譜的絕佳材料。Y染色體上有著充足的拓撲學關係明晰的遺傳標記,可以滿足父系遺傳譜系的構建; 另外,Y染色體上有著穩定的「分子鐘」,可以估算不同Y染色體間的分化時間。因此,當遺失的或者不忠實記載的譜牒無法作為追尋祖先的可靠依據時,以現代分子生物為基礎的基因家譜研究是直接追溯宗族成員之間親緣關係的最佳方法,是驗證祖先與後代的父系關聯,補全和重構家族譜牒的唯一手段。

世界範圍內基因家譜的研究動態

對於人類根源的探索緣於人類本能的好奇心。20世紀末期,來自數個國家的數百萬人開始熱衷於尋找自己的祖先來源。這一狂熱的愛好催生了應用科學一個新的分支———基因家譜學,在該學科中,DNA分子起到了承載家族歷史的作用。

首個基因家譜研究實際上是一次法醫學調查。這些90年代早期的案例中,最有名的是羅曼諾夫沙皇家族和納粹罪犯約瑟夫·門格勒的遺骸鑒定。通過各種親緣關係的比較,前者確定出土於葉卡捷琳堡的一座墓葬中的9塊遺骨來自俄羅斯末代沙皇———尼古拉二世及其家族成員; 後者證明1985年出土於巴西的遺骸屬於約瑟夫·門格勒本人。

末代沙皇-尼古拉二世

基因家譜學真正的萌芽是在20世紀90年代末,主要標誌為一系列高質量文獻的 發表。從文獻發表的先後順序和學術意義來看,排在首位的是1997年Scorecki 等關於猶太祭祀Y染色體的研究。《聖經》中記載猶太人中的祭司是由猶太教的第一祭司長Aaron開始按血緣代代相傳,作者們發現德系和西班牙系猶太祭司們與非祭司的猶太人相比,有較近的親緣關係,也就是說,祭司們可跨越3300年追溯到一個共同的父系祖先。Y染色體的分析與《聖經》故事的完美契合著實讓人吃驚。這項研究開創了通過 Y 染色體標記進行基因家譜研究的先河。

1998 年,兩篇文章的問世為基因家譜學的建立添磚加瓦。這兩篇文章都與歷史名人有關,因此引發了極大的關注。第一項研究與美國第三任總統托馬斯·傑斐遜和他的黑人女僕莎麗·海明斯有無私生子的鑒定有關。Foster比較了傑斐遜的叔叔、 莎麗的大兒子和最小的兒子的男性後代Y染色體,認為傑斐遜是莎麗的最小兒子的生父。這項研究理清了莎麗·海明斯後代錯綜複雜的親緣關係,為隨後通過Y染色體標記重塑父系譜系關係提供了範例。

托馬斯·傑斐遜與莎麗·海明斯

同年,Decorte發表了一項疑似法國國王路易十六和瑪麗·安托瓦內特的兒子的線粒體DNA鑒定。作者們對Karl Wilhelm Naundorf( 聲稱是這對皇室夫婦的後代) 、瑪麗·安托瓦內特和她的兩個姐妹,以及現存的母系親屬的線粒體DNA進行了分型。結果表明,雖然Naundorf被冠以路易十七的名號,但他的線粒體DNA遺傳類型與其他母系親屬測試者的完全不同,因此他是個偽冒者。這項研究是最早通過線粒體 DNA 進行基因家譜學研究的工作,為通過母系遺傳研究基因家譜學提供了參考。

Karl Wilhelm Naundorf

近 20 年,受公眾對名人家族歷史的濃厚興趣的驅動,基因家譜學中探索歷史名人的父系類型一直是最為活躍的研究方向,例如前面提到的美國總統托馬斯·傑斐遜,法國皇帝拿破崙和波旁家族,俄羅斯的羅曼諾夫家族,以及中國的愛新覺羅家族、成吉思汗和曹操。

其中,成吉思汗和愛新覺羅·覺昌安的父系類型最早是通過特殊的 Y 染色體單倍型,即所謂的星簇( Star Cluster) 和滿族簇(Manchu cluster) 推測而來的,它們分別高頻出現於蒙古語和滿通古斯語人群。這種通過分析Y染色體單倍型數據尋找晚近人群擴張信號的方法還運用在其他課題中。例如,2015年Balaresque分析了歐亞大陸上127個人群的5321個Y染色體數據,發現了11個星簇狀的擴張信號,其擴張年代為公元前2100年至公元1100年。排除所用位點過少、可能存在的遺傳類型錯判等問題,這項研究還是有些有趣的結論,比如揭示了晚近擴張人群與生活方式的關係———阿爾泰語游牧人群Y染色體的大範圍傳播可能與馬的使用有關。

基因家譜研究受DNA檢測技術發展的推動。現如今,基於現代DNA和古代DNA高通量測序的手段也進入到基因家譜學之中。最好的例子是2014年Olalde I等測試了一個疑似含法國國王路易十六血液的手帕上的全基因組,他們發現,根據所獲得的數據來推斷的祖先和表型與歷史記載不符,否定了葫蘆內所含血樣屬於路易十六,該研究為破解歷史懸案提供了有力的證據。

國內基因家譜的研究動態

國內基因家譜的研究要從曹操家族說起。這項研究通過對曹操後代家系的遺傳學梳理,確定了曹操的遺傳類型和身世,證實曹操的父親是家族內過繼,而不是異姓( 夏侯家) 收養,這解決了歷史學遺留了2000年的問題 。

曹操的祖父是東漢時期的大宦官曹騰,曹操的生父曹嵩是其養子,因此,曹操的身世是一大史學謎題。曹操在作《家傳》時自稱為周朝曹叔振鐸之後,後來再度改為出自帝舜。據《曹瞞傳》記載,曹操之父曹嵩出自夏侯氏。宋代以後,曹操出自夏侯氏的說法流傳甚廣。而後世製作的家譜幾乎都追溯到西漢開國功臣曹參。傳統譜牒學方法僅從文獻資料無法確定曹操的真實身世,使用最

新的科學技術成為解決這個問題的新思路。

復旦大學現代人類學教育部重點實驗室從2009年開始對曹操的遺傳類型歸屬展開了系統的調查,分別從曹操可能存在的後人家系和曹氏宗族墓群中曹操的叔祖父———曹鼎遺骸兩方面入手,論證曹操的父系Y染色體類型極有可能為O2* -M268。根據曹操後人家系的測試結果,反推單倍群O2*-M268為曹操所屬類型的可能性是92.71% ; 根據古代樣本Y染色體12個STR位點的測試結果,利用基於貝葉斯等位基因頻率法的資料庫,推測曹鼎屬於O2*-M268+,PK4-,M176- 的概率為60.18%,屬於單倍群C3*-M217的概率為13.97%,屬於其他單倍群的概率均低於11%。2016年,課題組又對該樣本進行了Y染色體單核苷酸多態位點( SNP) 分型測試,明確其遺傳類型屬於O2-M268+,F1462+,PK4-,彌補了之前通過現代人家系推測曹操遺傳類型和Y-STR推測Y-SNP的缺陷。至此,曹操及其後人的遺傳類型為F1462+,PK4-的結論得以蓋棺定論。

曹操

如前文所述,一些研究者根據蒙古語和滿通古斯語人群中特有的高頻單倍型(星簇和滿族簇) ,以及對應的共祖時間,推測其父系祖先分別為成吉思汗和愛新覺羅·覺昌安。但是,由於缺乏明確的家系樣本和古代遺骸的支持,這兩個推測結果的真實性一直飽受爭議。2015年,我們採集了7個愛新覺羅氏的家系(3個家系有完整譜牒)的男性樣本,進行了Y染色體短串聯重複片段( STR)分型,結果顯示,其中3家(2家有完整家譜,其最近共祖為清太祖努爾哈赤) 的父系遺傳類型非常接近,且極為罕見,對這3個樣本的Y-SNP測試結果表明,此類型屬於C3b2b1*-M401單倍群,即愛新覺羅家族的父系遺傳類型。2016年,我們又對愛新覺羅家族的男性個體進行了Y染色體測序,發現這些個體屬於更為精細的遺傳類型C3b1a3a2-F8951,與星簇為兄弟支系,與之前推測的C3b2a-M48滿族簇毫無關係。因此,之前推斷的成吉思汗與星簇之間的關係可能也不牢靠。

努爾哈赤

2017年,韋蘭海等探討了星簇的起源,以及它與成吉思汗和各個蒙古語人群的關係。通過對34個屬於星簇的Y染色體全序及與其較近支系的Y序列的研究,我們發現這些星簇樣本屬於單倍群C3b1a3a1-F3796,其分布於中國東北到北高加索的廣大區域。這些人群的源頭被追溯到古代尼倫蒙古部落或者普通的蒙古部落,比如烏茲別克人和諾蓋人中的曼格特部(Manghit tribe)、烏茲別克人中的柯訥格斯部(Keneges tribe)、阿富汗的哈扎拉人、中國的達斡爾人,以及哈薩克人群中的拉特部(Dulat tribe)、烏孫部(Uysun tribe)和克烈部(Kerey tribe)。而他們的晚近共祖時間為2576年前,與整個蒙古語人群擴張的時間一致,這顯然與成吉思汗或其他男性親屬無關。Zerjal等認為哈扎拉人是成吉思汗的直系子孫,他們認為這是支持成吉思汗與星簇之間關係的有力證據。

但事實上,哈扎拉人來源於成吉思汗派遣的蒙古大軍。而這兩萬戰士來自於不同的蒙古部落,並沒有直接證據表明哈扎拉人都是成吉思汗的後代。事實上,尋找成吉思汗的父系類型困難重重。一方面,由於蒙古人保持祖先神秘感的葬俗,導致蒙古貴族(特別是皇室)的墓地極少被發現。儘管如此,基於有限墓葬的古DNA研究給出了極為矛盾的結論。根據蒙古國東部塔班陶勒蓋的疑似黃金家族墓地遺骸的DNA鑒定結果,Lkhagvasuren等認為成吉思汗和他的家族屬於遺傳類型R1b-M343,然而另一項來自中國河北的高等級貴族墓的遺傳調查表明,成吉思汗的遺傳類型為單倍群Q也不能完全排除。另一方面,疑似成吉思汗後代的現代人的 DNA 分型結果表明,不同家族分支的父系類型也不一致。比如說,3個現存的成吉思汗家族分支屬於遺傳類型C3下的3個早期分化的不同亞型,此外,成吉思汗親兄弟Khasar的後人屬於遺傳類型O3,成吉思汗父親的同父異母兄弟Belgutei的後人屬於遺傳類型R1a1a。

成吉思汗

近年來,本課題組對西北地區永登縣的魯土司家族進行了父系遺傳調查,根據魯氏家譜的記載,他們的祖先為脫歡( 成吉思汗的第六子闊列堅的後代) 。在元末明初,脫歡和他的部眾歸降於明廷。後因作戰勇猛,自第三代起賜漢姓魯。從此,魯土司家族駐守西北永登縣長達19代,歷時561年。Y染色體分型結果表明, 魯土司家族的遺傳類型為C3b1a1a1a-F1756(又稱C3b3a2a-448del),常見於蒙古語和突厥語人群。進一步的遺傳網路分析發現,魯土司家族後人與哈薩克DNA計劃(The Kazakhstan DNA Project)中的Tore支系共享單倍型。Tore 支係為成吉思汗大兒子朮赤的後代。至此,成吉思汗的遺傳類型又有了一個新的可能———C3b1a1a1a-F1756。

司馬光家族延續了上千年,家譜記載較為完整,為突變速率的估計提供了較好的材料。杜盼新等對11個聲稱為司馬光後代的家族進行了Y-STR分型,結果表明,有5個家族的STR單倍型彼此之間十分接近,同屬下游單倍群O1a1a1a1a1a-F492,F656-。

司馬光

關於東亞的父系人口歷史,2014 年,嚴實等應用二代測序技術發現了Y染色體上約4000個新的遺傳標記,並定義了大量新的分支,發現東亞3個父系星狀擴張發生在約5000~6000年前的新石器時代,現代約40%的中國人來自當時這3個子嗣繁多的祖先。我們最近的研究進一步觀察到這次新石器時代的強烈的瓶頸效應和人口擴張。東亞特有的父系譜系中,有5個呈星狀結構———O3a2c1a-F5(Oα) 、 O3a2c1-F46 (Oβ) 、O3a1c1-F11(Oγ)、C3a1-F2613(Cα)和Q1a1-M120(Qα) ,以及一個呈複雜分叉結構———O1a1a1-F78( Oσ) 。值得注意的是,我們發現65%的現代中國人都是這6個超級祖父的後代,他們的擴張時間分別為5400年前(Oα)、6500年前(Oβ)、6800年前(Oγ)、6400年前(Cα)、5200年前(Qα)和5000年前(Oσ)。正如前文所述,我們揭示了漢族主體來自於新石器時代的少數幾個父系祖先,但他們是誰? 每個超級祖父與古史傳說中的傳奇領袖是否有關? 不久的將來,聯合古DNA和現代人DNA的研究將有助於解決這些問題,它對於理解中國人群的起源非常關鍵。

考古發掘往往面臨一個問題,漢之前的遺址極少有墓磚、 墓誌等表明身份信息的出土物,再加上墓地被盜嚴重( 墓誌等有經濟價值),絕大部分遺骨缺少身份信息,但是對於墓地發掘來說,確定墓主人的身份是考古學的一個核心問題。

山東省臨沂市洗硯池晉墓位於洗硯池街北側、 王羲之故居公園東北部。此處共發現兩座墓葬,其中,M1為雙室墓葬,保存完整,同一墓葬埋葬 3 個未成年人,為考古發掘中極為罕見的現象; M2為夫妻合葬墓,墓室結構完整,在一號墓之西,與一號墓相距不遠。該遺址一經發現,便引起了社會和學術界的廣泛關注,被評為2003年度十大考古發現之一。但是,對於墓主人的身份一直存在兩種猜測: 一種認為是琅琊王氏的後代,另一種認為是西晉司馬氏的後代。2016 年,杜盼新等人對該遺址進行了基因家譜調查: (1)排除了M1西室6歲女童與M2夫婦間的親緣關係; (2)鑒定了M2墓葬中男性遺骨的父系遺傳類型為C3南支-F948+,F3880+,該遺傳類型在北方漢族中最為常見。該研究為後續琅琊王氏和司馬家族的父系遺傳類型研究奠定了基礎。

洗硯池晉墓

還有一個案例是復旦大學和吉林大學古DNA課題組的一次合作。兩個課題組對內蒙古阿魯科爾沁旗遼代耶律羽之墓地的兩個男性人骨進行了古DNA鑒定。一個遺骸為M6:3(耶律道清,耶律羽之的三代子孫),一個為M10(無墓誌)。實驗結果表明,兩個個體的遺傳類型分屬N南支和N北支,這兩個支系的分化時間已有上萬年。通過父系親緣關係鑒定,排除了M10是耶律羽之家族男性後代的可能,其具體身份有待進一步比較驗證。

耶律羽之墓

基於上述兩個案例,我們可以看到,對於大量已經發掘的身份未定的墓地,DNA鑒定並將其結果納入一個可以相互比對的古DNA資料庫的重要性。依據這個資料庫,我們可以基於親緣關係,推測未知遺骸的可能身份。另外,進一步結合碳十四測年技術和文獻材料,多重證據鎖定未知墓主的身份,真正發揮科技考古的威力。

甘肅白銀市連環殺人案的破獲是法醫學運用基因家譜學原理的一個成功案例 。白銀連環殺人案是中華人民共和國成立以來發生的重大惡性案件之一。從1988年到2002年,11位女性(包括一名8歲的女童)遭到強姦和殺害。嫌疑犯逍遙法外長達30年,警方做出了各種努力,如指紋比對、DNA比對、按口述畫像、重金懸賞等,但均無功而返。但是前期的積累是有意義的,尤其是Y染色體資料庫的建立,成為後續破案的關鍵。當嫌疑人的遠方堂叔犯案,警方發現其Y染色體單倍型與當年疑犯的DNA 類型一致時,整個高氏家族男性都被納入了排查範圍,最終,白銀市連環殺人案得以快速破獲。該案件的破獲是Y染色體基因家譜學的成功運用,這意味著法醫資料庫不僅只能做同一認定,每個男性數據背後代表著一個大的同姓家族。Y染色體DNA分型和基因家譜學原理正在成為法醫遺傳學的常規手段。

近年來,本課題組開發了一個專門用於群體遺傳學和法醫學應用的Y染色體資料庫,通過該資料庫,我們推測了入緬遠征軍、淮海戰役士兵,以及一些刑事案件中的疑犯和失蹤人口的可能地理來源和父系親屬。

操姓主要有鄱陽郡操姓和重慶長壽操姓兩大分支。據傳,鄱陽郡操姓源自逃難的曹操後人。2012年,王傳超等的Y染色體調查顯示,鄱陽郡操姓與曹操家族,乃至其他曹姓均無關係。2014年,王傳超等又依據譜牒材料,對賽典赤及鄭和的後裔———雲南的納姓和馬姓進行父系Y染色體分型,發現他們屬於南亞西部常見的單倍群L1a-M76,揭示了賽典赤與鄭和的波斯祖源。

父系單倍群L分布圖

展望

姓氏最早出現於中國,其歷史可追溯到5000年前。在其他國家中,西歐人姓氏最早的記錄不足千年(愛爾蘭人約900年),日本人的姓氏也才150餘年。我國現有姓氏4100個,但大多數姓氏的起源並不單一。周朝的姓氏大多是以封國為氏,後改為姓,封國內的百姓來源本來就是多種多樣的。所以中國的姓氏總體上內部父系血緣並不完全一致。根據我們對超過10000例帶有姓氏信息的Y-SNP/STR數據的分析,在同一個姓氏中,幾乎可以觀察到中國人中常見的所有父系類型,同時,在同一個父系類型中,也幾乎可以看到中國人群中所有常見的姓氏。這意味著姓氏和Y染色體不是簡單地一一對應關係,基於較小樣本量的推測,Y染色體類型與姓氏之間的關聯沒有意義。

但是,修著家譜一直是中國人的傳統,一些家譜甚至跨越3000年。這些譜牒材料和深度家系都是我國的人文資源。研究族群/姓氏內部和深度家系的遺傳動態,可能是釐清族群/姓氏來源和演化的一個事半功倍的方案。

註:因本文章內容成文較早,使用了早期的命名系統及共祖時間計算結果。

作者簡介

本文原刊載於北方民族大學學報2018年第1期(總第139期),原標題為《基因家譜學在中國的發展歷程》。經文少卿博士授權轉載,轉載時有刪減。

文少卿

復旦大學現代人類學教育部重點實驗室博士後、法國國立東方語言文化學院(INALCO)人類語言學博士。

推薦閱讀:

三皇五帝的家譜(吐血版)
家譜與國史並重

TAG:家譜 | 基因 | 分子生物學 |