Haldane 作圖函數的推倒 (並沒有錯

殼子版鏈接: (這次真的只是數學) 遺傳題 Part 8 Haldane 作圖函數

吐個槽: 為什麼知乎的數學公式都是 PNG, 直接上 Retina-friendly SVG 多好。。。

(因為這個系列並不連載於知乎,這裡的標題就不加上系列名稱了)

不過在推倒 Haldane 作圖函數 (Haldane』s mapping function) 之前,我們先考慮如下情況:

有一根繩子上面打了若干個結。他上面有一點 S, 距 Sn 個結 (n 足夠大; 沒有結恰好在 SP 點) 之外有一個點 P. 現在我們隨機往繩子的結上做一些標記,使得繩子上任意一個結被做上標記的概率為 p (一個大於 0 但足夠接近 0 的常數), 且各結被做上標記是相互獨立事件,求 SP 之間恰有奇數個標記的概率 F.

SP 間的標記數 k 符合一個二項分布,但單次事件 (某個 SP 之間的點被標記) 發生的概率足夠小,並且重複的次數 n 足夠大的情況下,可以近似看作 Poisson 分布 p(k;np)

lambda=np.

therefore F=sum_{n=0}^{infty}p(2n+1,lambda)=frac{lambda^1}{1!}e^{-lambda}+frac{lambda^3}{3!}e^{-lambda}+...

e^{-lambda} 提出後,看起來像是 Taylor 公式的展開式。我們可以把他還原回雙曲正弦函數。最終我們可以得到

F=e^{-lambda}sinhlambda=frac 1 2(1-e^{-2lambda})

現在切入正題。

假設染色體由足夠多基因 (準確的說法是重組子 recon, 其最小單位僅有一個鹼基對) 組成。在聯會的過程中,任意兩個相鄰基因之間均有一個足夠小的概率 p 發生交換 (chromosomal crossover)。假設不存在染色體干涉,也就是說,在不同位點之間的交換是相互獨立的 (實際上,染色體上發生的第一次交換通常會降低鄰近區域第二次交換的概率—但此處不考慮)。

e.g., frac{a,,,,b,,,,c}{A,,B,,C}AB 之間交換的結果是 frac{a,,B,,C}{A,,,b,,,,c}, 而雙交換的結果則是 frac{a,,B,,,c}{A,,,b,,,C}.

一個染色體上的兩個位點 AB 之間具體間隔的鹼基對數量 n (這是一個簡化的說法,因為實際上常染色質異染色質端粒著絲粒單位長度內發生交換的概率是不同的) 和每兩對鹼基對之間具體的重組概率 p 是未知的 (在分子方法出現之前是未知的; 此外在分子方法出現之後,通過重組值作出的遺傳圖 (genetic map; 連鎖圖 linkage map) 仍然有他的用途: 通過比較連鎖圖和物理圖之間的差異,我們不僅可以把交換值和鹼基對的數量對應,也可以比較同一條染色體內部或者不同染色體甚至不同物種之間,哪些區域/染色體/物種更易於發生重組),但是我們可以用交換值 d,(d=np) 來表示這兩個位點之間的距離,而他是可以通過重組的概率來推倒的。

求聯會過程中,同源染色體上相隔 d (相對可以看作 Poisson 分布來說足夠遠,但還不足以把他們看作自由組合) 的 AB 位點之間發生重組的概率。

我們知道,發生奇數次交換時會發生重組,而發生偶數次交換時不會。根據之前的推倒,交換的次數符合 Poisson 分布 p(k;d),因此重組值 RF 滿足

RF=frac{1}{2}(1-e^{-2d})

當然在實際使用中 d 通常以 m.u. 或者 cM 作為單位,因此有時上式也寫成

RF=frac1 2(1-e^{-2d/100})

Vice versa, 如果我們通過實驗測定了重組值,也可以通過反函數求得交換值,從而作出連鎖圖。

當然我覺得 Haldane 那個時代是把染色體直接當作連續的東西討論的,所以兩個位點之間發生多少次交換就直接是完美的 Poisson 分布… 但是還是離散的東西用自然語言好講,所以我在上文中,把他講成離散的情況—繩子的結,或者 DNA 的鹼基對之間的空隙: 離散的情況符合二項分布,但是試驗次數足夠多,單次試驗中該事件發生的概率足夠低的情況下,我們可以用二項分布的 Poisson 近似—雖然實際上,對 DNA 來說,有可能發生交換的位置確實是離散的…

在經典遺傳學尋找重組值和交換值的關係的應用場景中,高數的 Taylor 公式和概率的 Poisson 分布奇妙的在一起了。

所以 Haldane 老師是把高數和概率學的多好…

See Centimorgan for more details.

推薦閱讀:

野心和恐懼:被蠢人、窮人與聰明人放棄的「概率權」
為什麼隨機變數X和Y不相關卻不一定獨立?
如何看待郭敬明《爵跡》里:「他的天賦技能攝魂最低的成功率是50% 也就是說兩次攝魂必有一次成功 」?

TAG:遗传学 | 概率 | 高等数学 |