標籤:

如何判斷一個基因在一個物種中有幾個拷貝?

玉米中ZmDREB基因為例


一般問這種問題的,基因組和注釋質量都不會太高。

對於編碼基因,可以try一些專為AA序列比對DNA序列優化的比對工具試試看。即對AA序列要求全局優化,而對DNA序列要求局部優化。這個考慮的出發點是AA序列一般會更保守些,而多拷貝基因之間序列保守性會差一些。如果是多拷貝的小RNA基因查找,可以考慮專為RNA二級結構保守性優化的比對工具。

當然,這類比對結果都需要審慎地對待。

另,說道玉米檢測基因拷貝,這裡安利一下PacBio:

PNAS: Copy Number Analysis in Maize Sheds Light on Tolerance for Acidic Soil

大意就是blablabla有個基因很重要,實際序列如上方那條,有多個拷貝,但因為兩側都有大量重複序列,所以用NGS方法拼只能得到最底下那個結果,但用了新一代神油以後,因為讀長關係就可以正確地檢出順序排列地多拷貝了。當然,這種屬於需要花錢才能治的富貴病,和一開始提的窮棍方案應對的是不同的情況。


先來點詭辯的:

都有人能多出一條染色體,個別的個體多個把基因算什麼?

最好不要把群體中的概念與個體的概念混起來討論——三條腿的蛤蟆不好找,也是有的……

題主的問題再細分一下:

1)我有一個基因組序列(比如玉米的),想知道有幾個拷貝。

建議用blast之類的序列比對工具進行初步確認。

2)我有一個DNA材料,想知道有幾個拷貝。

建議使用定量PCR之類的手段來進行確認,同時還需要知道一個參考。


唯一準確的方法:搞出基因組完成圖。

或者你非常非常確認那個基因不在洞里。


為什麼沒有人提最簡單的southrn雜交呢。。

用這個基因的CDS做探針,提玉米基因組DNA做酶切跑膠轉模雜交就好了啊,再不放心還可以多用幾個內切酶試試啊


查下CNV array。


三代測序或者qPCR之類的吧。。。


實驗的方法的話,就是基於taqman的數字PCR/dPCR 可以精確的測出拷貝數,這個行業Bio-rad 是老大


推薦閱讀:

生物專業如何從零信息學基礎開始自學生物信息學?
本人是學生物的,涉及到生物信息,主要是基因組,轉錄組分析,請問該如何去有效的去學習python呢?
生物信息行業應該具備哪些基礎素養?重點應該放在計算機方面還是生物方面或者說其他?
Spark 對於生物大數據分析來講有什麼缺點和不足?

TAG:生物信息學 |