如何判斷一個基因在一個物種中有幾個拷貝?
01-12
玉米中ZmDREB基因為例
一般問這種問題的,基因組和注釋質量都不會太高。
對於編碼基因,可以try一些專為AA序列比對DNA序列優化的比對工具試試看。即對AA序列要求全局優化,而對DNA序列要求局部優化。這個考慮的出發點是AA序列一般會更保守些,而多拷貝基因之間序列保守性會差一些。如果是多拷貝的小RNA基因查找,可以考慮專為RNA二級結構保守性優化的比對工具。
當然,這類比對結果都需要審慎地對待。
另,說道玉米檢測基因拷貝,這裡安利一下PacBio:PNAS: Copy Number Analysis in Maize Sheds Light on Tolerance for Acidic Soil先來點詭辯的:
都有人能多出一條染色體,個別的個體多個把基因算什麼?最好不要把群體中的概念與個體的概念混起來討論——三條腿的蛤蟆不好找,也是有的……
題主的問題再細分一下:
1)我有一個基因組序列(比如玉米的),想知道有幾個拷貝。建議用blast之類的序列比對工具進行初步確認。2)我有一個DNA材料,想知道有幾個拷貝。建議使用定量PCR之類的手段來進行確認,同時還需要知道一個參考。
唯一準確的方法:搞出基因組完成圖。或者你非常非常確認那個基因不在洞里。
為什麼沒有人提最簡單的southrn雜交呢。。
用這個基因的CDS做探針,提玉米基因組DNA做酶切跑膠轉模雜交就好了啊,再不放心還可以多用幾個內切酶試試啊
查下CNV array。
三代測序或者qPCR之類的吧。。。
實驗的方法的話,就是基於taqman的數字PCR/dPCR 可以精確的測出拷貝數,這個行業Bio-rad 是老大
推薦閱讀:
※生物專業如何從零信息學基礎開始自學生物信息學?
※本人是學生物的,涉及到生物信息,主要是基因組,轉錄組分析,請問該如何去有效的去學習python呢?
※生物信息行業應該具備哪些基礎素養?重點應該放在計算機方面還是生物方面或者說其他?
※Spark 對於生物大數據分析來講有什麼缺點和不足?
TAG:生物信息學 |