用Annovar進行線粒體突變注釋

用Annovar進行線粒體突變注釋

2018-09-14

一份線粒體點突變的vcf需要注釋,查閱document發現annovar也可以注釋線粒體突變。開心的用起來~

=====================================================

輸入文件:

突變的vcf文件,長這樣。

但是,annovar注釋有規定的格式(必須第二列起始位點,第三列終止位點,vcf是不行的)但是不用擔心,annovar有可以轉換格式的腳本convert2annovar.pl。

perl convert2annovar.pl -format vcf4 test/snps.filter.vcf > test/snps.filter.annovar

轉換後的文件格式如下

annovar線粒體注釋,原理是依照染色體字樣M/MT,替換原本的密碼子表為線粒體密碼子表。注意要關注比對的參考基因是hg19,還是GRCh37,因為兩者有4pb的位移,如果是用GRCh37比對的,那麼使用如下命令:

table_annovar.pl raw_M.xls humandb/ -buildver GRCh37_MT -out myGRCh37 -remove -protocol ensGene,avsnp150,clinvar20180429,intervar,dbnsfp33a -operation g,f,f,f,f -vcfinput

也可以使用annotatevariation.pl單獨注釋一個資料庫,用table_annovar.pl可以批量注釋,比較方便。如果是hg19,那麼把GRCh37替換為hg19。

下面的不用看

——————————————————————————————————————————

人線粒體編碼網址(基於hg19):

HumanMitoCode < MITOMAP < Foswiki

2017年六月之後,annovar包含hg19_refGeneWithVer.txt

-dtype refGeneWithVer 可以輸出轉錄本的版本。類似 NR_024540.1。


推薦閱讀:

TAG:生物學 | 遺傳學 | 分子生物學 |