用Annovar進行線粒體突變注釋
2018-09-14
一份線粒體點突變的vcf需要注釋,查閱document發現annovar也可以注釋線粒體突變。開心的用起來~
=====================================================
輸入文件:
突變的vcf文件,長這樣。
但是,annovar注釋有規定的格式(必須第二列起始位點,第三列終止位點,vcf是不行的)但是不用擔心,annovar有可以轉換格式的腳本convert2annovar.pl。
perl convert2annovar.pl -format vcf4 test/snps.filter.vcf > test/snps.filter.annovar
轉換後的文件格式如下
annovar線粒體注釋,原理是依照染色體字樣M/MT,替換原本的密碼子表為線粒體密碼子表。注意要關注比對的參考基因是hg19,還是GRCh37,因為兩者有4pb的位移,如果是用GRCh37比對的,那麼使用如下命令:
table_annovar.pl raw_M.xls humandb/ -buildver GRCh37_MT -out myGRCh37 -remove -protocol ensGene,avsnp150,clinvar20180429,intervar,dbnsfp33a -operation g,f,f,f,f -vcfinput
也可以使用annotatevariation.pl單獨注釋一個資料庫,用table_annovar.pl可以批量注釋,比較方便。如果是hg19,那麼把GRCh37替換為hg19。
下面的不用看
——————————————————————————————————————————
人線粒體編碼網址(基於hg19):
HumanMitoCode < MITOMAP < Foswiki
2017年六月之後,annovar包含hg19_refGeneWithVer.txt-dtype refGeneWithVer 可以輸出轉錄本的版本。類似 NR_024540.1。
推薦閱讀: