生物信息百Jia軟體(五):fastqc

編者按

fastqc是一款經典的二代測序數據質控軟體,其實也不單單是二代測序了,基本上所有測序類型都支持,而且可以直接輸出網頁格式的結果,非常好用。速度也比較快,我一直在想如果能配合一個數據過濾軟體,或者給出過濾建議,這個軟體就更智能,更好用了。

一、功能分類:

測序質控

二、軟體官網:

bioinformatics.babraham.ac.uk

三、軟體介紹:

FastQC是一款功能強大又使用簡單的軟體,主要用戶測序數據的質控。FastQC軟體支持多種平台數據的評估,包括illumina、454、pacbio等等。軟體可以支持Linux,windows,macos等多種平台,並且可以生成網頁格式的報告,方便閱讀。

四、下載安裝:

wget http://www.bioinformatics.babraham.ac.uk/projects/fastqc/fastqc_v0.11.7.zipunzip fastqc_v0.11.7.zip

五、軟體使用:

fastqc運行起來還是比較簡單,如果系統安裝有xming的圖形化窗口,直接敲命令就會彈出圖形界面模式,這個模式下可以直接點滑鼠導入數據。這裡我們採用命令行模式。

加上-h參數看一下有哪些選項。

這裡面選項都比較簡單。選擇比較重要的

-f 指定輸入文件的類型,支持多種格式,

-o 指定輸出目錄,需要先建立一個輸出目錄

還有一些指定是否分析kmer,是否壓縮數據文件等,都比較簡單。

我們拿兩條測序reads來做一下演示。

先創建一個數據目錄,mkdir result,然後

敲fastqc -f fastq -o result reads.1.fq.gz reads.2.fq.gz;

回車之後程序就開始執行了,運行速度還是比較快的。最終會生成網頁文件。

六、使用案例:

mkdir resultfastqc -f fastq -o result reads.1.fq.gz reads.2.fq.gz

報告模板:bioinformatics.babraham.ac.uk

七、注意事項:

1、數據質控是一個綜合的評價標準,其中主要指標為鹼基質量與含量分布,如果這兩個指標合格了,後面大部分指標都可以通過。如果這兩項不合格,其餘都會受到影響。

2、其中一些指標並不適合所有數據。要根據具體數據類型,具體分析。


推薦閱讀:

易經中醫與宇宙時空
陳成猛:石墨烯的守望者 | 「35歲以下科技創新35人」中國榜單專欄
河流為什麼是彎彎曲曲的?
死藤水DMT分子激活天眼 還魂湯體驗靈魂的世界
歐洲探測器第一張新軌道照片中的火星隕石坑

TAG:自然科學 | 生物信息學 |