生物信息百Jia軟體(五):fastqc
編者按
fastqc是一款經典的二代測序數據質控軟體,其實也不單單是二代測序了,基本上所有測序類型都支持,而且可以直接輸出網頁格式的結果,非常好用。速度也比較快,我一直在想如果能配合一個數據過濾軟體,或者給出過濾建議,這個軟體就更智能,更好用了。
一、功能分類:
測序質控
二、軟體官網:
http://www.bioinformatics.babraham.ac.uk/projects/fastqc/
三、軟體介紹:
FastQC是一款功能強大又使用簡單的軟體,主要用戶測序數據的質控。FastQC軟體支持多種平台數據的評估,包括illumina、454、pacbio等等。軟體可以支持Linux,windows,macos等多種平台,並且可以生成網頁格式的報告,方便閱讀。
四、下載安裝:
wget http://www.bioinformatics.babraham.ac.uk/projects/fastqc/fastqc_v0.11.7.zipunzip fastqc_v0.11.7.zip
五、軟體使用:
fastqc運行起來還是比較簡單,如果系統安裝有xming的圖形化窗口,直接敲命令就會彈出圖形界面模式,這個模式下可以直接點滑鼠導入數據。這裡我們採用命令行模式。
加上-h參數看一下有哪些選項。這裡面選項都比較簡單。選擇比較重要的
-f 指定輸入文件的類型,支持多種格式,-o 指定輸出目錄,需要先建立一個輸出目錄還有一些指定是否分析kmer,是否壓縮數據文件等,都比較簡單。我們拿兩條測序reads來做一下演示。
先創建一個數據目錄,mkdir result,然後敲fastqc -f fastq -o result reads.1.fq.gz reads.2.fq.gz;回車之後程序就開始執行了,運行速度還是比較快的。最終會生成網頁文件。六、使用案例:
mkdir resultfastqc -f fastq -o result reads.1.fq.gz reads.2.fq.gz
報告模板:http://www.bioinformatics.babraham.ac.uk/projects/fastqc/good_sequence_short_fastqc.html
七、注意事項:
1、數據質控是一個綜合的評價標準,其中主要指標為鹼基質量與含量分布,如果這兩個指標合格了,後面大部分指標都可以通過。如果這兩項不合格,其餘都會受到影響。
2、其中一些指標並不適合所有數據。要根據具體數據類型,具體分析。推薦閱讀:
※易經中醫與宇宙時空
※陳成猛:石墨烯的守望者 | 「35歲以下科技創新35人」中國榜單專欄
※河流為什麼是彎彎曲曲的?
※死藤水DMT分子激活天眼 還魂湯體驗靈魂的世界
※歐洲探測器第一張新軌道照片中的火星隕石坑