生物信息學100個基礎問題 —— 第7題 讀懂FastQC報告 Part II

Hello 大家好!

今天我們接著昨天的話題來繼續進行與FastQC結果有關的提問。

我們昨天主要是針對FastQC結果中的boxplot進行了相關的探索,boxplot一般是認為FastQC幾張必看的質控圖之一。一般情況下FastQC的結果會包含下面幾個圖,而我們主要會看下圖圈出來的幾個。

接下來的幾天我們就把這些圖來一個一個討論清楚。

我們昨天討論了「Per base sequence quality」,今天先來討論 「Per base sequence content」

圖1

圖2

問題:

1. 圖1與圖2中橫坐標是什麼意思?縱坐標是什麼意思?

2. 圖1是1個正常的DNA 全基因組測序結果,為什麼前面的幾bp線是波動的?後面的線是平衡的?

3. 圖2是1個特殊RNA建庫的測序結果,4條線出現波動更可能是什麼原因造成的?

4. 在圖1中你能不能看出一個恆定的量?(提示,同一物種間相同,不同物種間一般不同)如果能看出來,這個量是什麼?數值大約是多少?

參考資料:

孟浩巍:20160410 測序分析——使用 FastQC 做質控?

zhuanlan.zhihu.com圖標


硬廣時間:

如果你想做3D基因組方向,而且還沒有入門,本次的Live你一定不要錯過。參加1次至少幫你省了3個月讀文獻的時間。

3D基因組分析從入門到進階?

www.zhihu.com圖標
推薦閱讀:

如何看待 Illumina 推出 NovaSeq 系列測序儀?
20160405 illumina 測序原理介紹
為什麼雙鏈文庫模板只有一條鏈可以結合到flow cell上?

TAG:生物信息學 | 測序 | Illumina |