生物信息學100個基礎問題 —— 第7題 讀懂FastQC報告 Part II
04-02
Hello 大家好!
今天我們接著昨天的話題來繼續進行與FastQC結果有關的提問。
我們昨天主要是針對FastQC結果中的boxplot進行了相關的探索,boxplot一般是認為FastQC幾張必看的質控圖之一。一般情況下FastQC的結果會包含下面幾個圖,而我們主要會看下圖圈出來的幾個。
接下來的幾天我們就把這些圖來一個一個討論清楚。
我們昨天討論了「Per base sequence quality」,今天先來討論 「Per base sequence content」
問題:
1. 圖1與圖2中橫坐標是什麼意思?縱坐標是什麼意思?
2. 圖1是1個正常的DNA 全基因組測序結果,為什麼前面的幾bp線是波動的?後面的線是平衡的?
3. 圖2是1個特殊RNA建庫的測序結果,4條線出現波動更可能是什麼原因造成的?
4. 在圖1中你能不能看出一個恆定的量?(提示,同一物種間相同,不同物種間一般不同)如果能看出來,這個量是什麼?數值大約是多少?
參考資料:
孟浩巍:20160410 測序分析——使用 FastQC 做質控硬廣時間:
如果你想做3D基因組方向,而且還沒有入門,本次的Live你一定不要錯過。參加1次至少幫你省了3個月讀文獻的時間。
3D基因組分析從入門到進階
推薦閱讀:
※如何看待 Illumina 推出 NovaSeq 系列測序儀?
※20160405 illumina 測序原理介紹
※為什麼雙鏈文庫模板只有一條鏈可以結合到flow cell上?