生信進階第2課-你應該知道的人類基因組信息

Hello 大家好!

我們的生物信息學入門系列Live已經分別在2017年6月23日與2017年7月31日,成功舉辦了2場,截止到目前為止,已經有超過600人次參加,好評率100%,感謝各位老鐵,各位朋友的支持與鼓勵!我們會繼續努力的!

在前2次Live的討論中,我們對生物信息的入門有了一個比較清楚的認識。也帶領大家學習了從1代到3代的測序技術與原理;按步驟完成了RNA-SEQ的數據分析;使用R軟體進行了boxplot,heatmap等一系列圖的繪製;同時,還嘗試著閱讀了高水平的文獻,進行了相關內容的重複與分析。通過這兩次課程,我們對高通量測序技術又有了更深層次的認識。

在2次課程中,我們多次提到,高通量測序技術(Next Generation Sequencing, NGS)的相關數據一般是從3個類型的數據進行分析。分別是:

  • 使用全基因組測序(Whole Genome Sequencing, WGS)進行點突變(SNP/SNV)與結構變異(CNV)的分析;
  • 使用RNA-Seq從轉錄本水平進行分析(尋找差異表達基因,GO分析,尋找可變剪切等等);
  • 使用Genome Profiling的技術,如ChIP-Seq,甲基化測序等進行基因組區域狀態的分析等等

那麼,在前2次課程中,我們主要是集中在轉錄本水平上進行分析,同時我們發現了一個重要的問題:很多朋友想做基因組和測序相關的內容,但是又苦於不熟悉很多專業的術語和背景知識,導致學習曲線過於陡峭,很多朋友因此早早放棄了高通量測序技術的學習。看到這個問題,並結合我們之前,我們推出本次Live課程,想以人的基因組為例進行相關概念的解釋,並進行ChIP-Seq的數據分析,幫助大家更好的理解相關概念,並掌握ChIP-Seq這種非常重要的數據分析流程。

說起人的基因組,有過高中生物知識的朋友都知道,人有23對染色體,分別是22對常染色體和1對性染色體。還應該知道人類基因組計劃。但是——

您可能不知道,人類基因組計划過程中有一位以一己之力挑戰全球科學家的逆襲事件:

(Venter團隊發表的人類基因組計劃paper截圖,Science,2001)

您可能不知道,我們的染色體的結構和序列非常複雜,其中充滿了插入,缺失,異構:

Peter F.R. Little, Genome Res, 2005

您可能還不知道,直到現在我們的參考基因組依然有200M base pair的鹼基是沒有拼裝的:

(圖中黑色的部分,都是還未完全拼裝的部分)

您可能還不知道,我們的染色體並不是序列狀態,而是通過複雜的纏繞過程形成複雜的三維結構。而在這個過程中,組蛋白起到了至關重要的作用:

(出處不詳,染色體摺疊結構)

在我們這次Live中,我們都會給您詳細介紹!

同時,在整個生命過程中,各種染色體上的調控元件起到了各種不同的作用,比如promoter,enhancer等等,那麼這些區域怎麼在染色體上進行劃分與定位?

(使用ChIP-Seq數據進行染色體功能區域的劃分, Jason Ernst et al., Nature, 2011

還有,通過本次Live您還可以了解到ENCODE計劃:

(Download from ENCODE website)

還會學習ChIP-Seq的標準分析流程:

(Download from ENCODE website)

最後的最後,保證您能畫出下面這種好看的生信graph!

還有這種:

所以,還等什麼?趕緊報名吧!

知乎Live:生信進階第2課-基因組序列 (時間:2017年8月31日晚7點30分)

同時附上之前2次的系列課程:

1. 知乎Live:如何快速入門生物信息學 (涉及內容:測序原理,生物信息學發展歷史,軟體的安裝與調試,入門路線圖,介紹了RNA-Seq的分析流程並給出實踐代碼);

2. 知乎Live: 生信進階第1課-重複Nature文章 (涉及內容:肺癌相關研究現狀,RNA-Seq單細胞測序,RNA-Seq的建庫方法,RNA-Seq的分析流程細節,相關生信圖的繪製);

最後,非常感謝各位朋友的支持與鼓勵,我們將繼續努力!


推薦閱讀:

P值與基因組學(1):從fastq文件的分析的分析談起
合成引物要批量操作 DNA 序列? 你需要 Tailorbird!
能飲一杯無?
知乎Live-R語言入門與R的基礎繪圖系統

TAG:生物信息学 | 基因组学 | 测序 |