【乾貨】ChIP 引物設計葵花寶典3.0

【乾貨】ChIP 引物設計

順利實驗 快樂過節

上周的文章推出來,關注表觀的小夥伴紛紛問了做ChIP的一些常見問題,小編就提問比較多的問題做了詳細的解讀。做過ChIP實驗的同學都知道,ChIP-qPCR檢測引物設計十分關鍵,周末小編為各位小夥伴整理出:

如何使用GEO資料庫ChIP-Seq數據和UCSC genome browser資料庫設計ChIP引物?

話不多說,乾貨已到,同學們準備上車吧!

GEO資料庫

簡介:(https://www.ncbi.nlm.nih.gov/geo/)

GEO資料庫是NCBI資料庫下面專門存儲基因晶元數據和高通量測序數據的一個子資料庫。一般發表研究論文時高通量測序數據都需要提交到該資料庫,文章接收之後這部分的數據都是需要公開的,因此讀者可以從別人已經發表的ChIP-Seq數據中查看目的蛋白在基因組上富集的區域。

UCSC genome browser

簡介:(https://genome.ucsc.edu)

UCSC genome browser資料庫是由美國加州大學聖克魯茲分校維護的一個資料庫,存儲了人,小鼠,大鼠等多個物種不同版本的基因組信息。通過該資料庫我們可以很方便的查看常見物種基因組不同基因的坐標信息,基因可變剪接模式,外顯子和內含子信息,基因組上的突變信息,序列保守型等。

乾貨實例

在本案例中,我們首先需要在GEO資料庫中查找文章中高通量測序數據的相關記錄信息。高通量測序數據提交到GEO資料庫之後會分配一個GSE編號,在撰寫科研論文過程中需要在文章中描述測序數據的GEO資料庫編號。一般在文章的結尾或者方法部分會有這條相關記錄。我們以Richard A. Young 教授課題組2013年發表的Cell關於Super enhancer的文章為例。

在上述文章中我們找到測序數據GSE編號為:GSE51522。

我們也可以在NCBI Pubmed資料庫中查詢對應的文章,然後點擊網頁右側GEO資料庫的鏈接,跳轉到GEO資料庫中對應的數據。

然後我們在GEO資料庫根據該編號查找相關數據。

GEO資料庫查詢結果。GEO資料庫會記錄高通量數據相關的課題背景,實驗設計,物種信息,樣本的處理過程,測序的平台信息和測序模式,數據分析過程中使用的軟體和基因組注釋文件信息。我們一定要注意作者分析數據過程中選擇的基因組版本信息,不同版本分析結果的坐標不一樣。我們在接下來使用UCSC genome browser資料庫時基因組版本信息一定要選擇和GEO資料庫中一致。

在同一個頁面的下半部分,我們可以看到作者提交了多組不同的ChIP-Seq數據和RNA-Seq數據。在本案例中我們選擇組蛋白H3K27ac ChIP-Seq數據作為例子。

點擊GSM1246865鏈接進入H3K27ac ChIP-Seq數據詳細頁面,我們可以看到更多的信息,紅色標記的都是比較關鍵的信息。

我們可以看到在這個案例中,作者分析數據採用的人類基因組hg19版本。

在網頁的下面,我們可以找到ChIP-Seq比對基因組之後生成的WIG格式的文件。我們在這裡不詳述WIG格式文件的細節,大家如果感興趣可以關注我們之後的文章。這個FTP和HTTP鏈接就是我們在GEO資料庫中最終需要查找的內容。找到這個鏈接之後GEO資料庫部分告一段落,我們可以將這個鏈接複製粘貼保存,接下來在UCSC genome browser資料庫中我們會用到這個鏈接。

下一步我們打開UCSC genome browser資料庫(https://genome.ucsc.edu),選擇網頁上方的 『Genome Browser』 鏈接。

打開Genome browser網頁之後我們可以看到如下界面,然後選擇界面下方 『manage custom tracks』 按鈕。UCSC genome browser每一行基因組信息稱為一個track,有的tracks記錄的是基因的坐標信息,有的tracks記錄的是SNPs位點信息等,我們在本案例中不詳述。『manage custom tracks』 可以讓我們自由編輯自己想要查看的基因組相關信息,可以提交自己分析之後的結果,也可以像我們本案例中展示的提交其他資料庫(如GEO資料庫)中存儲的數據。

進入到Add Custom Tracks界面之後,我們一定要記得選擇正確的物種和基因組注釋文件。然後我們將GEO資料庫中最後找到的FTP或者HTTP連接粘貼到文本框中。然後點擊 『submit』 按鈕。

數據提交成功之後會顯示如下界面,點擊 『go』 按鈕。

『Jurkat_treat_all』 track就是H3K27ac ChIP-Seq 峰圖結果(如圖15),我們可以選擇自己感興趣的區域,滑動滑鼠進一步放大,也可以在網頁上方的文本框中輸入基因名或者基因組坐標信息,跳轉到相應的區域。

高亮區域就是我們希望放大之後進一步查看的區域。

下圖顯示我們選擇的TNFSF10基因的啟動子區域有一個明顯的H3K27ac peaks,我們可以選擇網頁上方View->DNA,點擊進入下一個界面,得到我們選擇區域DNA的序列信息。

點擊 『get DNA』 查看DNA序列信息。

我們最終得到的DNA序列信息,讀者也可以選擇自己感興趣的基因或者區域,查看對應的DNA序列信息。得到DNA序列信息之後我們就可以按照常規的引物設計流程設計ChIP實驗的引物。

我們推薦大家設計ChIP引物長度18-22nt,擴增產物長度在100-200bp,GC含量在40-60%,Tm值在55-65°C。

這次的分享到這裡就結束了,感謝各位小夥伴的捧場,謝謝大家的支持。後面我們將整理更多的乾貨。敬請期待!!!

提前祝大家勞動節快樂!!!

Happy May Day勞動節快樂[1/5]

ABOUT

Learn more about ABclonal

Hot

相信您需要:

現貨抗體▏抗體定製▏多肽合成▏蛋白表達▏免疫學檢測▏ELISA KIT▏ChIP-seq定製▏生化試劑

目前100000+人已關注加入我們


推薦閱讀:

欣賞芭蕾的「葵花寶典」
同樣是練葵花寶典,林遠圖為什麼沒成為東方不敗那樣的變態?
東方不敗之〔葵花寶典〕
讓你人見人愛的28條葵花寶典
後期調色葵花寶典

TAG:設計 | 乾貨 | 葵花寶典 |