如何快速掌握TCGA資料庫?

如何快速掌握TCGA資料庫?生物信息入門,怎樣能自學R,掌握TCGA資料庫?


題主說想要快速,我就不說讓你看英文文獻、官網教程之類的方法了。說兩個快速易上手的:

  1. 參加培訓班——最快速的方法。有些生物信息公司會針對高校教師和醫師開生信培訓班,我導師帶著我上過幾次,有TCGA、Oncomine和R的。缺點是價格貴,一次一天兩三千,優點是上手快,而且會有後續服務,比如課上完後你在qq群里提問,一般公司技術人員都會給你解決。我放幾張上完培訓班後發的資料,是課上PPT轉的PDF。

2、另外再推薦一本中文教材,可以做補充用。優點是淺顯易懂,缺點是不夠深入且作者態度傲嬌,但書還可以,《R語言與Bioconductor-生物信息學應用》,天津出版。

覺得有幫助求點贊~不要光收藏不點贊啊喂你們這些壞人!


1. Ctrl-W
2. Ctrl-T
3. 地址欄輸入:http://tcga-data.nci.nih.gov/tcga/
4. 滑鼠移動至黑色導航條上第四項:About the Data 左鍵單擊
5. 滑鼠移動至第六項:User Guides and Help 左鍵單擊
6. Be patient....


一般性的要求,用UCSC的Cancer Browser就好了。TCGA上的數據,自己處理起來還是比較麻煩的。


------------2016.12.23
看到題主提到了自學R,那不得不祭出R語言神書!
現在已經出到第二版了呢!(請忽略圖上的水印,用這個圖不算侵權吧...)

------------2015.7.24
提到的cell文章是這篇
Multiplatform analysis of 12 cancer types reveals molecular classification within and across tissues of origin.

Hoadley KA, et al. Cell. 2014.

TCGA pan cancer 研究的nature文章見Nature TCGA | TCGA Pan-Cancer Analysis
初次接觸可以先看一下這一篇介紹性文章The Cancer Genome Atlas Pan-Cancer analysis project.
Cancer Genome Atlas Research Network, Nat Genet. 2013.

------------long long ago

讀tcga工作組發的文章,直接讀發在cell上的一篇泛癌症的文章,正文?附件,能復現文章中的結果,就行了。


tcga和dbgap類似,genotype的東西你基本拿不到,其他的官網介紹的很詳細,還配有文獻,自己鑽研吧,生信入門看這上面文獻Oxford Journals


給你一個中文的東西,你可以參考一下。http://210.46.85.180:8080/training/files/2013training-06-1.pdf


推薦一個公眾號,可以看下:數據挖掘專題 | TCGA數據挖掘如何入門?


推薦一個新版TCGA的下載工具,http://www.shengxin.ren/article/27
TCGA改版之後數據下載很不方便,這個非常適合入門級的人使用


看你需要做什麼樣子的分析了,一些簡單直觀的分析,主要包括點突變(mutation),擴增(amplificaiton)和缺失(deletion),都可以在http://www.cbioportal.org/ 上面完成的。


推薦閱讀:

與生物有關的交叉學科有哪些,他們的發展情況如何?
如何自學生物信息學?

TAG:生物學 | 生物信息學 | 醫學 | 腫瘤細胞 |