首發丨腫瘤數據挖掘還在用TCGA?這個資料庫你絕對沒聽過!2

首發丨腫瘤數據挖掘還在用TCGA?這個資料庫你絕對沒聽過!2

來自專欄小蘆聊科研1 人贊了文章

上期初步介紹了TARGET資料庫,今天繼續。

沒看過上期的小夥伴,直接戳下面鏈接就可以進。

首發丨腫瘤數據挖掘還在用TCGA?這個資料庫你絕對沒聽過!(一)

TARGET為選定的兒科癌症生成了大規模基因組數據,並提供了訪問許可權,其目的在於發現兒童癌症的治療靶點,並將這些發現轉化為臨床應用

下面我們就來簡單介紹一下TARGET資料庫的數據類型,下載方法等。

數據類型

Genome-Scale Characterization

通過晶元以及測序的檢測得到癌症以及癌旁的數據,從而分析其基因結構和表達的變異。不同類型的數據可以單獨分析,也可以多組學分析來構建更為全面的基因組圖譜。

Sequencing

使用第二代和第三代測序技術,對癌症和配對癌旁樣本進行測序,分析兒童癌症中 mutations, gene fusions以及其它的一些變異。此外,在ALL和NBL項目中使用了靶向測序。

Open vs Controlled Access

由於TARGET對於患者的隱私有嚴格的保護,因此,數據分為兩類: open or controlled access。這兩種數據都可通過 TARGET Data MatrixOpens來訪問。

Open Access Data

這種類型的數據是經過驗證和解析的數據,無法識別單個患者,但此類數據可以用於分析。研究者可以通過點擊TARGET Data MatrixOpens中任何標有「Open」的鏈接來訪問這些數據。

Controlled Access Data

這類數據包含特定的患者/腫瘤信息以及原始數據,此類數據可用於進行複雜的生物信息學分析。但此類數據只有獲得DUC才能進行訪問和下載。

下載介紹

The Data Matrix (ocg.cancer.gov/programs)可以鏈接到TARGET的open and controlled access 數據。用戶可以通過點擊相應的文本鏈接來獲取特定的數據。下載示例如下:

最新相關文章

利用此資料庫發表的最新文章:

  1. Transcription factor activating protein 4 is synthetically lethal and a master regulator of MYCN-amplified neuroblastoma.(June 07, 2018)
  2. Cross-Cohort Analysis Identifies a TEAD4–MYCN Positive Feedback Loop as the Core Regulatory Element of High-Risk Neuroblastoma(March 06, 2018
  3. Pan-cancer genome and transcriptome analyses of 1,699 paediatric leukaemias and solid tumours(February 28, 2018)

相信大家對TARGET資料庫已經有了一定的了解,也一定有一些疑問!

歡迎在下方留言交流。

明信社系列

Cell文獻解讀丨同是研究三陰乳腺癌,為何偏偏它有28分?

Nature子刊文獻解讀丨少做實驗,還能發高分文章的新思路!你來不來?

Nature子刊文獻解讀丨外顯子測序不白做,如何解讀數據是關鍵!


推薦閱讀:

Python數據科學:全棧技術詳解1-個人貸款違約預測模型
數據挖掘哪家強?Excel回歸分析篇
主成分分析(PCA)原理詳解

TAG:科技 | 數據挖掘 | 資料庫 |