Nucleic Acids Research在線發布腫瘤特異性circRNA資料庫

9月28日,Nucleic Acids Research雜誌在線發表了武漢大學何春江教授和UT health Science Center韓冷教授為共同通訊作者的文章,介紹發布一個全新的腫瘤特異性circRNA資料庫:CSCD(cancer-specific circRNA database,網址:gb.whu.edu.cn/CSCD)[1]。

CSCD資料庫從ENCODE中收集了19種腫瘤類型的87種細胞系及141種正常細胞的circRNA數據,構建了該資料庫。總共匯總得到了272152種腫瘤特異性的circRNAs,950962種正常細胞特異的circRNAs,還有170909種為腫瘤和正常樣本共有的。

圖1 CSCD資料庫circRNA信息匯總 (來自[1])

資料庫概覽

CSCD資料庫頁面比較簡潔,可通過sample type、sample name、gene symbol 及circRNA ID等信息進行檢索。還給出了基因界面和circRNA界面的信息。基因界面包含了所對應的基因可變剪切與circRNA的總體情況,能通過頁面直接連接至circRNA界面。circRNA界面則包含了circRNA對應的外顯子,miRNA response elements(MRE),RNA結合蛋白結合位點(RBP)還有預測的開放閱讀框架(ORF)。

圖2 資料庫概覽 (來自[1])

CSCD資料庫共收集了1394023種circRNA分子,其中外顯子來源759039種,內含子來源436668種,基因間序列來源122806種。來自mRNA的1153542種,來lncRNA的42165種。預測到了MRE 76439955個,RNA結合蛋白結合位點103927037個,ORF 3462097個。

圖3 CSCD資料庫匯總circRNA相關信息 (來自[1])

腫瘤特異性circRNA如何分析的?

利用了四種常用的反向拼接演算法:CIRI2、find circ、circRNA finder和Circexplorer。利用CIRI2分析相關的外顯子信息。按照至少一種演算法中至少一個Reads的標準進行篩選分析的。採用了GRCh37基因組注釋,也提供了GRCh37和GRCh38之間切換的注釋。由於本資料庫的收錄條件非常寬鬆,極大提高了circRNA記錄的數量,典型的如CDR1as,在circBase中只收錄了一種序列信息,但CSCD資料庫分析收錄了17種。

CSCD資料庫分析功能介紹

  • 亞細胞定位

相關研究表明circRNA存在特定亞細胞定位。CSCD資料庫系統收錄了相關的信息。腫瘤特異性的circRNA中共有19228種為胞漿定位,2107種為不溶性細胞質組分定位,7020種為膜定位,35734種為染色質定位,37453種為核定位,37141種為核質定位,16976種為核仁定位。

  • 預測MRE

在junction point位點上下游各50bp範圍內分析了相關的miRNA 結合位點。腫瘤特異性circRNAs中共分析了14921788個MRE位點,正常樣本的circRNA中分析了52417822個MRE位點,在共同的circRNA中分析了9100345個MRE位點。

  • 預測RBP

基於STARBASE中37種RNA結合蛋白的CLIP數據,在腫瘤特異性circRNAs中共分析了15719824個RBP位點,正常樣本的circRNA中分析了66182210個RBP位點,在共同的circRNA中分析了22025003個RBP位點。

  • 預測ORF

利用ORF Finder工具分析了相關circRNA的ORF情況,設置ORF條件為大於300nt,共在腫瘤特異性的circRNA中預測到564 047個ORF,在正常樣本的circRNA中預測了2287210個ORF,在共同的circRNA中分析了610840個ORF。

  • 相關基因可變剪切分析

相關的RNA-seq數據中利用STAR進行了分析比對,利用rMATS分析了環狀RNA相關線性基因中存在的各種可變剪切方式。

CSCD還提供了到UCSC瀏覽器及circBase的鏈接,並且給出了每個樣本和每個演算法中預測得到的junction reads數以及相應的均一化表達量SRPTM,可以方便地進行不同樣本的環狀RNA丰度比較。CSCD資料庫較詳細的匯總了目前腫瘤相關circRNA的研究數據,為相關同行提供了非常有價值的工具,助力circRNA研究。

致謝:本文撰寫過程中得到了何春江老師的大力支持,給出了很多寶貴的修改意見,在此表示衷心的感謝!

參考文獻: 1. Siyu Xia, J.F., Ke Chen, Yanbing Ma, Jing Gong, Fangfang Cai, Yuxuan Jin, Yang Gao, Linjian Xia, Hong Chang, Lei Wei, Leng Han and Chunjiang He, CSCD: a database for cancer-specific circular RNAs. Nucleic Acids Research, 2017.

來源:吉賽生物

原文:Nucleic Acids Research在線發布腫瘤特異性circRNA資料庫


推薦閱讀:

用經營青樓的思想來做你的科研
科研方法論——技術流派 or 人脈流派?
circRNA與蛋白相互作用進展綜述

TAG:RNA | 分子生物學 | 中國科研 |