miRNA靶基因預測軟體和miRNA靶點database的區別是什麼?

database又是怎麼預測的?


miRNA由前體發育為成熟體是由Dicer酶切完成的,酶切位點的特異性使得miRNA成熟體序

列首位鹼基對於鹼基U具有很強的偏向性,另外其他位點也有一定偏向性,如:2~4號位一

般缺少U,第10號位偏向於A(第10號位一般是miRNA對其靶基因發生剪切作用時的剪切位

點)。另外酶切位點以及其他一些因素影響下最終的miRNA成熟體序列在兩端一般會有不同

程度的鹼基增添或者缺失,這種現象在3`端比較普遍些,因此在計算miRNA表達的策略上

這些因素都做了考慮。

miRNA鑒定的整體思路是依靠與本物種mirbase資料庫比對的結果來

進行分析的,綜合前體和成熟體兩方面比對情況得到該物種miRNA的表達情況。具體條件如

下:1、序列能夠完全比對到前體序列(無錯配);2、在條件1的基礎上序列與成熟體比對

允許錯位,但至少存在16個鹼基的覆蓋,覆蓋部分無錯配。滿足這兩個條件的序列的表達

量之和算作該miRNA的表達量,針對這部分序列會對其首位鹼基偏向性做出統計。

miRNA表達譜的構建分兩種情況:一種情況是miRbase中已經收錄該物種miRNA信息;

另一種情況是miRbase中沒有收錄該物種信息或者有收錄但是收錄條目較少(一般認為少於

50條)。

(1)若miRBase18.0中有該物種miRNA信息

這種情況下我們將根據上述統計信息中描述的方法,即將sRNA與miRBase18.0中該物種已

知的miRNA前體/miRNA成熟序列進行比對,結果將顯示匹配上的小RNA的詳細情況,包括

相應的已知miRNA的結構、樣品小RNA的長度及出現次數等信息,每個miRNA的表達量按照

比對情況根據至少16ntoverlap的原則進行加和計算得出。

(2)若miRBase18.0中無該物種miRNA信息

對於這種情況我們在整體策略選擇上側重於已知資料庫比對和miRNA序列的保守性,具體方

案如下:1、首先將cleandata與miRBase18.0中某一特定範圍(動物、植物)的miRNA成熟

序列進行比對,考慮到物種間的差異,比對中會允許兩個錯配以及若干個gap;2、對於上

述比對結果中出現的所有miRNA家族,取出屬於不同物種同一家族中表達量最高的一條作為

該物種可能的miRNA資料庫;3、將cleandata與構建的這個miRNA資料庫進行比對以構建

鑒定的已知的miRNA表達譜,表達量計算方法是將與構建的該物種臨時miRNA資料庫中的序

列比對時,滿足2nt內錯配的序列的表達量加和作為最終該miRNA的表達量。4、對於第2

步中鑒定得到的miRNA進行前體預測,若比對出的miRNA無法在該物種基因組上定位或者能

夠定位但無法形成頸環結構,則確定該序列不是miRNA,通過這樣的驗證以獲得高可靠性的

數據結果。

不知道LZ是否能明白?不明白私信我。

PS:我是做這個過來的


database是從文獻里搜集出來

預測軟體是通過熱力學、互補配對等手段猜出來的

瀉藥!


推薦閱讀:

Nucleic Acids Research在線發布腫瘤特異性circRNA資料庫
circRNA研究報道匯總20171116上
與腫瘤相關的熱門circRNA分子匯總
Developmental Cell∣中科院劉宏濤研究組揭示了UV-B與BR信號途徑協同調控植物下胚軸伸長的新機制
一文參透:lncRNA研究思路、模式和資料庫應用...

TAG:基因 | 分子生物學 | miRNA |