RNA轉錄

RNA轉錄

來自專欄 Zzpython5 人贊了文章

第二類核酸

在「DNA核苷酸含量」中,我們描述了核酸作為核苷酸單元聚合物的一級結構,並且我們提到廣泛存在的DNA由四個鹼基的不同序列組成。

然而除了DNA外,染色質還有一種核酸和DNA一起存在;這種核酸具有不同的糖,稱為核糖(ribose),後來被稱為核糖核酸RNA。RNA與DNA的不同之處在於它含有稱為尿嘧啶(uracil)的鹼基代替胸腺嘧啶; DNA和RNA之間的結構差異如圖1所示。生物學家最初認為RNA僅包含在植物細胞中,而DNA僅限於動物細胞。然而,隨著新的化學方法的提出,在地球上所有生命形式的細胞中發現了兩種核酸,這一假設消失了。

圖1. RNA和DNA之間的結構差異

DNA和RNA的主要結構是如此相似,因為前者是創建信使RNA(mRNA)這種特殊RNA分子的藍圖。mRNA在RNA轉錄期間產生,在此期間,DNA的用作構建RNA鏈的模板,通過一次複製一個核苷酸,其中使用尿嘧啶代替胸腺嘧啶。

在真核生物中,DNA主要存在於細胞核中,而RNA可以存在於細胞任意位置以執行DNA的命令。在以後的問題中,我們將更詳細地研究RNA轉錄的過程和分枝。

RNA轉錄

RNA轉錄定義了DNA轉化為RNA的過程。在真核生物中,RNA轉錄發生在細胞核中。如圖2所示,RNA聚合酶(RNAP)通過遍歷DNA的一條鏈(在3-5方向)促進轉錄,這裡的DNA稱為模板鏈。在每個連續的鹼基處,RNAP將互補鹼基添加到RNA的合成鏈中,其中尿嘧啶取代胸腺嘧啶。因為產生的RNA鏈(稱為前mRNA)是在互補性上構建的,所以它與相反的DNA鏈相同(除了用尿嘧啶替代胸腺嘧啶)。因此,第二條DNA鏈稱為編碼鏈,因為即使在轉錄過程中不使用它,編碼鏈也與前mRNA鏈相同,除了用尿嘧啶取代胸腺嘧啶。

圖2. RNA轉錄過程

問題

通過以上介紹我們知道了RNA串是由包含A,C,G和U的字母組成的字元串。

給定對應於編碼鏈的DNA串t,其轉錄的RNA串u通過用u中的U替換t中所有出現的T而形成。

Given: 一段DNA序列t

Return: t轉錄後的RNA序列

樣本數據

GATGGAACTTGACTACGTAAATT

樣本輸出

GAUGGAACUUGACUACGUAAAUU

分析

這個問題很簡單:只需讀取字元串然後將T替換成U即可。在這裡我提供兩種方法來解決這個問題。

python

我們可以使用python的一個內置函數str.replace()來解決,查看該函數的文檔我們可以得到:

replace(...) S.replace(old, new[, count]) -> str

因此我們定義一個函數:

def transcribing_RNA(string): return string.replace("T", "U")

In [1]:

print(transcribing_RNA("GATGGAACTTGACTACGTAAATT"))

Out[1]:

GAUGGAACUUGACUACGUAAAUU

bash

我們可以直接在bash中解決上面這個問題。我們使用tr這個命令,在bash下查看這個命令的文檔我們可以得到:

NAME tr - translate or delete charactersSYNOPSIS tr [OPTION]... SET1 [SET2]DESCRIPTION Translate, squeeze, and/or delete characters from standard input, writing to standard output.

根據文檔描述,這個命令的功能是翻譯字元,也就是說可以根據單個字元或字符集進行替換。

In [1]:

tr T U < sample_dna_seq.txt

Out[1]:

GAUGGAACUUGACUACGUAAAUU

我們可以得到和python處理後一樣的結果。

最後歡迎關注我的微信公眾號:薛定諤的雜貨鋪,裡面有更多更好玩的內容!

weixin.qq.com/r/4C82Lon (二維碼自動識別)


推薦閱讀:

分子生物學辭彙(Q-R)
乙烯信號簡史 | 乙烯信號開山之作:受體ETR1的鑒定
CRISPR-Cas9應用——基因敲除與敲入系統
孟浩巍 高通量測序技術專欄

TAG:生物學 | RNA | 分子生物學 |