三聯體密碼子是如何被確定的呢?
基因密碼的破譯是六十年代分子生物學最輝煌的成就。先後經歷了五十年代的數學推理階段和1961-1965年的實驗研究階段。1954年,物理學家George Gamov根據在DNA中存在四種氨基酸,在蛋白質中存在二十種氨基酸的對應關係,做出如下數學推理:如果每一個核苷酸為一個氨基酸編碼,只能決定四種氨基酸;如果每二個核苷酸為一個氨基酸編碼,可決定16種氨基酸(42=16)。上述二種情況編碼的氨基酸數小於20種氨基酸,顯然是不可能的。那麼如果三個核苷酸為一個氨基酸編碼的,可編64種氨基酸(43=64);若四個核苷酸編碼一個氨基酸,可編碼256種氨基酸(44=256),以此類推。Gamov認為只有4^3=64這種關係是理想的,因為在有四種核苷酸條件下,64是能滿足於20種氨基酸編碼的最小數。而44=256以上。雖能保證20種氨基酸編碼,但不符合生物體在億萬年進化過程中形成的和遵循的經濟原則,因此認為四個以上核苷酸決定一個氨基酸也是不可能的。1961年,Brenner和Grick根據DNA鏈與蛋白質鏈的共線性(colinearity),首先肯定了三個核苷酸的推理。隨後的實驗研究證明上述假想是正確的。
遺傳密碼的破譯實在太歪蛋白質合成體系建立和核酸人工合成的技術基礎上成長起來的。值得一提的是在i破譯密碼的競賽中,美國的尼倫伯格博士走在前面。主要的方法有兩種:
1.以均聚物和隨機共聚物和特定序列的共聚物為模板指導多肽的合成。1)在體外無細胞蛋白質合成體系中加入人工合成的polyU 開創了破譯遺傳密碼的先河。自1961年發現mRNA後,許多實驗室開始在無細胞蛋白質合成系統中加入mRNA,去研究蛋白質生物合成過程,並表明加入mRNA能刺激無細胞系統中蛋白質合成。1961年,美國NIH的Nirenberg和Mathaei,設想:即然mRNA有刺激無細胞系統中的蛋白質合成作用,加入人工合成的多聚核苷酸亦將會有這種促進作用。按此設想,他們合成了polyU作為模板,以觀察無細胞系統中蛋白質合成速率。因為在反應體系中加入高Mg2+濃度,可有利於IF(起始因子)的作用和fMet-tRNANet的形成,從而保證肽鏈合成的起始不需mRNA的適當信號。當把翻譯產物分離、純化和做序列分析後,結果出乎意料,合成的肽鏈中的氨基酸殘基全部是苯丙氨酸,即polyPhe。於是第一次確認了UUU是Phe的密碼子。這樣,就在一個偶然的機會開創了破譯密碼的工作。隨後,他們又以polyA和polyC為模板,證明了分別可指導合成polyLys和polyPro,即確定了AAA是Lys的密碼子,CCC是pro的密碼子。2)混合共聚物(mixed copolymers)實驗對密碼子中鹼基組成的測定: 1963年,Speyer和Ochoa等發展了用兩個鹼基的共聚物破譯密碼的方法。例如,以A和C原料,合成polyAC。polyAC含有8種不同的密碼子:CCC、CCA、CAA、AAA、AAC、ACC、ACA和CAC。各種密碼子占的比例隨著A和C的不同而不同,例如當A和C的比例等於5:1時,AAA:AAC的比例=5× 5× 5:5× 5× 1=125:25。依次類推。實驗顯示AC共聚物作模板翻譯出的肽鏈由六種氨基酸組成,它們是Asp,His,Thr,Pro,和Lys,其中Pro和Lys的密碼子早先已證明分別是CCC和AAA。根據共聚物成份不同的比例和翻譯產物中氨基酸比例亦不同的關係,Speyer等確定了Asp、Glu和Thr的密碼子含2AlC;His的密碼子含1A2C;Thr的密碼子也可以含1A2C;Pro為3C或1A2C;Lys為3A。但上述方法不能確定A和C的排列方式,而只能顯示密碼子中鹼基組成及組成比例。例如,Asp,Glu和Thr的2A1C可能有三種排列方式,即AAC、ACA、CAA。此外,通過反覆改變共聚物成份比例的方法亦十分麻煩和費時。
3)用重複共聚物(repeating copolymers)破譯密碼:幾乎在上述Nirenberg和Leder工作的同時,Nishimura,Jones,和Khorana等人應用有機化學和酶學技術,製備了已知的核苷酸重複序列。蛋白質在核糖體上的合成可以在這些有規律的共聚物的任一點開始,並把特異的氨基酸參入肽鏈。例如,重複序列CUCUCUCUCU......是多肽Leu-Ser-Leu-Ser......或者是多肽Ser-Leu-Ser......的信使分子.使用共聚物構成三核苷酸為單位的重複順序,如(AAG)n,它可合成三種類型的多肽:polyLys、polyArg和polyGlu,即AAG是Lys的密碼子,AGA是Arg的密碼子,GAA是Glu的密碼子。又如(AUC)n序列是polyIle、polySer和polyHis的模板。2.aa-tRNA與確定的三核苷酸序列結合正當Speyer等人按上述2)方法奮力時,Nirenberg和Leder於1964年建立了破譯密碼的新方法,即tRNA與確定密碼子結合實驗。該方法利用了如下事實:即是在缺乏蛋白質合成所需的因子的條件下,特異氨基酸-tRNA(aa-tRNA)也能與核糖體-mRNA複合物結合。最重要的是這種結合併不一定需要長的mRNA分子,而三核苷酸實際上就可以與核糖體結合。例如,當polyU與核糖體混合時,僅有Phe-tRNA(苯丙氨醯-tRNA)與之結合;相應地Pro-tRNA(脯氨醯-tRNA)特異地與polyC結合。還有GUU可促進Val-tRNA(纈氨醯-tRNA)結合,UUG促進Leu-tRNA(亮氨醯-tRNA)結合等。雖然所有64個三核苷酸(密碼子)都可按設想的序列合成,但並不是全部密碼子均能以這種方法決定因為有一些三核苷酸序列與核糖體結合併不象UUU或GUU等那樣有效,以致不能確定它們是否能為特異的氨基酸編碼。如此至1965年破譯了所有氨基酸的密碼子。
註:答案是從教材上搬過來的。很完整,也沒有做什麼改動。說個有意思的事情, 最初在DNA和RNA以及蛋白質被發現後,四種鹼基如何編碼指導蛋白質合成? 生物科學家做了很多的假設,但是最早提出4^3即三聯子學說的人物理學家George Gamov並不是生物學家,他給寫信給Crick描述了自己的想法,(當時Crick因為DNA雙螺旋結果的提出已經火的一塌糊塗),所以就有了日後的密碼子破譯成功。以至於後來有人評價,密碼子三聯子的學說的提出,由於主人對生命科學的一無所知。至於為什麼他能想到,因為他只覺得這是個數理問題,4^2太少,4^4太多,而此時的生物學家們被更信息傳遞的細枝末節束縛了。畫外音是有時候跳出來思考是很有意義的。扯遠了,不說了。ps:如果樓主是生物專業的,可以查詢一些分子生物學的經典教材。知乎上雖然有很多回答,但是這種基礎的東西還是應該回歸教材和經典文獻。【更新、補充】
【現象】
1、反密碼子中有一種I(次黃嘌呤核苷酸)可以與U、C、A配對,存在於酵母丙氨酸tRNA中。2、tRNA分子進化歷程中,越古老、原始的tRNA,CG含量越高,佔65%以上,隨著生物進化,AU含量才逐漸增加。3、米勒早期生物模型(用無機物和閃電製造有機物)最常產生的氨基酸正是甘氨酸、丙氨酸、天冬氨酸、纈氨酸,也就是GGC、GCC、GAC、GUC。4、第一位鹼基G和第三位鹼基C很可能是用來控制翻譯方向的。
【參考建議】1、克里克擺動假說(wobble hypothesis)19662、M.O.Dayhoff相關文章-----------------原文的分割線-------------從生物進化的角度考慮,RNA並不是從一開始就是三聯子密碼
最開始的生物體很可能是單聯子編碼氨基酸,後來進化為雙聯子,最後進化為三聯子。同時可以利用的氨基酸也隨之增多,最終導致生物多樣性的發生。
你可以注意到,三聯子中三個鹼基所代表的重要性是不同的,有一個鹼基位,經常是即使發生變化,最終對應的氨基酸也未發生變化,這就是所謂一個氨基酸對應多種tRNA對應多種三聯子。
一方面這是保護機制,減少了變異幾率,另一方面也解釋了64種排列組合只能產生22種氨基酸加開始子、終止子的原因。
關於尿嘧啶形成化學機制、同意高票答案,我提供的是生物進化視角。
在上圖中可以發現:密碼子中第三個密碼專一性最弱,第一個密碼子次之(亮氨酸、精氨酸)第二個密碼子專一性最強(除了終止子)關於非三聯子生物:現存接近最原始的生物形式是古細菌,古細菌總是以甲硫氨酸AUG作為開始信號,與現代生物有很大差別。說明轉錄環節也不是一成不變的,每一門類的微生物,核糖體亞基都有顯著差別,說明核糖體也是不斷進化的。就像宇宙開始於奇點一樣,生命開始於最初的那個細胞,最初的細胞雖然低效簡單,但複製自己是一個巨大的跨越。只有DNA、RNA能保存生命的記憶,只有蛋白質適合完成生命動作,只有磷脂能保持適宜的微環境。對於最初的細胞,需要太多偶然編輯於 2016-04-10作者保留權利推薦閱讀:
※生物信息學博士前景如何?
※動物有語言嗎?為什麼人類無法翻譯動物的聲音信息?
※國內做 Bioinformatics 研究的人多嗎?這個方向現在的發展如何?
※生物信息學專業,該怎麼對這些無味的程序提起興趣,變成動力?
※如果有一個人的DNA序列等遺傳信息數據,理論上能否克隆出這個人?需多少MB(兆位元組)的信息量?
TAG:生物信息學 |