給定DNA單鏈的序列,能夠計算出N條DNA序列互補配對後形成結構的形狀嗎?

【傅渥成的回答(21票)】:

在「結構預測」的問題上,大家常常談 RNA 結構預測、 蛋白質結構預測,但是一般不談相應的 DNA 問題,因為相應的 DNA 結構總是比較穩定,預測起來難度反而更低,原因包括:

  • 先討論兩條完全互補配對的鏈的情況,摺紙情況下形成了雙螺旋,用計算機來預測結構這個問題反而特別簡單,因為說起來就是 A,B,Z 等等幾種最基本的空間結構,加上因為一些特異性帶來的細小區別,這樣的東西用程序做起來並不困難,跟蛋白質結構預測相比簡單太多,例如 RNA 結構的預測問題,因為沒有一條互補鏈,因此在預測結構時,除了考慮結構上形態可能存在螺旋,更大的難度是可能存在的很多 loop ;
  • 如果不是考慮形成雙螺旋的情況,而是考慮「怎樣的配對能量最低」這樣的二級結構預測問題,DNA 只需考慮 A-T 和 C-G 這兩種 Watson-Crick 配對,無論如何,問題並不比 RNA 困難,困難一點的反而是 RNA 的結構,,還可能有 G-U 這樣的非正規配對,增大了搜索空間。
  • 總的來看,在結構預測這個問題上,DNA會比較簡單,而且預測的準確性會比較高,因為這個預測中「能量最低」就是關鍵,不太會存在「多態性」,結構性質比較穩定,在天然的有生物功能的 DNA 鏈中幾乎不存在特殊的拓撲結構。也正因為 DNA 問題相對簡單,結構比較穩定,大家就會想著來用 DNA 做出更有意思的東西來。

    因此題主設想的「N 條DNA鏈」這樣問題也就出現了,只是儘管最終形成的結構裡面還是存在配對,但是並不是總是要通過設計一條與原來的鏈互補的鏈來做,而是可能需要許多條鏈、許多條雙螺旋、許多無法配對的「斷開」的位置來進行組合(從而設計出結構中的一些基本元件,如 DX 結構、TX 結構、十字結構等等)。

    這方面的工作有研究者一直在做,而且已經形成了一個獨立的分支領域——DNA origami (DNA納米技術,DNA 摺紙術)。除了 Wiki 的介紹和提供的參考文獻,還有許多這樣的新聞,例如 DNA的摺紙藝術(圖) , DNA origami: The shape of things to come, Protein gets in on DNA"s origami act : Nature News & Comment 等等 。這一領域曾經在 2006 年作為 Nature 的封面故事(Folding DNA to create nanoscale shapes and patterns : Nature),去年(2012 年底)和今年在 Science 上也發表了不少這樣的文章。這一領域有許多獨特的激動人心的新發展,而且因為 DNA 結構比較穩定,理論和預測可以符合得較好。DNA 性質穩定,如果把序列設計清楚,甚至可以用來搭建像樂高玩具一樣的基本元件,最終可以用來搭建 nm ~ μm 尺度的各類 3D 結構(下圖引自參考文獻 2),甚至這也可以作為 3D 列印的一種思路。

    這些結構的設計也都是通過計算機來實現的,例如 MIT 的 CanDo - Computer-aided engineering for DNA origami 就可以幫助大家來自己設計相應的 DNA 摺紙。但是從理論上來說,如果任意給定 N 條 DNA 序列,而不是經過精心設計的 DNA 序列,很可能就會像其他回答者提到的那樣,可能只能通過例如啟發式搜索等方法近似地得到一系列能量較低的備選結構,而不能得到「某一個」能量最低的結構;至於「模擬」,當然是可以做的,但是也還是需要考慮一定的代價問題,大家之所以總是希望在這樣的計算中避免模擬(分子動力學、甚至 Monte Carlo),就是因為多條鏈意味著多原子,計算量大,何況一旦陷入到一個局域能量極小,在模擬中可能很難再擺脫這樣的極小。大家最終希望的還是可以高效地用統計學習等方法就得到出現一定結構的概率,因此會希望需要設計的序列可以有一個比其他結構能量低得多的全局極小,這也是為什麼很少有直接來做這個問題的一個原因。

    最早的一篇提出 DNA 摺紙術概念的文章:

    1. Paul W. K. Rothemun, Folding DNA to create nanoscale shapes and patterns, Nature, 440, 297-302 (16 March 2006) , doi:10.1038/nature04586

    DNA 樂高玩具設計的參考文獻,這兩篇文章新一點:

    2. Kurt V. Gothelf, LEGO-like DNA Structures, Science 30 November 2012: Vol. 338 no. 6111 pp. 1159-1160 DOI: 10.1126/science.1229960

    3. Yonggang Ke, Luvena L. Ong, William M. Shih, Peng Yin, Three-Dimensional Structures Self-Assembled from DNA Bricks,Science 30 November 2012: Vol. 338 no. 6111 pp. 1177-1183, DOI: 10.1126/science.1227268

    軟體 CanDo 的參考文獻和新聞:

    4. Carlos Ernesto Castro, Fabian Kilchherr, Do-Nyun Kim, Enrique Lin Shiao, Tobias Wauer, Philipp Wortmann, Mark Bathe & Hendrik Dietz, Nature Methods, 8, 221–229, (2011), doi:10.1038/nmeth.1570

    MIT software could bring "DNA origami" to the masses

    Origami: Not just for paper anymore

    當然,問題也可以變得很複雜。如果把問題裡面相對比較狹義的「配對」要求放開,則問題可以變得更困難些,也更有意思,例如考慮 DNA 中可能存在的一些特殊結構,如 在段立中可能存在的 G-四聯體(G-quadruplex)結構和在 RNA 結構中廣泛存在,而在某些人工設計的 DNA 結構中同樣可能存在的贗結(Pseudoknot)等。兩種結構分別如下圖所示(分別轉自維基頁面),這樣的結構預測也是大家現在所關心的問題。只是當把這樣的特殊的、序列上距離很遠的「接觸」考慮進去,整個問題的複雜性就會大大增加(如果考慮 pseudoknots,則最低能量的預測就會是 NP-complete 的問題)。

    【彭龍濤的回答(0票)】:

    可以的,但是存在一定的困難性。對於較短的序列可以使用一定的演算法找出幾個候選的形狀和結構,對於序列特徵明顯的可能也可以快速做出預測,但是對於序列較長且複雜的則很難,猜想這應該是一個np難的搜索問題,可以使用啟發式方法來幫助解決,但是對於最後的結論也並不一定能100%讓人信服,還需要通過生物實驗來驗證。

    【譚大毛的回答(0票)】:

    謝邀

    既然蛋白質可以通過氨基酸序列來模擬計算三級結構(I-TASSER server for protein structure and function prediction)

    那DNA應該也是沒有問題的

    現在有沒有人在做我就不知道了

    搜到一個做RNA三級結構的

    Automated and fast building of three-dimensional RNA structures : Scientific Reports : Nature Publishing Group

    原文地址:知乎


    推薦閱讀:

    面相四季氣色形狀吉凶
    面相學:非富即貴的幾種口的形狀
    手指之指甲的形狀
    餐廳風水之餐桌形狀為您大揭秘
    標準的龍眉形狀圖解 如何辨別龍眉

    TAG:計算 | 形狀 | 形成 |