為什麼從蛋白質的一級結構準確預測其三維結構那麼難?

因為熱力學第二定律,氫鍵,疏水作用這些因素太難用相應的演算法加以刻畫嗎?

還是說順序執行的演算法在速度上和物理作用力的自然演繹根本沒法比?

總的來說計算機預測蛋白結構這件事現在的瓶頸在哪裡?從理論上說某一天有完美實現的可能嗎?

有興趣的朋友也可以談談計算理論中一些演算法的不可壓縮性,以及大部分人可能意識不到的運算量巨大的程度,以及在初始條件的精確化和簡約化之間的取捨帶來的影響,甚至比較科幻的傳說中的計算主義世界觀。

另外我感覺通過海量已知蛋白結晶晶體結構來進行機器學習是一種比較沒有追求的做法,不知大家是否有不同意見。


難,真的很難。一句話來講,準確性和效率這一對矛盾幾乎永遠無解。以下不求嚴謹,但求過癮。

先扯句跑題的,要說準確的蛋白質三維結構,別說預測了,我們現在連觀測都很難做到準確啊,我們現在普遍作為參考的「準確的」蛋白質結構,不管是X射線衍射還是核磁共振,用的可都是蛋白質晶體啊,摸著良心說,晶體的結構真的是準確的蛋白質結構嗎?從某種角度說,我們現在根本連確定準確的參考標準的邊都還沒摸到,就別提準確預測了。。。。

但是,木辦法,我們還是想做,拋開木有參考標準不談,我們還是想來預測預測看,好,我們來看看預測有多難。

首先,題主你問說,因為熱力學第二定律,氫鍵,疏水作用這些因素太難用相應的演算法加以刻畫嗎?這個嘛,這些因素按照現有的理論,其實已經相對容易的可以用演算法加以刻畫了,但是,這些理論難道就夠了嗎?拿衣服啊。。。簡單說,這些理論本身就是對客觀世界描述的一些經過檢驗的假設,其中有太多的估算和例外因素導致這些理論本身木有那麼準確,再來把這些誤差疊加以後,這個簡直可就沒邊了啊。。。。

看起來,題主更傾向於的是用「物理」的方法來模擬蛋白質三維結構吧,其實我也覺得這樣吼啊,符合直覺,符合邏輯,make sense,但是,拿衣服啊。。。從實際應用的角度來說,大概分兩種方式吧,一個是靜態的蛋白質結構搜索,另一個就是分子動力學模擬。MD這個東西我比較熟悉,放在後邊講,先說說我所了解的靜態的蛋白質結構搜索吧。

前邊有好些回答也提到了,蛋白質結構這個東西它的可能性太多太多太多了啊。。。不僅是氨基酸與氨基酸之間的肽鍵,每一個氨基酸內的backbone,甚至每一個氨基酸的sidechain,這裡邊幾乎所有的鍵,都他媽可以旋轉啊,一個蛋白質,少說有幾百個鍵吧,每一個鍵,我們說少一點,平均就算有兩個可能的二面角吧,排列組合一下這就多少可能性了,我是懶得去算了,反正肯定是天文數字了,要在這天文數字一般的可能的結構當中找到一個全局最優,當然難啦!靜態的搜索演算法怎麼來解決這個問題呢,大概就是首先忽略一些可以暫時忽略的自由度,給每一個sidechain確定一些可能的conformation,計算不同conformation的勢能,然後搜索的時候嘛大概就是採取不同的演算法,一般都是採取heuristic的方法,不追求遍歷,而是在已知的條件下找到一個儘可能優化的解。當然,這種方法的問題也很多啦,比如靜態搜索本身就是個比較大的問題,再加上計算當中的各種估算和誤差,要做到準確,真的很難。

接下來是分子動力學的方法,MD本身是經典力學確定論的一個方法,加上能夠模擬原子之間的相互作用以及運動,看起來很靠譜有木有,可是實際使用當中也有相當多的問題。

首先從邏輯上講,原子間所產生的相互作用,都是在量子層面上發生的,那麼在量子層面上發生的事件,你用原子層面的模型來模擬,合理嗎?當然不合理啊,可是,木辦法啊。。。QM真的跑不動啊。。。木辦法,我們就是想知道,所以,木辦法也要強上,好吧,於是用各種物理理論來模擬唄,我們從最最最基本的說起,原子,原子是啥,粗疏的說,質子和電子吧,可是,模擬的時候原子咋處理,就他媽是個固定半徑的球啊!原子已經哭暈在廁所了。。。。摸著良心說,兩個原子靠近的時候你就用兩個帶有一些參數的硬球來模擬,你相信這東西能准么!你別說,雖然有誤差,其實大概還算準啦。。。再來,范德華力和靜電力。范德華力怎麼算,來看的估計都知道吧,我就懶得打公式了,公式裡邊有常數吧,常數真的是恆常不變嗎?我又要講了,拿衣服啊。。。但是,真的以為對於每一個原子對的每一幀,我們都會拿公式算一遍么,那得算到哪年去啊,要效率!效率怎麼來,常數表,反正QM我們多少能算一些,算完之後在誤差範圍之內就把平均值定為常數好了,但是,還是估計值,當然有誤差。。。說完范德華力,還有靜電力,靜電力公式我也懶得打了,麻麻呀,裡面怎麼也有那麼多常數啊,照方抓藥,估算常數,我們的好朋友誤差又出現了。。。可是別急,靜電力計算當中最重要的是啥?每個原子的局部電荷啊!局部電荷是固定不變的嗎?當然不是啊!要每一幀算一遍局部電荷,這個模擬還跑得完么?當然跑不完啊!別說每一幀算一遍了,就算只算一遍局部電荷,你想用QM算蛋白質,玩兒去。。。所以咋辦,估算唄,先弄一個電荷模型來模擬QM的結果,然後給整個蛋白質算一遍局部電荷,算完之後就指著這一套局部電荷跑模擬去吧,反正差也差不了多少,但是,誤差嘛總歸還是有的。。。這兩個作用力可以算是基本中的基本了吧,各家分子動力學軟體的力場各不相同,但是萬變不離其宗,這些都有那麼多誤差,再高科技的方法我也就不說了,說多了都是淚,反正都是估算唄。。。

還有一樣東西因為非常重要,不得不提一下,水分子。水分子為啥重要?因為你所有的蛋白質摺疊也好,反應也好,不能在真空里進行啊!所以光是水分子模擬這個玩意兒就差不多幾代科學家了吧,到現在有各種模型,可以算是相當準確了,但是還是逃不過估算和誤差。可是別急,更蛋疼的是還沒來呢,我們來想一想你要模擬一個蛋白質的摺疊,計算的時候你得把這個蛋白質放在一個足夠大的裝滿水的容器里吧,不然一會兒動著動著碰到邊了算怎麼回事呢,趕上水分子又小排得又緊,你要給這個容器裝滿水,可是要塞滿一個盒子可是要好多水分子的啊,初始模型加上水啊各種的一起一看,尼瑪這個盒子里幾萬幾十萬個原子都是水啊,真正那個蛋白質也就幾千個原子啊,可是沒轍啊,溶劑你當然也得一起模擬啊,你說你哭不哭暈在廁所。。。於是又該想轍了,咋辦呢,湊合湊合還是估算吧,於是弄出來一個implicit water model,簡單說就是能夠大概估計一個分子的solvation energy,但是具體氫鍵神馬的,全沒有!後來說這也不行啊,於是又想了個轍,里蛋白質分子近的地方,我們用單獨的水分子模型模擬,遠的我們還是就用implicit model得了吧。。。不管怎麼樣,這裡面還是有大量的估算,大量的誤差空間。

以上那麼多,只是為了說明一個問題,為了追求效率我們犧牲了多少準確性。那麼顯而易見的問題又來了,我們為什麼如此追求效率呢,是不是顯得太急功近利了呢?當然不是啊!!!都是被逼的啊!!!之前也講了,因為蛋白質分子內的自由度太多,導致搜索空間是一個天文數字,所以當然要效率啦。

我猜聰明的題主這個時候一定會問啦,我們既然說的是用物理學的力量來模擬分子的運動,在各種分子間作用力的作用下,它們一定是朝著勢能更低的方向運動,舉這樣conformational search space之大來證明找到準確結構之難其實是答非所問的,這樣的說法對也不多。確實這兩者不完全是一個事,但是結構可能性之多間接地導致另一個問題,摺疊的時間尺度問題。簡單說,現在所有分子動力模擬軟體的模擬能力依然是非常有限的,我們以一個或者兩個飛秒為一幀,使用all-atom和explicit water model模擬一個一兩百個氨基酸的蛋白質,不管是超算還是GPU,一天的時間差不多能跑個100 ns應該就算是很不錯了,因為在並行運算時候的scaling還是受軟體本身演算法的限制,計算能力第一不是按CPU數量增加線性增加,第二在達到一定CPU數量以後,計算能力無法繼續增長。問題是,實驗條件下,一個蛋白質的摺疊是在多大數量級的時間單位內發生的?微秒,還是毫秒,甚至是秒?現在的計算條件下,通過使用implicit water model,simulated annealing,umbrella sampling等等各種加速模擬的方法(沒錯,每一種都會帶來誤差),計算機差不多能夠模擬到微秒級別的反應,或者運氣好的話,摺疊,但是你想使用微秒級別的模型來模擬一些毫秒級別的反應和摺疊,顯然是不可能的吧。。。。。。

以上,差不多就是我所了解的,為什麼使用物理的方法模擬和預測蛋白質三維結構那麼難,但是有限的成功的案例還是有的,選取以下一些特性的蛋白質,比如結構非常穩定,摺疊發生的非常快,小,這樣還是完全有可能通過分子動力學模擬來預測三維結構的,當然,如果真的成功也是非常值得喜大普奔的。

再來簡單說下「通過海量已知蛋白結晶晶體結構來進行機器學習」這種題主人沒什麼追求的做法吧。這種做法沒追求么?其實我是同意的,物理的方法當然吼啊,符合直覺,符合邏輯,make sense,但是,拿衣服啊。。。怎麼說呢,自然科學,如果能用數學方法解釋,當然好,但是,作為一種自然規律,歸根結底是通過總結得出的,所以對於自然的觀察和總結,到現在依然是非常非常重要的。假設說一種觀測到的自然現象,通過現有的自然科學理論無法解釋,在排除觀測誤差的前提下,能說是自然現象出錯了嗎?不能吧,很可能觀測到的這個現象就是指導自然科學前進的方向。蛋白質結構也是一樣,海量的蛋白質結晶晶體結構本身給我們的就是一個非常好的參考數據,告訴我們什麼是真實存在的(當然不排除結晶對於蛋白質結構產生的影響),因此我依然認為及其學習的方法對於預測蛋白質結構是個好方法。畢竟,比方說一段氨基酸序列,如果找到有幾十幾百個相同或者高度相似的序列,他們的結構都是alpha螺旋,你說這一段也是alpha螺旋,我覺得是非常合理的。以及,在實際使用當中,homology modeling相比從蛋白質序列模擬出的結構來說,我一定更相信前者的結果。

但是,不得不說的是,任何一個蛋白質結構的預測,都幾乎不可能是由某一種方法獨立完成的,更現實的過程往往是先建立一個或者幾個homology model,或者通過靜態搜索找到一個或者幾個大概的的三維模型,然後以這些模型為起點再來跑一些MD計算,做一些局部的優化,最終得到相對準確的模型。以我們現在(相對來說)極其有限的計算能力,我們已經有了對於蛋白質三維結構預測的一些相對準確的結構,而這些事實上不那麼準確的結果,事實上已經幫助我們大大提高了對於許多蛋白質結構的認識,所以,前途是光明的,道路是曲折的,我個人還是相信計算化學在研究當中會有越來越重要的作用的。


我覺得可能是蛋白的可行的摺疊方式太多了,你沒法確定哪一個是in vivo狀態下的真實結構。蛋白在摺疊時有的是需要chaperone的。而且生理條件下,很多蛋白都不是單獨發揮功能而是需要與其它蛋白髮生相互作用的,而這些相互作用對蛋白的不穩定構象是有幫助的,如果這些蛋白髮揮生理功能的形態正好是這些不穩定的構象的話,結構預測也不能對功能的理解提供幫助。這時還是需要實驗解析這些複合物的結構。

隨著冷凍電鏡技術(cryo-EM)的提高,其解析的結構解析度越來越高,結構解析越來越容易,結構預測對於實際應用可能就沒那麼重要了。不過理論上這是結構生物學的一個永恆的課題。


謝邀!現代常用預測的方法一般分為兩種:1、通過實驗的方法預測蛋白質結構,即對蛋白質晶體使用X射線衍射或核磁共振,得到晶體電子密度等方面的信息,從而分析蛋白質結構。這是結構生物學的方法。該方法結果準確可信,但是工作量大,難度也比較高。例如要結晶得到純度高的蛋白質晶體有時候是很困難的,各種條件要慢慢摸索,往往要靠運氣。

2、用計算機程序,根據已有的蛋白質序列只是推測未知蛋白的結構。因為蛋白質序列有保守性,而且一定的序列其摺疊方式是有規律的。這樣的方法依靠好的演算法,推測結構速度比較快,但是精確性比較差。

對於實驗室中,一般採用第一種方法,首先是因為蛋白質空間結構是一種要求極為精確的構象,一個氨基酸小分子的位置漂移就會導致蛋白質性質的改變,所以,對於計算機預測結構的方法在結構生物學中一般是不認可的,僅僅作為參考資料使用(但是測序是計算生物法)。其次,蛋白質是由小分子氨基酸構成的,那麼就會出現空間結構受到各種因素的影響:氨基酸之間的空間位阻,氨基酸之間的鍵合力,二硫鍵等次級鍵的作用等內部因素,以及實驗條件比如溫度壓強酸鹼度等外界實驗環境因素。這樣來看,用計算機來預測科學性是比較低的,具體還是應該去結晶,得到結果後,用過計算機手段去查看,而不是預測,這是最準確的。

而另一方面,我們常常做到的是用已知的氨基酸序列,來構建結構,即我們先去構想一個我們設計的蛋白質空間結構,然後再去嘗試結晶,然後通過衍射,核磁來判斷物理信息,用生物化學方法得出生化性質,包括共性和特性。

所以,準確做到預測是很難的一件事情,哪怕是用第一種方法,所以一般我們都會開玩笑的說,這是看人品的~

個人水平有限,作答有不滿意的地方請諒解,如果還有其他疑問,我儘力作答。


題主可以把這個任務抽象一下,即對於一根長繩來講如何預測他摺疊的最低能量態?

如果題主覺著他很簡單的話…

請告訴我你現在包里的耳機線是個什麼形態。


假如把蛋白質的一級結構還有環境考慮進去,我想,在蛋白質摺疊的過程中,應該求的是局部最優而非全局最優


因為很多蛋白的有意義的三級結構是被其他蛋白摺疊出來的,而不是自己漂著漂著就折好了。

也許我能精確預測一個杯子自由落地會摔成什麼樣子,但基本不可能預測它會被憤怒的自家妹子摔成什麼樣子。嗯。


連蛋白質(多肽)自己都不清楚,不然怎麼會錯誤摺疊


似乎都在從演算法的角度看這個問題。關注這個問題的多是生信方向的吧?

提一個傳統生化方向的原因:同樣的一級結構,並不一定對應唯一的三級結構——典型例子如PrPc向PrPsc的轉變。


不然怎麼會有朊病毒?


2016.1.8補充

細胞質基質在蛋白質修飾和選擇性降解的功能

蛋白質的修飾:

輔酶或輔基的共價結合

磷酸化與去磷酸化

蛋白質糖基化作用

甲基化修飾

醯基化

泛素化降解控制蛋白質壽命,降解錯誤摺疊的蛋白質

也有HSP(熱休克蛋白),幫助變性或錯誤摺疊的蛋白質重新摺疊形成正確的分子構象。

————

細胞中的蛋白是如何摺疊的呢?上圖先:

這張圖來自翟中和的《細胞生物學》教材。當mRNA出細胞核被運到細胞質基質,核糖體結合上去合成多肽鏈,到分選到不同的細胞結構上。新生多肽有三種命運,第一種是帶有內質網定向信號序列的正在翻譯的多肽帶著核糖體,經過共翻譯轉運途徑運到粗面內質網上,在粗面內質網上加工的蛋白包括分泌蛋白,內膜系統以及質膜的膜整合蛋白。第二種是帶有不同靶向序列(轉運到線粒體的靶向序列稱為導肽,轉運到葉綠體的靶向序列稱為轉運肽,轉運到細胞核的靶向序列稱為核定位信號序列)的多肽經過後翻譯途徑轉運到細胞核,葉綠體(如果細胞有葉綠體的話),線粒體,以及過氧化酶體上。注意這前兩種過程都是有其他分子參與的。第三種是形成細胞質可溶性蛋白質。

那麼這個細胞內的過程可以說明什麼?對於胞質可溶性蛋白質,似乎它的摺疊就是在細胞質中由,疏水相互作用,氫鍵,離子鍵,范德華力等相互作用驅動的。預測其結構由高票答案介紹的思路是沒有什麼問題的。但是對於經過共翻譯轉運途徑和後翻譯轉運途徑分選的蛋白來說,拋開參與到其中的其他生物大分子,來進行預測是值得商榷的。以共翻譯轉運途徑為例,內質網扮演了很關鍵的角色。下面l兩張圖演示了內質網中新合成的蛋白質的質量控制過程。圖片來自molecular
biology of the cell, 6th edition

這張圖說明的是內質網腔內在對新生肽鏈的糖基化作用下多種大分子協助蛋白質形成正確構象。(好多大分子還是沒有畫出來的,如葡糖基轉移酶GI,蛋白二硫鍵異構酶PDI)這些大分子中包括了著名的分子伴侶(圖片中未展示)

這張圖說明的是未摺疊摺疊的蛋白是如何被正確摺疊。圖的注釋說的很清楚,就不贅述了

蛋白質摺疊是個生物學問題,我覺得目前高級結構預測(尤其是三級結構預測),必須結合一些發生細胞內的分子和細胞生物學過程建模。要是能把細胞完整模擬出來就再好不過了。然而這是很困難的。

最後附上,現在的一些資料庫和預測方法:(以下內容來自華中科技大學薛宇老師的生物信息學課件.,括弧裡面的評論是我自己加的)

蛋白質結構資料庫、結構分類以及可視化資料庫

蛋白質結構的資料庫:PDB, MMDB, MSD

PDB (Protein Data Bank): 蛋白質結構數據

http://www.rcsb.org/pdb/home/home.do

MMDB (Molecular Modeling Database):分子模擬資料庫

http://www.ncbi.nlm.nih.gov/sites/entrez?db=structure

MSD (Molecular Structure Database): 大分子的相互作用和結合位點

http://www.ebi.ac.uk/msd

蛋白質結構的分類:SCOP,
CATH,DALI/FSSP

COP (Structural Classification of Proteins):folds, superfamilies, and families

SCOP: Structural Classification of Proteins

CATH (Classification by Class, Architecture,Topology
Homology)

CATH: Protein
Structure Classification Database at UCL

DALI/FSSP: 蛋白質三級結構的比較

DALI server

Dali server

DALI Database (fold classification)

Dali Database

蛋白質結構的可視化:Cn3D,Rasmol/Raswin(可視化工具可多了,mathmatica

蛋白質二級結構預測:(與題目無關,注意,二級結構是指多肽鏈形成的α螺旋和β摺疊等元件,是局部構象)

Chou-Fasman predictions: Empirical

Garnier, Osguthorpe and Robson

(GOR): HMM

David T. Jones: PSSM

Frishman, Argos: Nearest neighbor

methods

Sujun Hua: SVM

蛋白質三級結構預測(應該包括四級結構,三級結構是指多肽鏈摺疊成的完整的三維結構,四級結構是亞基形成的多聚或寡聚結構。注意一些成熟的的蛋白還有輔基,如血紅蛋白)

背景知識之結構基因組學

? 人的基因組中包含&>22,00個基因

? 細胞內:通常&>3,000種蛋白質

? 序列與結構

? &> 2 million sequences in UniProt

? &> 33,000 protein structures in the PDB

? 目標:通過實驗或者計算的手段解析所有蛋白質

在自然條件下的三級結構

背景知識之蛋白質摺疊的動力學

蛋白質的摺疊:

細胞內:自發的;酶的介導;伴侶蛋白的介導

體外:許多蛋白質不能自發摺疊

動態:蛋白質的結構在自然條件下並不是固定的,蛋白質的功能常常依賴其構象的改變

自然條件下與變性之後的能量差非常小(5-15kcal/mol) 大約等於1-2個氫鍵的能量

摺疊過程中,熵與焓都發生改變

常用方法:

Threading - Fold Recognition

? 思路「搭積木」

? 實驗發現: 蛋白質摺疊的類型有限(~1,000)

? 問題: 能否根據不同的模版,預測給定蛋白質的

摺疊類型,並進一步拼裝成三級結構?

? 計算要求:

? 能量函數

? 模版庫(template
library)

? 計算方法

? 將給定序列與每一個模板的序列匹配,打分

? 將模板連接起來,氨基酸殘基替代

? 優化模型:能量函數

? 計算性能:不定,序列相似性高,模型可靠性高

Ab Initio Prediction

? 能量函數(考慮到下面的參數構建):

?鍵能(bond energy)

?鍵的轉角能(bond angle
energy)

?二面角能(dihedral
angle energy)

?范德華力(van der Waals
energy)

?靜電力(electrostatic
energy)

? 根據能量函數計算結構的最小自由能:Molecular
Dynamics or Monte Carlo methods)

? 缺點:計算量大

ROSETTA

? David Baker, U. Washington, Seattle

? 「小積木」:短的肽段(3-9 residues)庫能夠充分反映各種肽段在局部範圍內的三級結構

? 肽段庫的構建:PDB

? 針對給定蛋白質,尋找各種肽段組合,並以能量函數予以優化

評論:這些方法都只是從序列和能量函數出發,沒有考慮到酶和其它伴侶分子等分子機器的介導。我覺得它們是不妥的。我覺得應該先從序列出發,結合已有的知識,預測到哪些分子機器,哪些細胞結構會參與摺疊,模擬這個摺疊過程來預測蛋白質的三級結構。

以上。


推薦一個叫做fold it的遊戲,題主玩玩看~


終於碰到一個可以認真答的問題。

熱力學解釋:蛋白質的摺疊中,有可能有多種形態都達到了勢能較低,都能形成相對穩定的存在狀態

生物化學解釋

首先,蛋白質有一二三四級結構

一級結構是肽鏈上氨基酸的排列順序

二級結構是肽鏈上連續出現的結構,包括alpha螺旋,beta摺疊,beta轉角和無規則捲曲

三級結構是一條肽鏈的三維構象

四級結構是幾個肽鏈的空間構型

題主所指的三維結構應該指三四級結構

一級結構中,氨基酸以肽單位作為空間構型的基本單位。肽單位之間可以自由旋轉,在體內需要分子伴侶才能生成相應空間結構的亞單位,但是準確預測這貨,計算機表示計算能力不夠啊,即使有些地方僥倖弄成了比較規則的二級結構,其自由度仍然很高,無規則捲曲更是噩夢一般的存在,都說了無規則,想像一下數百個連著的雙鍵都有順反異構,這酸爽,超算表示去你妹的老子不算了。生成三級結構時,雖然二硫鍵的位置固定,但是拓撲學形態又各有不同,更別提需要對每一種可能的二級結構進行計算了。


一直以為自己一年來做的方向是計算生物學,看完 @Homesick Alien的答案之後才意識到原來是計算化學。。。


強答一番只為吐個槽。

最近構建了一個修飾蛋白,把相同的修飾肽放在基本蛋白的N末端和C末端,顯示出了完全不同的性質,尼瑪不止生物活性,連在PBS里的可溶性都不一樣了啊喂…………反覆驗證了多次,一級結構沒問題,二級結構沒問題,最後用高濃度的氯化鎂處理後恢復了部分生物活性,顯示的結果可能是可能由於疏水作用導致修飾片段被包裹,但是……計算機模擬出來兩種東西應該沒有差異才對啊!!!唉,這種東西沒辦法往下研究了╯▂╰,神奇的大自然……


1.蛋白質存在很多構象(局部最優結構)。

2.蛋白質不是處在最穩定構象上(全局最優結構)。

3.蛋白質的摺疊過程有很多輔助因素,難以了解。比如在核糖體對摺疊路徑的影響。這點希望有生物專業的朋友回答。

4. 即使沒有輔助因素,完全是在溶劑下進行摺疊。也是無法通過分子動力學去模擬預測,隨機因素影響著摺疊過程。

5.摺疊發生的時間尺度比較大,難以用物理、化學規律去模擬演化過程。

6. 簡單溶液中摺疊的尺度處在介觀尺度,非平衡態,熱力學漲落,量子相干支配的尺度。(補充一句,單純通過尺寸判斷介觀還是微觀錯誤的,應該從支配這個尺度的主要物理規律上判斷)這個尺度是統計力學的一塊硬骨頭。

7. 其他生物大分子參與蛋白質摺疊的過程,高度有序。不是隨機過程,可惜我們看不到。這個過程恰恰把蛋白質摺疊向一個亞穩定狀態(能量較高局部最優結構),通常十分穩定的蛋白不會有活性。這樣回到了原因2 。

——

本人試過用甘氨酸組成的直肽鏈和溶劑水去跑MD(分子動力學),發現根本不能跑成螺旋。可見一級到二級過程通過MD模擬都是難以精準預測的。


我覺得這樣問是不是直接一點

大家每次出paper

是先有實驗結果還是先QM MM...autodocking這類軟體計算先?

可以強答~~~

反正我做過一個mutant 只變一個位點

軟體計算完美 蛋白質也表達出來了

active site 崩潰


量子糾纏和量子相干形成DNA的雙螺旋結構。信息容量公理:任何系統最基本的組成部分攜帶的信息,不能超過1比特,即量子比特值得到的只能是0或1。由多個次級系統組成的複合系統的狀態,完全由次級系統的測量數值決定;任何純粹的狀態都可以來迴轉化,各狀態的轉化是一個連續的過程。如果沒有連續性,也就沒有量子理論。信息應當處於時間和空間之中,系統能夠對彼此的信息進行編碼,每個過程都是可逆的,因此信息能夠被儲存起來。AI:simulation human of quantum many-body systems. matrix product states.compact approximate reprentation.state of the wave function.


我也抖個機靈求摺疊:圍棋這麼簡單粗暴的遊戲,現在都2016年了才勉強知道個所以然。覺得容易的你們真以為計算機不要錢了?


推薦閱讀:

人的壽命在動物界算不算長壽?
昆蟲在變態後還有變態前的記憶嗎?
既然人體消耗的一部分能量被用來維持體溫,那麼人能靠喝溫水熱傳遞獲得這部分能量嗎?能獲得多少?
【純理論向】母親A和兒子B生下女兒C,那麼C算是A的克隆嗎?
少吃多餐對胃有什麼好處和壞處?

TAG:生物信息學 | 生物化學 | 蛋白質結構 | 生物物理學 | 生物 |