為什麼 NMR 不能用於解析大蛋白複合物的結構？

12-25

X射線衍射晶體學一直是結構生物學最經典的方法，最近幾年電鏡三維重構也有了重大突破而越來越火。相比之下結構生物學的另一大方法NMR（核磁共振）的風頭就小多了，因為它只能解析小蛋白的結構，無法解析大的蛋白複合體。但考慮到NMR也具有另外兩種方法所沒有的優勢，如可以解析溶液中的蛋白結構、可以觀察結構的動態變化等，如果NMR能解析大複合體，那麼將會非常有前景。

那麼，是什麼因素限制了NMR解析大複合體的能力？有可能通過改良儀器來取得突破嗎，正如電鏡在detector上取得突破導致解析度大大提高一樣？

現階段NMR技術主要有三大不足：

靈敏度低
靈敏度低
靈敏度低

靈敏度低，在蛋白質核磁共振譜學中的體現是：

最靈敏的氫核，室溫中等場強磁場中（500MHz為例）也僅有百萬分之一的數量級的極化率。換言之，每一百萬個氫原子中才有一個氫原子可以對最終的NMR信號作出貢獻。

非氫核的核磁旋比太低。
以碳十三和氮十五為例：
碳十三的核磁旋比是氫的四分之一，也就是說四個碳十三原子核可以貢獻出和一個氫原子相同的信號強度。
氮十五核磁旋比是氫的十分之一，十個氮十五原子核可以貢獻出和一個氫原子相同的信號強度。

非氫核自然丰度太低。
以碳十三為例：
碳十三的核磁旋比是氫的一百分之一，也就是說，事實上四百個碳原子核（碳十二和碳十三總和）可以貢獻出和一個氫原子相同的信號強度。

每一次掃得的信號低，其實也沒什麼。大家多掃幾次就好了。

問題是，每一次FT-NMR過程都相當於給所有觀測的原子核施加電磁脈衝，使得這些原子核全部躍遷至激發態。我們必須等待這些原子核失去能量，恢復到平衡態之後才能進行下一次掃描。這個從激發態到平衡態的過程，我們稱之為「縱向馳豫過程」。

小分子中的氫原子縱向馳豫過程大致是幾秒到幾十秒鐘；碳原子和氮原子縱向馳豫過程大致是幾十秒到幾十分鐘！
兩次掃描之間的時間，很不幸，基本上由縱向弛豫時間最長的核決定……

當然，我們可以通過INEPT或是Hartmann-Hahn Cross Polarisation來縮短兩次掃描之間的時間。不過，這個時間很難縮短到一秒鐘以內。

更麻煩的事情是，隨著分子量增大，分子縱向馳豫過程速率減慢。單位時間內可以進行的掃描次數也就隨之減少。

不僅如此，隨著分子量增大，分子橫向弛豫時間會大大降低。分子橫向弛豫時間降低，直接導致NMR譜線的解析度降低，使得解譜難度大大提高。

在所有這些問題中，現階段可能可以解決的，應該只有通過增加蛋白質分子單位時間內極化率，進而提高單位時間內採集的信號解析度。

Lyndon EMSLEY組和Robert GRIFFIN組發表了一些關於固態核磁動態超極化在蛋白質分子結構測定中應用的文獻，有興趣的可以取找來看看。

對於液態蛋白，可能可以通過Dissolution-DNP的技術進行快速分析，這是我們組現在做的內容。

當然，所有這些方法都不可能徹底解決橫向馳豫過程帶來的解析度問題。

不過已經是一大步了吧？

以前做液體生物核磁的，先說下我對NMR做蛋白質研究的看法：

1. NMR不適於解析大蛋白的結構

2. 很多情況下，NMR可以用於解析中等大小（&< 80 kDa）蛋白的結構

3. 某些情況下，NMR可以用於大蛋白質研究（例如20S proteaosome （Sprangers R Kay LE,
Nature 2007）），甚至結構解析（例如MCU 五聚體膜蛋白，分子量（加上去垢劑）估計150 kDa左右（Oxenoid K et al, Nature 2016）；SecB-PhoA，分子量~120 kDa （Huang C et al, Nature 2016））

================================================================

這兩天重新看了下原答案，發現遺漏了一個非常重要的原因。除了原答案里解析度低、解析過程複雜漫長、經濟成本高等三個主要原因外，另一個原因就是蛋白分子量越大，信號強度越弱。下面是更新過的答案。

液體NMR不適於解析大蛋白的結構，我覺得主要的原因有四個（當然還有很多因素沒有提到），固體核磁應該也類似：

1．NMR的解析度太低

看一下下面這兩張NMR圖譜，這兩張圖在蛋白質研究中是非常典型的HSQC二維圖譜，每個橢圓或圓形的小圈圈就是一個譜峰。一個譜峰代表了一個氨基酸的信號。這些圖譜是NMR實驗收集的主要數據。結構解析就是基於這些數據進行的。簡單地說，譜峰越大解析度越低，反之則解析度越高。事實上，這兩張圖的解析度都是很不錯的。依目前的技術水平，很難再向上有很大提升。左圖（Huang C et al, Nature 2016）的蛋白質單體不到150個氨基酸殘基，右圖（Berardi MJ et al, Nature 2011）約300個殘基。比較一下，左圖基本上譜峰之間基本上是分得比較開，而右圖很多譜峰就分不太開了，重疊很嚴重，而且你無法辨認重疊在一起的那一簇譜峰中到底有幾個不同的譜峰。重疊在一起就不好分析了。蛋白越大，氨基酸殘基越多，譜峰也越多，重疊就越嚴重。為什麼呢？因為不管什麼樣的NMR圖譜，核磁信號都分布在很窄的範圍內。比如這裡的二維圖譜，譜峰基本分布在6.5-9.5
ppm（H1維）和105-130 ppm（N15維）之間。在特定的很窄的範圍內，需要容納的譜峰數量越多，自然就會越擁擠，越容易重疊。

除此之外，隨之蛋白分子量的增加，譜峰的解析度會隨之降低。這也是受限於核磁的技術原理的（由於涉及到很多技術細節，非我所長，可參考高票的匿名答案）。解析度低的表現是譜峰更加臃腫，所佔的面積更大。然而譜峰的分布範圍不便，重疊度不可避免地增加。

三維圖譜甚至更高維圖譜可以部分地解決解析度低的問題。但是如果要解析結構，需要用到的NOSEY等圖譜非常複雜，給分析帶來很大的困難。高場強的核磁儀也有助於改善這一問題。目前蛋白質科學中用到的核磁儀器場強普遍是600M~900 M之間。場強越高，譜峰越sharp，所佔的面積越小，重疊度就越低，也是就是說解析度越高。但是單純提高場強的方法能取得的改善效果並不是那麼顯著。而且場強越高，核磁儀的建造成本和維護成本就越高。而且世界上至今也很少有高達1100 M的核磁儀。至於其他提高解析度的改良方法，就要靠做方法技術的專家們的努力了。比如現在在大蛋白研究中常用的TROSY方法，在很大程度上提升了解析度。這裡的兩張圖都是利用這種方法得到的數據。

2. 大蛋白的NMR信號較弱

隨著蛋白質分子量增加，除了解析度會降低之外，信號強度也會隨之降低（同樣由於涉及到很多技術細節，非我所長，可參考高票的匿名答案）。信號降低的程度是很明顯的。如果信號太弱，後續分析又將如何做起呢。對於小於80 kDa的蛋白，可以嘗試通過增加掃描次數（不核磁實驗的時間也會大幅增加），或者使用H2標記的蛋白樣品（經濟成本也會大幅增加）等方式，來提高信號強度。但是如果分子量繼續增加，這些方法所能起到的效果可能就不會那麼明顯了。

3. 核磁解析結構的過程太複雜漫長，時間和人力成本高

晶體解析關鍵步驟是結晶，一旦結晶成功，後面結構解析一般很快就出來了，流程非常的成熟。冷凍電鏡不是很熟悉，但是關鍵步驟應該是樣品製備，製備出了狀態好的樣品，後面收數據解析結構的流程也比較順利了。而NMR呢？典型的流程是：首先是狀態好的樣品，然後收集二維和三維圖譜，再對譜峰進行序列特異性的氨基酸殘基歸屬。之後，搜集NOE數據。如果NOE數據不足以解析結構，還要收集PRE數據等。最後，根據NOE和PRE約束，再計算結構模型。

別看我把這個流程說得這麼簡單，實際情況又是怎樣的呢？

樣品製備：幾乎每個關鍵實驗之前都要重新製備樣品，因為各個關鍵的核磁實驗之間的時間間隔一般較長，樣品容易壞掉。核磁實驗也可能不順利而必須重新做，也需要新樣品。此外，不同實驗所需的樣品的同位素標記類型可能也不同，也需要重新製備。

普通二維和三維圖譜收集：除了上面說的，實驗不成功需要重做之外，圖譜收集本身也需要較長時間。如果是50 kDa的蛋白，一套用于歸屬的圖譜的收集，比較順利的話，也需要兩周到三周。

歸屬：看蛋白大小了，一周至三個月。50 kDa的單體水溶性蛋白應該是很難歸屬了，2個月算是保守估計了。

NOE：這個實驗算是比較難的了。大蛋白一個實驗一般需要一周以上，實驗也很難一次成功，平均做三次就是至少三周的時間。加上中間製備樣品和調試儀器參數，至少也要五周時間。NOE的歸屬也要一周到一個月。況且，結構解析過程中可能需要多套NOE數據。

PRE：這個實驗可能比較簡單，但是要做多個不同是實驗。就算平均3個吧，至少也要一周了。樣品製備比較麻煩，3個樣品也要3周了。

結構計算：根據NOE和PRE約束來計算結構，對於一個大蛋白（&> 50 kDa）來說，即使解析結構所需的全套數據都已獲得，恐怕也要3個月以上才能拿到結構。

以上是一個常見的利用NMR解析蛋白結構的流程。還沒有包括樣品製備條件摸索的時間和數據分析的時間，沒有考慮核磁儀器機時的緊張狀況，而且也沒有考慮太多實驗失敗的情況。需要注意的是，為了獲得較高的信號強度和解析度，蛋白分子量越大，核磁實驗所需的時間就越長。

4.經濟成本太高，主要在於樣品和儀器兩方面

從上面三個原因可以看出，NMR解析大蛋白的結構，需要更多的樣品和更多的機時。做NMR對樣品有很高的要求，樣品狀態以外，樣品濃度和數量要求都很高。樣品必須用同位素標記。最簡單的是N15的標記，大蛋白很多時候還必須要用H2、C13和N15同時標記。一般製備樣品時，每個樣品體積要達到0.5 ml，濃度達到0.5 mM。況且多次實驗，要製備無數樣品。而儀器也不用說了，購置和維護費用都不小。這些費用也不是一般實驗室所能承受的了的。

以上是我認為NMR不適用於解析大蛋白結構的主要原因。但是這些原因並不是NMR不能用於研究大蛋白的原因。而且NMR除了解析蛋白結構以外，還可以做很多的事情，比如研究蛋白-蛋白相互作用、蛋白-底物相互作用、構象變化等等。有機會再來補充。

參考文獻：

Berardi MJ, Shih WM, Harrison SC., and Chou JJ. (2011). Mitochondrial uncoupling protein 2 structure determined by NMR molecular fragment searching. Nature 476, 109–113.

Huang C, Rossi P, Saio T, Kalodimos CG. (2016). Structural basis for the antifolding activity of a molecular chaperone. Nature 537, 202-206.

Oxenoid K, Dong Y, Cao C, Cui T, Sancak Y, Markhard AL, Grabarek Z, Kong L, Liu Z, Ouyang B, Cong Y, Mootha VK, Chou JJ. (2016). Architecture of the mitochondrial calcium uniporter. Nature 533, 269-273.

Sprangers R Kay LE. (2007). Quantitative dynamics and binding studies of the 20S proteasome by NMR. Nature 445, 618-622.

PS. 做NMR的同志們可以私信我你們解析蛋白結構所花費的時間，我挺想統計一下的。

核磁共振成像（NMR）信號強度與高能級和低能級上的粒子數之差Δn成正比。由於原子核質量大，核磁矩比電子磁矩小三個數量級。即使加較高的磁場強度，Zeeman分裂於能級的間隔很小，在玻耳茲曼平衡狀態下，常溫下的核自旋能級粒子數之差（極化率）是很小的。與順磁共振等相比，NMR方法的靈敏度是相當低的，
提高磁場強度可以增大能級間隔，增大Δn，這就是發展超導NMR儀的一個主要原因。BUT，製造高磁場成本高昂。我們可以人為加一脈衝，破壞原子核的玻爾茲曼分布，增大能級之間的粒子數差，從而增加NMR信號強度。
動態/動力學核極化（Dynamic nuclear polarization 簡稱DNP）應運而生。它是一種電子一核的雙共振技術，利用固體內微量順磁中心, 在強磁場下用微波激發自由電子躍遷，通過自由電子與核的相互作用，使相關核的自旋能級分布發生極化，使核自旋能級粒子數之差Δn大大增加。因此使NMR信號強度也大大增加。這裡所謂的動態極化，就是指微波輻照過程中核自旋能級粒子數的分布偏離了玻耳茲曼平衡態的分布。一般來說，電子的自旋能級間隔比核的自旋能級間隔要大γe/ γn倍，因此常溫下電子的玻耳茲曼因子也要比核的大γe/γn倍。DNP方法就是在雙共振的條件下將電子的高極化率傳遞到核上。理想的極化傳遞結果應能使核自旋的極化率增強γe/γn倍。
DNP與NOE相似，NOE（Nuclear Overhauser Effect）指核磁歐沃豪斯效應。在核磁共振中，當分子內有在空間位置上互相靠近的兩個核A和B時，如果用雙共振法照射A，使干擾場的強度增加到剛使被干擾的譜線達到飽和，則另一個靠近的質子B的共振信號就會增加，這種現象稱NOE。
通俗理解兩個粒子之間有耦合，我們改變一個粒子的能量狀態，那麼另一個粒子也要改變。我們精確控制外加微波或者射頻的哈密頓量，就有可能實現粒子自旋的極化。
DNP的實現機制可以用四能級模型來解釋。rt，

傳統核磁共振雖然靈敏度低，但是經過精確調控，還是可以進行大分子成像。（很多細節沒有說）當然這只是其中一種方。具體例子：利用DNP技術，氮氧自由基作為探針，可以測量一些特殊的蛋白質tau187。

組裡有人做膠原蛋白結構的（我自己做的另一個方向，現在和蛋白質沒啥關係），以下是我自己的看法，因為做的不是大蛋白的結構分析，所以很多真正的原因不一定提及。還有請諒解我寫作很差。

蛋白主要是C，H，N，O組成的，其中12C和16O 無法用nmr檢測，14N是quadrupolar, 比較難分析（自己不做quadrupolar的試驗，了解不多，只是聽到抱怨，peak太broad還有很難分析）。
13C只有1%的含量，所以一般1D的試驗還好，2D的試驗沒有labelling根本就沒有信號。 17O的含量比13C還要低，而且還是quadrupolar的。

1D的試驗我們只是用來看看它是不是膠原蛋白，但是完全無法看之間的結構。氨基酸之間的關係需要用2D的試驗來分析。再進一步還可以做3D，4D的試驗，只要你有足夠大的磁場和時間，而且，都需要用DNP。這就意味著用於研究的蛋白要做13C，15N的labelling（根據你需要研究的結構關係）。但不能所有氨基酸全部都label，不然圖譜就太複雜無法分析，所以就要選擇性的label。
nmr的時間和蛋白合成都是花錢花時間，分析圖譜估計也很困難（3d的圖譜看著都頭大），所以不如XRD好用。

說到蛋白動態，NMR確實很好用，可以根據labelling+selective pulsing，我們曾經計算過proline ring的兩種不同狀態的比例，2D，3D試驗可以根據不同的pulsing，選擇性的研究Ca-N-Cx的關係。

總的來說，XRD之類的研究的是long-range interaction，用來解析大結構好用，nmr得到的是local的信息，所以，用來分析一個大型蛋白要花費很多的時間和資源，不如XRD划算。所有的分析技術其實都不是獨立使用的。分析一個東西，一般XRD，FTIR，NMR，SEM什麼的方法都會使過去，然後總結所有的信息再給出結果，只是會側重某一種方法而已。

手裡膜蛋白複合物結構解析課題。

狀態好的樣品是NMR得到好解析度的先決條件吧。然而蛋白產率低，組裝複合物效率有限，樣品製備是個大難題。

何況每做一次NMR都要重新製備樣品，從小量氮標到小量碳氮雙標，大量氮標到大量雙標，每次都要用天然丰度摸索出最佳條件才敢上標記。成本實在負擔不起。

更何況，NMR實在靈敏度太差，轉子體積有限，為了縮短採樣時間降低信噪比，實驗往往需要提供最大量的樣品直到轉子裝滿。和小分子蛋白相比，同樣體積的轉子大蛋白複合物裝樣量更少，直接導致效率更低。

有這閑工夫折騰人力物力，為啥不上Cryo-EM？

1. 靈敏度的限制。就目前來說，DNP和超激化類方法不是常規，普適的；場強增加有限，因為錢，場強加1T，錢可能加1M；更有可能是新探頭，新接收器等降低雜訊。

2. 固體NMR對分子量並不受限。關鍵是樣品管容量有限，分子量越大會使摩爾數小，從而使每個原子（蛋白質某個氨基酸中的某個核）的信號弱。怎麼解決，提高靈敏度，見1

3. 固體NMR的樣品對均一性要求太高，否則解析度低，信號弱。怎麼辦，多維譜。多維譜時間長，還得靠靈敏度解決。

4. 如其他回答，還是花費。如果同位素標記的氨基酸，葡萄糖等不費錢，NMR也是能做很大蛋白的。選擇性標記，再搞個1.2G的儀器，還怕它大？

各位大神可以推薦下學習生物方面NMR的教科書嗎

現在還有人用核磁做蛋白質結構嗎？