怎麼根據靶點蛋白質的結構設計藥物?
根據靶點蛋白質的結構,怎麼設計相應的藥物呢,用什麼方法?
這個貌似是真正本行的問題,試著答一下,一定不全面,求批評指正。
先介紹一下背景,我本科在國內學的是數學,因為這一方面我是到美帝以後才接觸的,所以許多專有名詞我都不知道對應中文翻譯,看前面答案了解了一些,盡量中英對照力求準確,實在不知道的我還是用英文吧。PhD在現在這個組,我們組是個純計算組,做的是結構生物學,我們專攻方向是小分子抑製劑開發,以及相關對接(docking,看之前回答應該是翻譯成對接吧)軟體的開發,所以在相關方面還是有一定了解。
對接軟體
看到之前回答的朋友們提到的分子對接軟體都是autodock,discovery studio,MOE這些的,我還是有些心痛的,因為我組正是DOCK這個軟體現在的主要開發組,DOCK作為世界上第一款模擬分子對接的軟體,現在似乎用戶相當少,不過我們還是在堅持開發,DOCK6.4到最新的DOCK6.7主要都是由我組開發的,很快應該就會發布DOCK6.8了(並沒有人在乎)。之前的幾個回答對於分子對接的過程的描述都是相當好的,我就不贅述了,這裡從軟體層面大概補充一下分子對接模擬的兩大流派吧。
為了完成對於一個小分子和一個靶點蛋白質的對接模擬,基本上有兩大要素,第一就是小分子本身可能形成的結構,基本上是由分子每一個rotatable bond的二面角(dihedral angle)所決定的,另一點就是小分子和靶點蛋白質之間的相互作用,最基本的就是范德華力和靜電作用。我所謂的對接軟體兩大流派的區別就在於完成這兩個要素的過程不盡相同。比方說我們要模擬某一個小分子和某靶點蛋白質的對接,一大流派(如果沒記錯的話autodock應該就是這樣的,但是我不確定,以及DOCK3分支也是這一派的)的思路就是,首先生成這個小分子所有可能的結構,然後試著把這些結構在不改變內部自由度的前提下對接到靶點蛋白質的binding site內,進行一些局部的minimization,尋找到最合適的對接位置,然後用打分函數對於所有的結構打分排序。另一個流派(以DOCK6分支為代表吧)的思路是這樣的,我們試圖首先把這個小分子按rotatable bond分為若干片段,然後從其中最大的片段(我們成為錨,anchor)開始,首先把這個anchor放到binding site里,計算這個anchor和蛋白質之間的相互作用,進行局部優化,然後按順序把下一個片段接到anchor上,嘗試不同的二面角,計算相互作用,局部優化,然後周而復始,直到在binding site內把這個小分子組裝完成為止。從目前看到的數據來看,兩種方式在複製晶體結構(把一個小分子和蛋白質complex晶體結構拿來,把小分子拿出來,用軟體模擬對接,看軟體模擬結果和晶體結構是否相似)的成功率方面不相上下,但是效率似乎是第一種方式更高一些。雖然如此,至少我老闆還是執著於第二種方式,因為還有一些更多的應用前景,後面會提到。
打分函數
對於一個對接軟體來說,打分函數可以說是最重要的一個部分了,有一個或者多個好的打分函數,可以大大提高虛擬篩選的成功率。打分函數也可以大致分為兩大類,一類就是以物理為基礎的,比如之前提到的范德華力和靜電作用,再有也可以包括類似單點(single point)的MM/GBSA或者MM/PBSA計算,能夠包括desolvation penalty,但是由於只有一個結構進行單點計算,所以結果可能不是特別準確,遠不如使用分子動力學模擬以後的計算來的準確。另一大類的打分函數是以相似度為基礎的,即已知一個具有活性的小分子抑製劑,通過計算一個化合物庫內化合物和已知抑製劑之間的相似程度排序,找出其中最接近的分子,也就是理論上最可能具有相似活性的分子了。這裡所說的相似可以有許多不同的方面,包括二維分子結構,三維分子結構,在binding site內所佔體積相似,藥效基團(pharmacophore)結構相似,或者是和靶點蛋白質的相互作用方式相似等等不同的方式比較。據我所知這一類的打分函數在工業界應用得似乎更多一些。當然以相似度作為打分函數最大的問題可能就是,你找到的得分最高的分子理論上是跟已知分子最接近的一個,也就是說很有可能在活性上沒有特別大的提升,但是同時,篩選抑製劑,或者說最終製藥,活性只是一個方面,還有其他各種標準,所以這樣的篩選也是有很大意義的。
虛擬篩選
這塊我最熟了,嗯,我們組就是專門做這個的。其實說實話,講完前面這些以後,虛擬篩選也就沒有什麼太多可以講的了,簡單說就是用對接軟體,去做大量化合物庫的對接模擬,當然,現在的化合物庫做虛擬篩選一般數量都是以百萬計的,挨個做一遍對接,然後打分,排隊,買化合物,測活性。講真木有什麼特別的,不過看到前面回答里說拿幾百幾千個小分子出來做高通的我看著還是很羨慕的,畢竟我組是純計算組,每次都只能買一百個左右的小分子拿去到合作實驗室做活性,不過多少還是能找到幾個有活性的分子的╮(╯-╰)╭
缺陷
講了這麼多,還是要來講一講現在對接軟體最大的缺陷的,第一就是,慢,這個東西其實也沒轍,只能這麼慢,當然對於我們這些學術軟體來說,木有人做軟體優化也是一個很大的問題,一代一代的PhD們攢下來的代碼,要說沒有問題沒有bug,那才是見鬼呢。。。。所以軟體本身的效率確實存在一定問題,再有就是對接軟體天生的不足了,因為要兼顧準確率和效率,所以現在市面上絕大多數對接軟體(不包括商業軟體,不了解)基本都沒有辦法很好的在計算對接的同時模擬靶點蛋白質的receptor flexibility,只能使用一個靜態的靶點蛋白質結構,由於小分子和靶點蛋白質在對接過程中,事實上兩者都在運動,而靶點蛋白在binding site內氨基酸sidechain的移動很有可能讓原本看起來不能fit進去的小分子能夠很好的和蛋白質產生相互作用,而這一點暫時我們使用對接軟體都無法模擬。另一個問題就是我們對接軟體內現在所有的打分函數對於小分子的排序都是基於一個靜態的結構,導致的結果就是計算結果誤差相對比較大,這一點其實和第一點是相關的。這個問題目前來說只能通過分子動力學模擬來解決,但是MD的效率相對來說就太低了,所以只能針對比較少量的分子進行模擬。還有一個問題基本上就是一個永恆的問題,打分函數。現在幾乎所有的打分函數都是相當粗糙的,確實我們都看到很多成功的例子,但是進步的空間依然很大。我們現在的一個思路是在開發新的打分函數的同時,能夠將各種不同的打分函數進行組合,以期得到最好的效果。
進展/設計
其實之前說了那麼多,和題主所問的設計關係並不大╮(╯-╰)╭現在再來講講所謂的小分子設計吧,其實這也是對接軟體的一個重要的發展方向。
要說小分子的設計,其實也分兩類吧,一類是在已知有活性的小分子基礎上進行設計,通過改變各種基團,試圖提高小分子的活性,而另一類就是完全從頭開始設計一個全系的分子,也就是其他回答里提到的de novo design,這兩類我都試著稍微說一下吧,畢竟都有接觸。
第一類設計一般是在虛擬篩選得到一些有活性的分子以後進行的,一大方式就是SAR模型,這一類研究更多的要依靠實驗室合成和測試化合物,大概就是這裡添一個基團,那裡換一個基團,看看怎樣做出來的化合物活性最高,然後總結出一些規律。這種做法的一大好處是,有沒有結構都能往下做,有結構自然最好,沒有的話問題也不大,憑經驗也能分析個八九不離十的。除此以外另一類方式就是以結構為基礎的設計(structure-based design)了,我們也喜歡把這個稱為rationale design,也就是說我們是看著結構來的,不是靠蒙的(其實還是要靠蒙╮(╯-╰)╭)。從名字就知道,對我們來說結構異常重要,能夠有晶體自然是最好的,沒有的話就要靠對接軟體預測了,預測得到的結構我們一般會用MD進一步驗證,主要是看結構是否穩定,同時計算free energy of binding這些東西,然後根據結構來判斷在哪些點位上添加哪些基團會得到更好的親和力,然後就是又一輪新的預測和計算,排序,合成,測試活性,周而復始。
重點來說說另一類設計分子的方式,也就是de novo design吧,我個人認為這將是小分子抑製劑設計的發展方向。簡單說,這個概念和虛擬篩選相對,使用的是分子片段,或者基團組成的庫,而不是完整的化合物庫,針對一個靶點蛋白質的binding site,通過不斷地排列組合各種不同的基團,最終設計出一些對於這個蛋白質有比較好理論活性的小分子。這一類方式最大的好處在於不用再受到所使用的化合物庫的限制,理論上能夠通過不斷地排列組合來探索一個極其大,甚至於覆蓋整個的chemical space。據我所知,市面上目前還沒有一款軟體能真正完成這樣的功能,我見到過一些軟體能做一些類似於通過排列組合生成新的化合物之類的模擬,但是似乎並沒有太大的影響力。我組現在對於最新版本DOCK的開發就是針對這個方向,現在代碼完成都大概在85%以上了,論文應該也會很快發表吧。。回到之前說的對接軟體預測小分子結構的兩種方式,我個人認為要應用在de novo design上的話,在binding site內搭建通過一個個片段組裝的方式來搭建一個新的分子應該是更行之有效的方式。因為如果說要先做好分子的結構,然後試著fit進binding site,一個很大的問題是這樣真的會需要通過排列組合生成所有可能的分子構成和各種不同的結構(conformer),我覺得效率會是一個大問題。但是如果採用在binding site內搭建的方式的話,可以一定程度上避免這個問題,因為有了binding site結構的限制,許多基團在搭建的過程中就可以知道無法fit進去,也就由此減少了很多無謂的嘗試。另一方面,整個de novo design的過程,可以由不同的打分函數來指導,以期得到不同性質的結果,比如如果只用分子間作用來指導設計,那麼很可能會最終得到一個相對比較大的分子,因為更大的分子能夠形成更多的分子間作用力,從而獲得更好的分數;而如果用二位分子結構相似度來指導設計的話,就可以期待最終會得到一個和參考分子非常相似的分子。而最終,在我們的理想當中,我們應該用一些列打分函數的組合來指導de novo設計出的分子,以期得到有最好性質的一些分子。同時,de novo design也可以被用來在已知活性的小分子為基礎的設計,可以將小分子的全部或者部分保留,以此為基礎做設計,這樣的話可以完成自動化程度更高的analog design。
de novo design的應用前景看起來非常美好,但現階段還是有一些非常大的挑戰的。其一就是效率,這個挑戰是必然存在的,要覆蓋更大的chemical diversity,必然花費相對更多的時間。另一點就是如何設計出更合理,更現實,能夠被合成的分子。因為我木有任何化學和有機化學的背景,當初剛開始是試著設計分子往上加基團的時候,往往是看上去很美,但是老闆拿著我設計的分子,第一句話一般是,你去給我查查,你設計的這玩意兒真的有可能存在么╮(╯-╰)╭所以,讓電腦設計出有可能被合成的分子當然也是一個很大的挑戰了。
好了,拉拉雜雜說了那麼多,基本就是我在這個領域內一些了解和認識了,歡迎討論,歡迎指正。謝謝大家。
一般來說,你做出來的東西根本不能叫藥物。如果誰文章寫自己根據什麼設計了一種藥物,那麼我會視情節嚴重程度給予修改或拒稿。藥物分子一定是經過多輪非常嚴格測試的。隨隨便便搞出來的最多叫抑製劑或活性劑一類。
我最近剛開發的一在線程序對這個也有些幫助。
首先可以搜索你想要的靶點蛋白質結構:
可以得到一些靶點的信息,比如:
你可以看到,有些化合物已經被證實了:可以與靶點結合,然後以該化合物為出發點進行搜索:
你可以使用多種參數作為搜索選項,像分子指紋啊,各種各樣的性質描述符。
搜索得到多個化合物結構,
這之後,再用這些化合物進行分子對接,虛擬篩選等等。
國內目前這方面搞的比較好的就是上海藥物所了,比如蔣華良等人。他們通過大規模高通量的篩選還是可以得到不少有用的信息並用於實際藥物研發的,比如之前的SARS,流感等等。
不過,我的重點是不過,一般組用這個就比較扯淡了,你不可能像藥物所那樣具有完整的各方面的實驗。
不僅如此,前面的好多答案也都提到了各種對接軟體,這些軟體確實是很有用的,也是非常必要的,對整個藥物研發環節也很重要,但你用這些軟體做出來的東西,跟藥物也是相差甚遠。
比如你們組窮的都只能用autodock了,還想著研發藥物呢?老老實實做點研究發點paper得了。
其他商業化軟體各有優劣,比如sybyl,天天廣告打得不少,咋就不去想想改進一下自己的產品,賣的挺貴的,界面操作跟免費軟體似得,用戶能多嗎?
比如discovery studio,改進來改進去,感覺還不如2.5呢。還有那個CDOCK啥時候能改進一下啊,對接結果還沒autodock准呢。
比如薛定諤,OK,算是比較準確了,畢竟DE.SHAW投了3000W美刀,但是倒是便宜點啊,一個破對接賣5年5W美刀是不是太黑了點。
總體來說,1,對接的結果都不準,除非你大量對接之後獲取一個統計結果。
2,免費軟體的界面都極其不友好,收費軟體的sybyl也在此列。
3,當你適應了不友好的免費軟體後,他的結果跟商業軟體都一個鳥樣。比如你就要重點研究一個化合物,你做了個對接而沒有實驗對照,對不起了,只能拒稿了,不是我殘忍,那結果你自己都不信。
還有個東西叫de novo,說的好像很NB的樣子……
很多軟體也有這功能,就是根據對接結果抽提了個藥效團,比如一個大分子,他認為裡面的苯環是關鍵,他就根據這個苯環又生成點其他側鏈。最初我看還有人寫文章用,現在也沒什麼人用了。
正好是我的專業,佔個位,稍後來答~
我做過胃潰瘍藥物和抗癌藥物的分子設計的課題 ,作用靶點分別是質子泵 (H*,K*—ATP酶,"*"代表"+",手機輸入法打不出來上標)和σ1σ2 (sigma 受體)。好吧,不說廢話了,進入正題,通俗地講講我們在已知藥物作用靶點時進行藥物設計的一般方法吧。
先簡單列個一般流程:
已知受體蛋白質的氨基酸序列(藥物和受體重點結合的部位的序列一定要確定,其他影響不大的部位的可以人工模擬)——→ 同源模建(Homology modeling)——→ 分子對接(Molecular docking)——→ 量子力學和分子力場優化(QM/MM optimization)——→ 分子動力學模擬(Molecular dynamics)——→ 廣義伯恩表面積演算法(MM/GBSA calculation)
未完待續……
以我做過的潰瘍藥物設計為例來講講這個問題。我們設計的是質子泵抑製劑類的潰瘍葯,首先靶點是很明確的,即質子泵( H+,K+-ATP酶 ,在胃中分布於胃壁細胞表層 , 排出H+,Cl- 並 重吸收K+
,泌高濃度的胃酸,通俗地講就是胃酸分泌的最後通道,我們設計的藥物分子需要與之結合起到阻斷胃酸分泌,緩解並治療各種消化道潰)。
一、同源模建
我們首先從Swiss-Prot資料庫(ID:P09626) 中獲取豬胃的H+,K+-ATP酶的氨基酸(1033個)序列,利用ClustalW2 演算法,通過BLAST在線序列比對 (http:// http://blast.ncbi.nlm.nih.gov/Blast.cgi) ,選取E2P狀態下的 Na+,K+-ATP 酶晶體結構(PBD編碼:2ZXE)為模板,使用MODELLER9v4 建立豬的H+,K+-ATP酶的同源模型。H+,K+-ATP酶的結構利用Schr?dinger 軟體的Protein Preparation Wizard module模塊進行處理,再通過PROCHECK程序對最終的優化模型進行驗證,以評估蛋白質結構的立體化學的質量。
呃,這個,為什麼是豬的胃呢,是因為我們參考的實驗數據來自於一些專家的實驗室活性研究,而他們的實驗用的就是豬胃(總不能拿人胃做實驗吧),為了與之對照才建立的是豬胃的質子泵同源模型。
二、分子對接
有報道指出利用Schr?dinger 軟體的誘導契合對接(IFD)法進行分子對接模擬的方法是一個強大且精準的用來解釋配體和受體柔性的方法。IFD程序分為三個步驟:Glide XP 模式被用於初始對接,20個配位體的形態被保留用於蛋白質結構的改進;以三個關鍵殘基(Ala335,Tyr799和Cys813)為中心建立立方體對接盒子;Prime程序用於誘導契合蛋白質- 配體複合物的形成。優化後的複合物根據Prime能量進行分等,能量最低結構通過最後一輪的Glide對接和評估。最後,在默認設置的Glide XP模式下,每個配體再次與的第二步驟中所生成的精細化的低能量受體結構進行對接。IFD分值對占蛋白質- 配體相互作用的能量和該系統的總能量都進行了計算,並據此將對接構型排序。最優的複合物結構進行接下來的QM/MM優化。
三、QM/MM 優化
QM/ MM運算利用QSite程序執行。定義為QM(量子力學)區的配體通過密度泛函DFT / B3LYP(6-31G*基組)計算,而MM(分子力學)區的受體通過截斷牛頓法(最大周期為1000;梯度標準為0.01)進行最小化。採用 OPLS 2005 全原子力場。
四、分子動力學模擬
利用Desmond對優化後的的對接模型進行分子動力學模擬。該系統為溶劑化的SPC水分子斜方體盒子,向系統加入平衡離子進行中和,然後進行分子動力學模擬,應用NPT系綜執行。採用光滑粒子網狀 Ewald 法處理長程靜電相互作用,庫侖短程相互作用。能量值和軌跡圖像分別記錄,再用Desmond程序進行MD軌跡分析。最後用PyMOL對最終的配體- 蛋白質複合物可視化,並通過Maestro9.3 進行分析。
五、 MM/GBSA 演算法
利用廣義波恩表面積(MM/ GBSA)方法計算對動力學最終構相的結合自由能(ΔGbind)。Prime程序中的MM/ GBSA程序用下列方程式計算對接配體的ΔGbind:
DG"bind = DEMM + DG solv
DGbinb = DEMM + D Gsolv-T DS
其中,ΔEMM是複合物間的氣相MM能量與蛋白質和抑製劑的能量總和之差,並且包括ΔEinternal(鍵,鍵角和二面角能量),ΔEElect(靜電能)和ΔEVDW(范德華)的能量。ΔGsolv是溶劑化自由能結合的變化,包括靜電自由能ΔGGB(利用廣義Born模型計算極性分布),和非靜電自由能ΔGSA(溶劑可接近表面非極性自由能貢獻)。TΔS是結合構相的熵變,用MacroModel模塊的Rigid Rotor Harmonic Oscillator (RRHO)分析計算。ΔG"bind忽略了熵貢獻,而ΔGbind包括了配體平移,旋轉和振動時的熵損失(TΔS)。
其實以上方法是偏重於對已知結構的受體與配體分子間的作用模式的模擬從而達到預測藥物活性等目的,當然也可根據模擬過程中的一系列數據分析對所設計的藥物分子的結構進行相應的修飾和改進以使藥物與靶點更好地作用......所以只能算是根據靶點蛋白質結構設計藥物n種途徑中的一種,畢竟咱大鎖鑰理論博大精深嘛。
根據靶點蛋白質的結構設計是指利用結構生物學揭示的蛋白3D信息設計藥物,包括:分子對接、藥效圖。但是結構生物學的信息要比這多的多,比如複合物結構里的配體,此時這個配體的處於生物活性構象狀態,如果利用這個配體的信息也算是利用結構生物學的信息設計藥物的話,那麼還可以包含:分子形狀與靜電形似性技術。此外,全新設計(de novo design)也通常利用僅利用蛋白的3D結構信息生長出分子,這種方法應該也算在內。
分子對接是典型的應用結構生物學信息進行資料庫搜索方法, 從資料庫中篩選與靶點蛋白結合位點3D互補的化合物,以期望富集活性化合物。此類軟體眾多,並有文獻綜述一大堆。典型的軟體有Dock,AutoDock, AutoDock Vina, GOLD, GLIDE, Surflex-Dock, FRED, LigandFit。
利用結構生物學的信息技術還包括藥效團,比如Ligansdscout(Inte:Ligand: Your partner for in-silico drug discovery)可以從受體-配體複合物結構識別藥效團用於虛擬篩選以發現先導物,典型的例子有:
Matja?Brvar, Andrej Perdih, Miha Renko, Gregor Anderluh, Du? an Turk, Tom Solmajer. Structure-Based Discovery of Substituted 4,5』-Bithiazoles as Novel DNA Gyrase Inhibitors. Journal of Medicinal Chemistry. 2012, 55, 6413-6426.
De Luca, L.; Ferro, S.; Damiano, F. M.; Supuran, C. T.; Vullo, D.; Chimirri, A.; Gitto, R. Structure-Based Screening for the Discovery of New Carbonic Anhydrase VII Inhibitors. Eur J Med Chem 2013, 71C, 105–111.
僅利用複合物結構里配體信息的技術還包括分子形狀與靜電技術:從複合物結構里提取配體的3D結構(此時為生物活性構象)作為參比化合物,搜索與參比化合物具有相似分子形狀與靜電分布的化合物。這些命中的化合物應該具有與參比化合物具有相似的生物學活性。此類方法雖然分類到基於配體的方式,但是確實主要利用了結構生物學的信息:用的信息越多,越準確。典型的軟體有:OpenEye的ROCS(Cheminformatics and Molecular Modeling Software)與Cresset公司的BLAZE(Blaze: Fast, Effective Virtual Screening software)。
全新設計:可以利用複合物結構信息從口袋裡生長化合物。此類軟體包括OpenEye公司BROOD, Cresset公司的SPARK;僅利用蛋白3D信息的技術包括AutoGrow,北京大學開發的LigBuilder( http://www.ligbuilder.org )等; Tripos公司的MUSE等,Schrodinger以及Discovery Studio等都含有這樣的模塊。
虛擬篩選與全新設計是互補的技術。虛擬篩選存在的問題包括:如果資料庫很大,虛擬篩選需要大量的計算資源進行長時間的計算;如果資料庫里不包含活性化合物就會得不到有用的結果。全新設計剛好克服了這個問題:不需要非常大的資料庫,可以很快看到結果;化合物是生成出來的而不是從現成的資料庫里選出來的。分化學葯與生物葯,即小分子化合物與蛋白質多肽
題主問的大概是化合物
又分從頭設計/全新設計與結構改造,以及虛擬篩選
虛擬篩選是常用的,技術也相對成熟,就是從一個或者幾個化合物庫中篩選出有親和力的化合物,進而篩選出有活性的化合物
有商業化合物庫,你篩選出其中某幾個化合物,可以直接跟其公司訂購該化合物,然後進一步做藥理實驗等
虛擬篩選的技術大致就是曹鵬聶榮祖講的dock技術即分子對接,然後對結果進行打分評價,看靶點蛋白與化合物的結合能怎麼樣
這個算是篩選,結果比較粗略,更準確的結合能計算是先跑分子動力學,然後用MM/PBSA等方法計算,慢,但準確
當然化合物有沒有活性,不只取決於親和力,所以也要憑藉個人經驗對篩選出的結果自己評估一下,以及最終上實驗看看
小分子的從頭設計也是有的(蛋白多肽是沒有的),不過也許不太成熟,不很了解
有一種方式是保留活性化合物的母核,然後用軟體替換其側鏈基團,得到一個小型的虛擬化合物庫,然後也是打分評估,初步篩出結果較好的結構
還有一種是反其道而行,是保留與受體有相互作用的側鏈基團而替換母核,其實也是一樣的道理
還有什麼片斷組裝法,顧名思義吧,我也不大了解,總之也是組合成一個小的虛擬化合物庫
當然都是有相應軟體的,discovery studio是非常著名的綜合性藥物開發平台,裡面包羅萬象很多功能都有,然而價格也不菲,據說幾十萬
還有MOE,也是綜合性的,不過相比discovery studio弱一些,但性價比比較好
還有SYBYL,與discovery studio幾乎是一個重量級的,不過貌似近年來發展不如discovery studio好
還有Schrodinger軟體,也挺好
以上都是有名的商業軟體,還有一些免費的比如對接常用的autodock,分子動力學常用的GROMACS、NAMD,等等,也很不錯,不過一般不及商業軟體好用
補充—————————————————————————————
開發藥物除了親和力好、活性好之外,還有考慮溶解性、體內代謝、毒性等問題
用軟體預測化合物的溶解性,這方面的軟體相對還是比較多的
預測體內代謝ADME過程,我所知的只有discovery studio,不過不知道準確性如何
discovery studio也能預測一些肝毒性等毒性,是以大鼠的數據建立的模型,也沒具體用過,不知準確性如何
與題目本身無關,有個很有意思的東西,bsAb,兩個不同的hc連在一塊的mab。理論上說因為有兩個不同的cdr,可以bind兩個不同的地方並且讓它們互相接近。這個算是多靶點藥物的一個實現思路。
autodock等分子對接軟體可以把蛋白和藥物分子對進行虛擬篩選,如果你有蛋白結構和知道活性中心,然後又有化合物結構的話。
在藥物設計這個領域待了很多年,有點經驗,分享一下。
藥物設計需要兩個分子:大分子和小分子。大分子如果能從PDB直接下載高resolution的蛋白質最好,上面有人說道同源建模,不建議。同源建模最多只能保證殘疾主鏈位置比較接近,但是藥物對接需要知道殘基每個原子的位置,可能原子位置差個2,3個A米對結果就會影響很大,這也是為什麼蛋白質解析度越高越好的原因。
小分子,小分子需要知道RS構型,然後通過Corina,Guassian等軟體產生一個能量優化的結構作為起始結構。
然後是對接,對接主要是兩部分,空間搜索和打分函數。用戶只能看到最終結果每個構象的打分函數,但是無法看到搜索過程。起始搜索過程描述起來也不困難,以最費時的窮舉演算法為例:小分子在空腔中可以沿著XYZ做平移,也可以沿著XYZ做旋轉,單鍵也可以自己旋轉,把這些平移旋轉窮舉完了結合打分函數就可以得到最優的構象了。當然,窮舉的時間誰也受不了,所以大家都用各種演算法來實現搜索過程,典型的有 模擬退火 遺傳演算法 粒子群演算法等等,演算法的詳細就不介紹了。但是這些演算法比較共同的毛病就是容易陷入局部最優解之中。
打分函數,打分函數有基於物理化學的和基於經驗的等等。Gold對接十分準確的原因之一就是他的打分函數很準確,Gold的打分函數只包含兩個項:范德華和氫鍵,很牛逼吧。Autodock當年使用的是基於物理化學,什麼靜電 旋轉能量都加入了,但是準確率差Gold不少。後來又開發了Autodock Vina,準確率和Gold應該差不多了。
一年多沒做藥物設計了,自己寫的對接程序還在優化中,遙遙無期,十分懷念當年的時光。
我在美帝大農村某一大學城讀藥學phd,稍微補充一點點。之前的答案里已經提到從頭設計(de novo design),基於片段的設計(fragment based design) 以及虛篩。我了解得最多的是基於靶點結構的計算機輔助虛擬篩選(structure based virtual screening)。@觀魚對這個過程已經說的比較具體,我想題主說的靶點大概指晶體結構被報道了的蛋白吧(當然其他生物大分子DNA,RNA也是能做靶點的)。一般我們會選擇蛋白的活性位點做虛篩對象,比如說我們做酶抑製劑的,會優先選擇把靶點結構中參與酶反應的那一小塊選做對接虛篩。虛篩可以把小分子化合物庫(大概幾十萬個化合物)中最有可能和靶點結合的小分子選擇出來排個序(大概幾百幾千個化合物)。接下來這些小分子會被用作高通量生化活性篩選(high throughput buochemical screening),比方說我們組是做單濃度(10 uM)的enzyme activity inhibition assay,有的也直接上細胞篩的,一般都是在384或96孔板里,根據靶點本身的特點和所篩化合物的特性選擇assay。虛篩的結果和生物活性不一定是一致的,要以生物活性為準。這一步下來又能排除很多化合物,大概留下幾十上百個活性好的,排除那些非特異性結合和假陽性結果,剩下的那一批幾十個化合物會做進一步的分析,比如測它們的IC50(抑制50%蛋白活性時的小分子藥物的濃度)和Ki(binding affinity,小分子藥物與靶標的結合常數)等。再有了小範圍的化合物以後,我們就能用藥物化學的方法做構效關係分析(structure activity relation?ship analysis)。在這一步里我們又能回到靶點結構中,通過docking和molecular dynamics模擬相互作用,找到靶點/結合位點中的重要氨基酸殘基,相對應的在小分子上做有針對性的結構改造(比如模擬結果中小分子的某一部分處在蛋白結合位點的疏水區,那我們就把小分子上的那一部分改造得更疏水,從而加強與蛋白的相互作用,降低Ki和IC50。當然我們更希望拿到藥物和靶標的共晶體啦,這樣drug-target interaction就一目了然啦,而且會對化學改造更有信心,然而,晶體實在是可遇不可求,所以這種計算機輔助藥物設計是個很好的代替。
另外一條思路是,如果題主能查到報道過的能和蛋白靶點結合的化合物,可以以此為模板用基於藥物的虛篩(ligand based virtual screening)找到更多結構相似(但不一定是衍生物)的化合物,來做活性測試和構效關係分析。其實這裡也可以用到基於藥效團/藥效片段的虛篩,也就是把已知的藥物的結構打散成幾段fragment,或者已知藥物已經有結構改造和構效關係分析數據,那麼通過計算機輔助我們就能找到其中的藥效基團(pharmacophore),根據這些信息來做虛篩。
總的來說,初期藥物研發的目標是找到活性更強的化合物,而知道靶點結構,利用藥物和靶點結合位點的性質能幫助我們更好地達到這個目標。其中用到蛋白靶點結構的時候有:一,基於靶點結構的虛篩的時候用;二,研究藥效關係時改進藥物結構用(可能還有第三,做共結晶的時候拿來當作數據解析的參考)。
我們實驗室拿來分析結構和做對接的軟體就是discovery studio。老闆當時買的時候花了兩萬多刀,不過軟體確實很適合做藥物化學而不是做計算化學的人用,界面友好操作相對傻瓜,不需要深入了解量子化學理論那些的就能用。實驗室也有博後之前用過MOE,表示界面友好容易上手,但計算功能沒有discovery studio強大。
除了傳統的小分子藥物以外,免疫療法和多肽類藥物這些年來也是發展得很迅猛。多肽類的藥物很多是靠破壞蛋白-蛋白相互作用達到阻斷信號通路或者抑制酶活性的效果,也有與蛋白類底物競爭來抑制活性的。由於大分子的結構相對複雜,很少聽說有用虛擬篩選來做的。通常多肽類抑製劑都是底物的類似物(substrate analog, 比如我們一直蛋白100號位點的賴氨酸Lys100能被乙醯化,那我們就選取這個蛋白序列上賴氨酸附近的氨基酸做一條含有5-20個氨基酸的多肽,並將底物氨基酸做替換或修飾避免酶反應發生,這樣這條多肽能保持和靶標蛋白的結合能力,從而與原本的底物競爭來抑制酶反應;又或者如果蛋白A和蛋白B結合以後才有活性,那麼針對A和B的結合位點,在B上選擇與A結合的一段蛋白序列做成多肽b,多肽b能與A結合從而與蛋白B競爭等等)。免疫療法就是指針對靶標做出抗體,但通常情況下該靶標必須在細胞表面抗體才能識別。這些抗體除了從動物血清中提取,也能對上面的多糖做針對性的化學修飾從而提高結合/識別能力的(對這個領域並不是特別了解,從某次seminar聽來的,暫時沒找到文獻)。
參考文獻:
Young, David C. Computational drug design: a guide for computational and medicinal chemists. John Wiley Sons, 2009. (正在讀的計算機輔助藥物設計入門書)
Sliwoski, Gregory, et al. "Computational methods in drug discovery."Pharmacological reviews 66.1 (2014): 334-395.
Craik, David J., et al. "The future of peptide‐based drugs." Chemical biology drug design 81.1 (2013): 136-147.
( ̄^ ̄)ゞ
主要還是分子對接了,比較好用的有autodock ,discovery studio 等,可以設計不同的藥物結構與大分子進行對接,有一系列的評分函數進行評價,分數高的說明理論上相互作用比較強,但也不盡然!
獨立做過相關課題,這種有很多種方式可以做,比較經典的是建庫做分子對接(molecular docking)現在有很多的軟體,我自己比較喜歡autodock(免費)discovery studio(商用)autodock vina,如何使用網上有很多教程,大規模的庫可以在平台上(雲端)運行。另一種比較壕的方法是,對於靶蛋白比較了解,猜測其通路,按不同通路的小分子庫做screening,篩到有作用的直接就可以進一步做細胞和小鼠實驗,或者進行化學修飾提高KD到nanomolar之後再做細胞和小鼠實驗,效果明顯paper就有了,但這個過程說起來簡單其實是很漫長的,稱為藥物先導化合物篩選,相關的書和paper都很多,確實是很有意思,但也挺費力燒錢的
需要用到動力學模擬。虛擬篩選。先佔坑。
推薦閱讀:
※一條mrna可以翻譯多少種蛋白質?
※蛋白質能打結么?
※高溫瞬時常溫奶是不是會讓蛋白質變性?蛋白質變性是怎麼回事?
※變質的蛋白質可以食用?
※蛋白質吃多會導致骨質疏鬆?