求教!壓力大!我該如何進入生物物理學(RNA/蛋白質摺疊)研究大門?

本人研一,專業方向是生物物理學,導師給我們的課題是蛋白質/RNA摺疊問題研究。但是讀了半年,我感覺真的一無所獲,我不知道該如何踏入這一領域的大門,非常鬱悶,也感到壓力特別大,希望有相關研究經歷的師兄師姐們為我指一個方向。

我特別想知道以下問題:

1.有什麼好的研究論壇(像小木蟲),如何利用

2.應該讀什麼樣的期刊論文,怎麼讀

3.需要有哪些基礎(計算機方面,因為我們主要需要模擬)

4.規劃和就業前景


如何入門?最快學習protein/RNA folding計算模擬的,我首推眾包遊戲:

protein folding,Foldit,傳送門:Science Chat: Next Week!

RNA folding,Eterna,傳送門:Eterna - Invent Medicine.

這兩個有些都是解puzzle的闖關模式,可玩性還是很高的。註冊個號,玩一玩,會對folding有第一手把握的直觀感受。

除此之外,兩個遊戲都有論壇平台,上面有很多review式的文章,也可以學到很多。

正式入門的話,最快還是有人帶著做項目。看書是輔助的系統學習,而不是最有效。

計算基礎,圈內很多程序都是用python。所以學python非常有幫助的。一點不懂(如當年的我)還是超級頭大的。

就業前景?——非大牛實驗室,進工業界或徹底轉行,有python和可視化的底子,比其他學生物的容易多了。

@Shi Hu答案挺不錯的。但是對RNA folding的複雜度描述我個人不是很同意,給些補充觀點——總的來說,RNA folding其實是超級複雜,神坑慎入:

@Shi Hu說做RNA folding prediction的lab相對於protein比較少,這是的確是現狀。

然而這不是因為RNA folding主要集中在二級結構,相對簡單。其實恰恰相反,原因是RNA folding prediction的演算法至今尚且解決不了二級結構,遑論三級結構預測。而RNA NMR也好,結晶X-ray也好,高通量probing也好,測個結構so easy,計算的發展遠遠落後於實驗,這是做的人少的本質原因。

RNA「secondary structure 往往能夠代表tertiary structure的大部分特徵」的觀點我是不同意的。的確,RNA的二級結構比蛋白的二級結構包含更多的結構信息。但是只有二級結構如果用來做藥物篩選,對接等計算還是遠遠不夠的。從二級結構到三級結構,我之前看過很多的riboswitch的預測,和實驗結果比正確率都很低,有的錯得離譜,估計平均正確率不足20%。

理論上,RNA相比protein的三級結構複雜度相當甚至更高,protein有很強的碳平面夾角限制,RNA的骨架的constrain卻要更少。而且RNA的結構都是由比較弱的力決定的,實際運算中,自由能landscape梯度低,很多好演算法都特別慢,而且局部最優點多,貪心演算法特別容易不靠譜,沒有實驗數據做input,十個預測九個錯。而且RNA動態非常高,對於環境很敏感。而做計算預測的,最怕就是對環境敏感,無數的水分子、各種離子、小分子飄來飄去,想想就頭大。

二級結構的複雜度一定比三級結構低,所以無論RNA還是protein,都是在二級結構確定的基礎上做三級結構預測。

protein的二級結構預測可以說是個已經解決的問題,由於和序列相關性高度保守,認motif就很有效了。

RNA的二級結構研究歷史可能更長,但是直到現在也沒解決。

隨便來一個結構就能給出N個可能序列,保守性低的很,只能從頭預測。其實互補配對的原理很簡單,所以演算法早就有了,就差一組能量描述參數。但是對於RNA來講,這組參數並不是來一組常數就能解決的了。不同生理環境、不同RNA丰度,參數都不一樣。未來如果有了非常大的資料庫,通過machine learning也許能解決。RNA可以形成假結(pseudoknot),二級結構的搜索空間幾乎是純排列組合了,複雜度一下就上了好幾個檔次;就算是protein三級機構預測搜索空間都小的多。

目前的現狀是,體外RNA二級結構的預測,仍然很差。最好的結果——核糖體5SRNA,丰度很高,夠保守,結構超級穩定,目前的最好演算法正確率只有47+%(相比之下,Baker Lab從零「設計」蛋白,都有近60%的可靠性了)。最差的結果——很多抗性基因相關RNA,實驗測出來的結構,是我們演算法不可能給出的結構。

對其他答案做一些反駁:

這個領域過時了——並沒有。基於蛋白或RNA靶點的大規模藥物開發(基本上就是目前大企業大多數的藥物開發)都需要計算結構的幫助。但是和癌症,衰老這些比體量肯定差遠了

「量子時代」——這是另一門學科叫量子生物學,不是民科,早已有之。

「從量子力學開始學起。」——不需要,拿了炸藥獎的分子動力學就是為了從量子力學的神坑中解放人類的。

按照題主描述的方向主要是計算模擬方向的,應該是計算結構生物學。這是我學生物以來上的第一門課。做過的所有project都是RNA structure相關,collaborator也是計算結構的一線研究者。反正秋天到了又要開工了,乾脆取匿了(並沒有什麼邏輯)。


謝邀吧。。

1. 論壇不知道,沒用過。

2. 剛開始的時候不應該是老闆給論文讀的么。。。沒有的話就找跟自己專業相關的,通過關鍵字搜索,大的方向么有protein design啊,folding啊,molecular dynamics也是要看的。先從綜述開始,通過參考文獻一點點找相關領域的文章,從引用較多,比較有名的大組的文章開始看起。至於讀法嘛,不知道你的背景,現在在哪裡讀書,但是盡量還是讀英文文獻,開始的時候,慢慢一點點摳吧,一個禮拜精讀個五篇文章,過半年就好了=。=

3. 做計算嘛當然要懂點編程了=。=不了解你的背景,但是基本上linux要會用,shell script要熟練,編程語言要學一點,不一定能寫多複雜的東西,但是讀代碼最好能讀懂,從我的角度來看,真正要掌握各種軟體的用法,最好能知道這個軟體的工作原理,對於做實驗和以後實驗當中troubleshooting非常有幫助,data processing也要了解一些,我一般用python,matlab應該也可以。

4. 沒畢業,不知道,美國的話么要麼博後要麼改行咯╮(╯-╰)╭


謝邀。

好吧,我大學的時候搞過一陣子RNA摺疊的研究。蛋白質摺疊不是特別清楚。

&RNA摺疊問題一般來說都是secondary structure, 因為由於RNA分子的特性,secondary structure 往往能夠代表tertiary structure的大部分特徵。也正因為如此,從理論上來講,RNA摺疊相比蛋白質摺疊其實是一個相對比較「簡單"的問題。但也有自己的難點。& 相比蛋白質摺疊,做RNA摺疊的人也比較少。(關於RNA摺疊這一段我講的不準確, 有一位匿名回答的朋友回答的很好, 請看求教!壓力大!我該如何進入生物物理學(RNA/蛋白質摺疊)研究大門? - 匿名用戶的回答)

RNA摺疊是很老的話題,至少幾十年歷史了。你既然本科是物理專業,就先去學習RNA和蛋白質的相關知識;關於RNA在生物中的功能作用,和它的合成和反應,可以讓學生物的人系統介紹一下。至於RNA本身,如果要搞RNA folding,各種核苷酸的結構,RNA二級結構的各種基礎機構,各種bond的特徵等等,都要知道。生物信息相關的教材裡面,也有不少會談RNA folding,很多都有基礎介紹的。教材相關的篇章讀完了,再去網上搜slides,不少大學開的課裡面,會有一到兩節課是講這個的。看完了有了基礎概念了以後,再去期刊找綜述呀。Review什麼的搜一下很快就出來了。遇到每個approach的,都讀一下關鍵paper。等你差不多都讀完了,就入門了。搞RNA folding的lab全球範圍內都少,比起其他領域,閱讀量是要少很多的,不要偷懶了。

計算機基礎方面,我覺得你應該去問你lab裡面的學長(假設你lab裡面的人也是做模擬的)。RNA摺疊的論文裡面,如果有軟體,通常網上也都能夠下載。可以拿來參考。

規劃和就業前景?做教授。(好在RNA folding這塊做的人實在比較少,或許會有優勢?)


多聽組會,組會認真聽,思考,別光玩手機。組會能快速了解別人做的工作,比讀文獻快速有效。

上小木蟲問還不如先問自己的學長,專業上下就那麼點人,學長即使長著一張面癱臉還是願意給你回答一下的,只要問題不太蠢。

計算機基礎其實沒有太多的要求,畢竟我們還是做物理的。會點語言,會用腳本處理數據,會些shell命令(這玩意能極大提高效率),其實就差不多了。更多的比如說會點mpi也是不錯的,但不能忘了本,我們是做物理的,還是要以物理為本,不可本末倒置。

以蛋白質的模擬為例,如果你怎麼調參數都調不出心中預期的結果,在罵「這什麼破軟體」之前,先想想自己對體系的考慮是否周全,有沒什麼東西漏了,比如漏考慮二硫鍵什麼的。軟體那麼多人用,bug不是那麼容易遇到的。


看你要做到什麼水平,以後幹什麼,做這個很苦悶,天天一種自己智商欠費的感覺,最好是學物理的來做,學生物的沒戲,我一個學化學的之前自以為可以,結果還是沒戲,不過你學物理還天資好我勸你趁早轉行,干點什麼不好呢,當然如果你是富二代那單說,你愛幹嘛幹嘛


希望你補充以下信息:

1,本科知識儲備(跟目前課題方向有關)(物理還是化學還是生物本科);

2,到底是做RNA還是蛋白質,有什麼實驗技術(核酸摺疊跟蛋白質摺疊技術很不同);

3,模擬的話是什麼模擬方式(Coarse Grain? Ab initio?)。


結構生物學的本質,蛋白的三級結構的本質其實還是化學,再深入涉及到物理層面。

首先你要理解以上問題。有時間可以看一下施一公的一個演講《打破科學界限》。

然後簡單回答你的問題:

1.論壇的話,基本沒什麼用,基礎知識需要自己去學。首先至少你要對20種氨基酸的長什麼樣,物理化學性質,側鏈性質要很清楚吧。比如那些氨基酸組合能形成螺旋等等。

2.文章可以先看一下國內的一些核心期刊,雖然都是垃圾文章,但能從概念層面上對你的研究方向有個大概的了解。sci看一些諸如 J. Struct. Biol,Journal of Computational Chemistry之類的文章。

3.如果你做分子動力學之類的,沒有計算機背景的話可以從教程上入手,多練習一下。有疑問的細節再去從根源上搞清楚。其他的跟計算機基礎相關性不大。

4.如果你的老闆很牛,那你就繼續讀下去做科研吧。如果老闆都憋不出點東西來,趁早轉行吧,這行除了生物信息分析之外,現在來看沒有前途,就業崗位匱乏。

當然你也有可能是這方面的天才,另當別論。


LZ的問題描述有點太寬泛了:「蛋白/RNA摺疊」——這個底下都不知道能分多少個領域。LZ提到了主要是做模擬,目前比較流行的就是MD和MC了。

其個人認為如果研究摺疊的話,無論是做實驗還是做計算,統計物理和高分子物理必須都有足夠的基礎。其實如果想更深涉獵摺疊方向,計算是不夠的。想要看懂相關的文章,對於一些實驗技術也要有一定的認識。一些很基本的技術的用法和原理,比如CD必須要掌握。如果可行的話,最好接觸一些蛋白NMR,晶體學的知識。單分子是之前一段時間做蛋白摺疊的主要手段之一,隨著激光技術的發展這部分的進展極快,但諸如單分子FRET,光鉗等技術,作為10-15年前比較先進,目前比較流行的手段,是應該掌握其原理和應用方法的。

回到計算部分,入門的最好方法其實是各個軟體的Manual和Tutorial。這些基本是免費的。其實我之前問過一個很相關的問題:求推薦分子動力學模擬的入門書籍? - 計算化學

我覺得幾個回答都不錯,應該對LZ有些幫助。

論壇什麼的,平時用的不多,我覺得入門的話主要還是靠看書,看paper以及和實驗室的高年級同學交流,這樣上手比較快。Paper的話Journal of Computational Chemistry, Biophysical Journal, Journal of Physical Chemistry A/B/C/Letter(我記得B是計算比較多的?記不清了)算是除去Cell Nature Science JACS這些綜合期刊以外比較需要關注的。Biochemistry上也經常會有Simulation相關的文章。

至於就業——看你才研一,如果擔心就業的話,還是早早學編程準備轉行吧;難得沒有跳實驗坑,墜落的不深,趕快趁早出坑。→__→


NCBI一本滿足


從量子力學開始學起。


推薦閱讀:

如何看待《2017生物信息工程師薪資調研》的結果?
從華大基因出來的人都去做什麼了?
如何看待「中國十萬人基因組計劃」?
請問現在三代測序的reads用什麼比對?
本科生物專業,打算申請美國生物信息學研究生,期間多學習計算機知識,畢業後在美國找CS工作,靠譜嗎?

TAG:生物信息學 | 生物化學 | RNA | 蛋白質結構 | 生物物理學Biophysics |