生物信息行業應該具備哪些基礎素養?重點應該放在計算機方面還是生物方面或者說其他?


幾年前在博客上寫過一個對生物信息學家介紹的讀後感,可以大體說說我對這個問題的看法。拋磚引玉:

從文中對生物信息學的貢獻方式上,我這裡試著把他們的貢獻分為三種方式:理論生物信息學家,應用生物信息學家,整合生物信息學家。

理論生物信息學家的工作,如Karp、Shamir,他們往往是其它領域中著名科學家,把其他學科科學中成熟或新發展的方法引入生物信息學,解決生物問題,其研究範式多是「有解答後尋找生物問題。」,由於演算法和其它數理方法的一般性和通用性,如果「理解要解決的生物問題」,往往能使生物信息學方法學有突破進展。

應用生物信息學家的工作,如Doolittle,他們往往是生物學方面的專家,只是從數理、信息學領域中成熟的方法引入生物信息學研究,其研究範式是「生物問題尋找答案」,也就是大家常說的「干實驗」。特別在現代,生物信息學資料庫、軟體和網站幫助生物學家通過生物信息學的方法解決他們的問題,這樣的生物信息學家在廣大的生物實驗室中有很大的需求。

整合生物信息學家的工作,如Haussler,他們把其他領域的方法和生物領域的問題整合起來,編製軟體、資料庫和網站為生物學家提供數據挖掘的數據源和平台,諸如Haussler「里程碑式的成功」的人類基因組瀏覽系統。現在是生物信息學的軟體、資料庫和伺服器大量湧現的時代,在軟體整合和數據分析相結合的工作,更是現在許多生物信息學研究中所必須要做的事情。

當然上面的分類是非常粗粒度的,真正的生物信息研究多包括了理論探索,方法、數據和軟體整合,應用於生物學實例,並最終由生物實驗進行驗證,如Miller在序列聯配中用生物信息學推動生物發現的工作。特別要說是,在生物信息學相對成熟的今天,如果沒有實驗的驗證工作,在當前的生物信息研究中很難發表很好的文章。

原文鏈接:科學網—介紹國外幾位生物信息學家(10)~~譯後感


我自己覺得生物信息學對計算機的要求其實不算很高,只要能實現你想要乾的事情就行了。更關鍵的還是在解決生物學問題上。


生物信息是一個很大的領域,不同領域側重面不同,

最常見的是應用生物信息,就是從具體的生物問題出發,採用一系列軟體、資料庫,從宏觀上理解生物學(比如各種組學),這一塊的最重要的當然是生物,計算機方面會一個腳本語言再加個統計語言就可以了,一般是perl/python和R。

其他領域如生物信息軟體/網站開發的,自然是計算機編程最重要;建模與統計基因組等大數據的,自然是數學和統計最重要;還有專門研究演算法的,雖然也是計算機,但更側重演算法設計,理論性更強,很多做這行的小夥伴入行時甚至連DNA是啥都不知道


來自《生物信息學中的計算機技術 (豆瓣)》


推薦閱讀:

生物專業如何從零信息學基礎開始自學生物信息學?
本人是學生物的,涉及到生物信息,主要是基因組,轉錄組分析,請問該如何去有效的去學習python呢?
Spark 對於生物大數據分析來講有什麼缺點和不足?
生物信息學商業應用可能在10年內實現么?
mRNA-seq技術能篩除掉Pol II 轉錄的其他非編碼RNA嗎?

TAG:生物學 | 生物信息學 |