標籤:

自學生物信息學是種怎樣的體驗?

你是如何在一個傳統生物實驗室自學生物信息學的


謝邀。自學過,放棄了。

如果是讀完博士後不做學術的話,不要做不是自己實驗室擅長的東西。沒有明顯收益而且非常浪費時間。當然想轉量化的除外。但量化和生信還是有很大不同的。收益上來說不如自學量化。

總的來說在傳統生物學實驗室自學生信的體驗就是低效率且無收益,已經及時止損。


謝邀。

既然是在傳統生物學實驗室,建議先找到一批實驗與計算相結合的文章,自己死磕計算部分(這個很難,很痛苦,要有心理準備)。

掌握了以上範例中的計算方法,可以應用到現在實驗室的實驗結果當中,提升論文檔次。

這樣做的好處是:(1)實驗室和你自己都得利,通常領導不會阻攔;(2)剛學會的計算方法,馬上就有實際操作的機會。

以此作為起步階段的策略,以後再慢慢拓寬加深,循序漸進。

但仍然會很難……祝你好運!


歡迎私信交流哈

-----------

背景……本科大四,純生物科學專業,本科四年只有一門生信相關課程,全系只有一個生物信息方向教授……大三第二學期末時深感讀生物科學救不了中國人於是拜此教授門下……就走上了這條不歸路。總的來說九成是靠自學,學習資料以Coursera和Edx兩平台的網課為主,課程來源於約翰霍普金斯和哈佛,末尾會附上部分鏈接。

入門是從R開始的,網上下載了《An Introduction of R》(Venables et.al, 2013)這本書的電子版,不細看文字內容,把代碼一行一行複製到RStudio里去跑,大概花了一天半的時間。之後嘗試寫了個套用多個loops、現在看來時間複雜度上天的function,數據來源是老爸單位油氣儲運數據……就算是啟蒙了。

隨後修了兩門網課,分別關於R和數據處理,就直接參与了導師所帶博士生的project,建一個基於網站的mRNA甲基化目標資料庫,數據分析處理由學長完成,我負責以R中的Shiny為底層的站點,包括sever和ui,算是個"Non-bioinformatics"的工作。耗時半個月完成主體,隨後一直在漫無天日的debug、優化中,最近寫好了paper年前投出吧,目標《Bioinformatics》...

與此同時網課的學習也沒有停,Bioconductor、統計知識、Bash入門、Perl入門等等等等......通過閱讀文獻學習MeRIP等各種技術......目前在進行的是畢業課題,主要分析一去甲基化酶的位點功能等等,基本接近尾聲。未來美帝讀研,目前已經拿到offer,所以基本處於無憂無慮的生活中……

沒有寫特別細,一個主要觀點就是生物信息、生物統計以及計算生物學的學習離不開實踐,看五個小時的文獻還不如坐下來敲一小時代碼,往往一個項目走下來就會發現提升一大截……

暫時寫這麼多吧,想到什麼再回來……

R:

R Programming - Johns Hopkins University | Coursera

Statistics and R

Linear Models and Matrix Algebra:

PH525.2x Course Info | edX

Data processing:

Exploratory Data Analysis - Johns Hopkins University | Coursera

Statistical inference:

Statistical Inference - Johns Hopkins University | Coursera


自學點啥不好.....


謝邀。

生物信息專業所以不是自學。不是很懂生信,被課題組學長批評為沒有生物信息學思想。

所以實在無從回答。

占坑


我覺得生物信息和統計挺有用的,有興趣的話可以自學試試。

我博士的實驗室是做傳統生物的(神經方向)。我加入的時候實驗室剛剛開始做一些RNA-Seq,實驗室中沒有人有生物信息背景和經驗。老闆非常聰明和開明,生物的直覺非常好,對生物信息和統計感興趣,但是沒有任何基礎。我大概在三年級的時候對生物信息和統計感興趣,當時學校正好有生物信息的certificate program 和統計學的concurrent master program,所以去修了這兩個項目。雖然佔用很多時間,但是老闆很支持,還幫忙設計了一些需要測序的大小課題,其中一個最後變成了我主要的發表論文。畢業之後我在生物製藥行業做data scientist,所以算是轉成全職做生物信息和統計的了。我畢業之前也申請了一些做生物信息/統計方法的實驗室的博後位置,無一成功,所以我的水平不足以在學術界做生物信息。

在傳統生物實驗室開始做生物信息,一個主要問題是沒有人教。這個問題我當時主要靠上課彌補,加上做課題的時候自己摸索。現在想起來,在一個傳統生物實驗室學生物信息,如果能系統地上課(帶一些強迫性,比如不把規定的課修完就拿不到certificate),和能做一些需要用到生物信息的課題(現在測序什麼的一般實驗室都能做,難的是設計一個有意義的並用到生物信息的課題,這需要跟老闆仔細討論),應該會對學習有很大促進。不過實驗室中沒有人可以請教這一點其實也有好處,你可以有機會做一些生信實驗室不是人人有機會做的事情,比如自己搭一個實驗室的小server,自己當administrator,自己寫pipeline,等等。

總之,我覺得在一個傳統生物實驗室自學生物信息是可行的,但是最後達到的水平跟科班出身的同學相比可能有差距。


考慮一下國內的一個論壇,生信技能樹,裡面有生信基本技能(統計,編程,生物)的知識點,小訓練,小項目,適合自己學習,不懂還能進群或者在論壇上提問。

如果英文可以的話,等有一點基礎去biostars看看別人整天在幹嘛。


根據個人經歷表示不適合在傳統生物學實驗室自學生物信息,首先沒有氛圍,遇到問題不知道問誰,即使學會了一些東西往往也被認為是工具或者輔助。我本科是學生物信息的,在傳統生物學實驗室待過半年,可能是由於本人沒學到家,還是離開去了一個純做計算的實驗室,不過也不排除有一些自學學得很好的師兄師姐。


人生突然豁然開朗,未來的路也多了很多


學過perl也學過R。

但是在實驗室沒有基礎的情況下,真的效率很低。

不過,至少現在可以把一些代碼稍微修改一下用在一些簡單的畫圖和計算上,但真的只是皮毛,一些大的分析還是交給生物公司,自己把更多的精力放在數據生物學意義的挖掘上。

如果你的實驗室沒有生信基礎,要麼帶著項目去一個合作的實驗室從頭開始學,要麼你把分析交給華大或各種華小,你負責鑒定分析結果的可靠性並挖掘其中的生物學意義。


如果做組學的的話,你需要把線性代數,概率論與數理統計,高等數學基礎弄明白了。然後選擇一個自己喜歡的語言,比如Python,C,學會基本語法。學會使用Google,Github,善於搜索和使用別人造好的輪子。自己也順便DIY一下自己需要的功能,比如畫個自己想要的圖啥的。等畢業論文查重查完了再分享一下近期的經驗。

人生苦短,我用Python_(:з」∠)_


先把生物思維換成機器思維。具體的分析結合生物思維。


推薦閱讀:

GWAS研究中樣本數量和結果真實有效性之間的關係是怎樣的?
作為一名對生命科學的興趣被逐漸耗盡的生物學學生,前路該何去何從?
生物信息學就業前景和生物信息學研究工作者的就業方向?
Google 的 Quantum Computing Playground 可以用來做什麼?
傳統生物專業的碩士生,怎麼通過自學轉行到生物信息學領域?

TAG:生物信息學 |