想請問一下 生物信息和大數據可視化 兩個方向哪個前景更好?求具體分析,謝謝啦~
生物信息VS大數據可視化
從去年起,生物信息行業開始活躍,生物信息工程師平均工資開始快速上升。此前10年瀰漫的失敗主義氣氛逐漸扭轉。
這主要因為中美兩國終於向基因測序技術發放了醫療應用的牌照。從人類基因組計劃開始,科學界十幾年的積累,終於能看到應用落地。隨之而來的是投資和創業風起雲湧。這一兩年新創建的基因測序領域的創業公司有上百家吧。
我個人在阿里上市前夕放棄了很多股票跳出來,就是為了趕上這波創業機會。涉及真金白銀的選擇,是不是更有說服力一些?
歡迎給我的公司投簡歷,GeneDock是一個基因數據云服務。你可以來做生物信息大數據可視化,例如基因瀏覽器。JD參考 https://genedock.com/joinus/不要選生信,雲平台再進化一下硬體配置開按需收費,就是行業大換血的時候了:IT人員替代生信人員,並且IT主要集中在運維和前端。初創公司短期內要做個大幅超越開源實現(e.g. Chipster )的平台不太現實的。當然,國內依舊有一部分客戶會繼續交智商稅的,但想做大是挺難了。
大數據可視化應該至少不會像前者那麼「傻」,有一堆免費勞動力直接開源解決方案的。
還有想指望生信錢途的,吾有一招:
先學如何淘寶開店(電商的概念有了!),然後:XX元代建按需收費生信分析雲平台(大數據!雲分析的概念有了!)。付款後,用腳本拷貝個docker鏡像上雲(虛擬容器概念有了!),然後自動發送管理員帳號密碼(O2O概念有了!)。這個絕對互聯網思維!
好了,現在就差投資人的錢了!二更:
感謝@Tang Boyun關於「生物信息雲平台」的補充。確實,NIH已經有項目,專門支持雲平台的發展NCI Cancer Genomics Cloud Pilots,而且國外也有很多雲平台的公司,如DNAnexus,確實是未來的趨勢。但是,我覺得如果走學術道路,應該是不會受太大影響的吧。哈哈。==================================
很抱歉對於「大數據可視化」不是非常了解,只談一下生物信息的發展前景:
如果題主想走學術道路或者以後出國的話,生物信息還是很好的方向的。由於生物學數據量越來越大(尤其是基因組數據),大學、研究機構、大的藥廠都需要生物信息學方面的人才。
相關1:An Explosion Of Bioinformatics Careers相關2:國外的生物信息學相關的公司:http://grouthbio.com/Genome_Software_Service.php如果題主主要想找一份穩定的工作(還要賺錢),尤其是在國內的話:生物測序公司謀一份生物信息的工作還是比較容易的,但是薪資遠不如IT(什麼20k之類的)。主要的工作就是利用開源的軟體(都是別人寫的),按照已有的流程處理一下數據。
相關1:國內生物信息學領域或基因組測序相關的創業公司有哪些,其主營業務分別是什麼? - 創業項目不足之處,望輕噴。『小明選擇了生物信息,小紅選擇了大數據可視化,他們都有光明的前途。』
生物信息已經是一個很大的學科了,從建模、演算法、機器學習、系統開發等等。本質上是為生命科學服務的信息技術,強調計算機、數學、統計等等方面的能力。
大數據可視化,不再是傳統的畫個圖什麼的。複雜的大數據的可視化一樣涉及到到很多演算法和數據分析的事情,最終的可視化的優劣還會被作者的審美水平影響——沒有一點藝術細胞是做不好數據可視化的。
地雷說的生物信息的薪酬增長情況很真實。我們剛剛招的2015年應屆畢業生,比較優秀的,基本薪酬是15K。可能跟好的互聯網公司還有差距,但這個差距縮小得很快。
總結,我的建議是如果樓主沒什麼藝術細胞,動手能力不錯,大學數學和統計學沒荒廢的話,就選生物信息吧,IT背景的生物信息還是挺有錢途的,要Offer請發私信給我。這位題主,你以為我們作生物信息的,就不需要玩大數據可視化那套東西了?
大數據可視化技術含量要比生物信息高多了,那些不懂的就不要說話了。
生物信息這個圈子怎麼了,今年趁著泡沫拿到點投資就覺得自己是個興盛行業了。
wegene 和genedock 已經算行業頂級了,才能給一個應屆畢業生15K的月薪。
當年地理信息怎麼死的都沒人記得了。
首先可視化這個領域就有很多東西可以做,保證永遠有飯吃,可以鋪條前端的路走。
前端是整個IT行業變化最大,變幻最快,當然總要學新東西,但是工資從來沒低過。大數據一般都是企業以及互聯網公司的用戶交易數據。
你摸清這些數據的原委,你對企業的架構運作,以及用戶的需求分析都了如指掌,很多CEO都是從數據分析崗位走出去的。很多都走入的管理層。
因為你對企業很熟悉啊,你對這數據摸得清楚,你對這世界上最賺錢的企業了解他整個運作的模式,這意味著什麼?這意味著你的工資也不會少。
大數據分析接觸的都是高層,直接參与大公司決策,見識和廣度遠超技術本身。
何況這技術含量無比的高呢。
生物信息是小樣本大數據,也就是一個人產生很多數據,但是數據份數很少,現在千人基因組計劃才完成。
大數據動輒百萬,千萬 人口的數據,這裡邊可以挖掘的東西,可以挖掘的太多了。
我徒弟之前在某閱讀軟體公司用hive 做數據分析,曾做到公司每天收入增加一萬元,你玩生物信息玩到下輩子也沒有這種機會。
當然如果genedock 和 wegene 給你offer 你可以優先考慮,其他公司就算了。
這兩家公司都是很不錯的,靠譜公司,要技術有技術,要逼格有逼格,要文化有文化,還能碰觸生命的奧秘。至於其他offer還是優先大數據可視化吧。所謂大數據可視化是以我司為代表的一批廠商忽悠出來的概念,所謂技術和藝術的融合混搭,其實沒有融合只是混搭,就是找一些水平較高的視覺設計師,用點圖形學技術,把傳統的數據驅動的儀錶板做個看起來高端的包裝。你說它有價值吧也有一點,但基本上還是浮在表面,很難深入下去。
現在我司自己都不提可視化了,覺得價值感不夠,也不容易掙大錢。
最後,放我司基因可視化app畫面鎮樓,核心代碼是我自己寫的,毋庸諱言,這是對mygenome的赤裸裸抄襲。我是用機器學習演算法做疾病基因層面的分析的。。現在的情況是,確實越來越多的臨床應用,檢測手法正在被演算法取代(因為信息多,精度高)而且這個趨勢勢必會越來越旺盛。但是這畢竟不是互聯網應用,涉及到生命安全的問題,什麼時候能完全臨床還是個未知數。我自己也是很有體會的,就拿設計機器學習演算法來說,演算法不僅要效果好,穩定(不受數據variance影響),可重複,還要具有生物可解釋性。整個過程下來,大部分時間不是在修改模型,而是在設計實驗測試模型。
可視化是完全工程的事,只要樓主有興趣,做這個當然也不錯,也會很有前景。
從人生的角度,如果樓主要做生物信息的話,需要學非常多跨領域的東西(生物,醫學,數學,統計,計算機)。一開始很痛苦,慢慢就會覺得很刺激。這種刺激感和跨領域的訓練會讓你看很多問題都有思路。最後你收穫的成功可能遠比做可視化來的豐富。
負責過互聯網公司數據團隊,個人認為「大數據可視化」偏細分技巧,典型的中型及以下互聯網公司不會有很多這類型職位需求。但是做標準的數據分析師,恰巧在「大數據」、可視化方面稍熟練,倒是快速接觸業務核心的不錯路徑。
21世紀是生物的世紀,這句話本身才是20世紀最大的謊言。。
題主說的大數據可視化也是指生物數據吧,生物信息包含的面挺廣的,光我們實驗室有做高通量測序數據比對,變異檢測,基因組瀏覽器開發方向,當然現階段還是以發paper為主,沒有應用到產業上。如果想搞學術的話,生物信息還是不錯的,不過近幾年bioinformatics,NAR等期刊上面中國人灌水嚴重,需要甄別工作的優劣。如果想工作,能熟練掌握應用數據可視化的技術,不光是生物信息方向,其他領域也是需要這種技能的,能有個不錯的錢途。
題主你看到這麼短時間就有人在回答中提供生物信息的實習或者offer,你應該知道選擇什麼吧。
作為一個在生物信息學裡做大數據可視化的人表示,這兩者沒有分的這麼清楚所以並不是看它們誰火選哪一個,而是看哪一個能給你提供更好的背景比如如果你留學,選生物信息學能申到好學校,而申大數據可視化只能申到一百本,那當然選生物信息學再比如你在選工作,如果選大數據可視化能在好地方工作,而生物信息學只能去名不見經傳的地方,那當然是大數據可視化
做到現在來看基本上生信分析最大的瓶頸在性能 最簡單的 blast 數據量稍微大一些的話 必須採用分散式計算(據說還有gpu加速的辦法?) 接受正常的生信教育的人幾乎不可能有能力做這個 所以我覺得搞可視化會好一些?
推薦閱讀:
※像DCCI、艾瑞這種偏互聯網的數據分析的公司還有哪些?這類公司的分析師的發展如何?
※c/c++ 有哪些數據可視化類庫?
※針對繪圖方面的需求,matlab、python和R哪個更加強大?
※數據可視化未來的主要應用會是什麼?
※如何指定matplotlib輸出圖片的尺寸?