如果打算使用生物信息學軟體處理數據,是裝個linux系統方便,還是直接使用mac os方便? ?
01-12
- Linux可以裝在大部分機器上,Mac OS X必須要蘋果自己的機器。黑蘋果非常難配。
- 我感覺Linux各個桌面的命令行終端都比蘋果自帶的那個要好用。
- 儘管理論上Linux只是POSIX-like的,但其實Linux的根目錄文件夾布局更類似傳統的Unix,而Mac OS X的比較奇怪。
不知道題主說的「生物信息學軟體」到底是哪些軟體,如果是一些Windows平台專有的軟體的話,無論是Linux還是OS X你都不能選,只會給自己添麻煩。操作系統不重要,它只是個讓你舒適的使用應用軟體的媒介,如果你的專業對Windows平台上的軟體有很強的依賴性的話,無論Linux和OS X多好,都不適合你。
看題主的意思是手邊已經有Mac的,那麼可以直接使用Mac OS。大部分程序Linux和Mac都可以用,命令行有一些不同。先通過一個個項目學起來,慢慢哪個更適合你就有自己的判斷。
我在PC上搗鼓過ubuntu fedora centOS等幾個發行版Linux,最終穩定在Mac上了,所以既然你都已經有Mac,那麼建議是,別糾結,直接開干吧mac os要花錢買蘋果,linux可以裝載任何電腦上。而且linux不要錢,所以還是裝linux吧。
自己買機器,就直接買 Mac
設計演算法的時候,可以先在自己的電腦上用較小數據量驗證。Mac 的命令行環境跟 Linux 的高度兼容的,Python 和 Perl 之類的也都是兼容的。設計完成之後把程序和數據放在伺服器上跑,伺服器一般是硬體性能較好的 Linux 環境,可以無縫直接運行。
第一,大部分工具貌似都是linux專有的或者在linux下開發的,在linux上運行有很多優勢。另外,你確定你不需要上伺服器?你確定現在動輒幾十上百G的數據量用你本地能搞得定?一旦上了伺服器你認為你還有選擇嗎?你要是實在吃不準就VM各裝一個試一下。第二,為什麼一定要糾結於工具?工具只是一個讓你愉快的在其中工作的平台罷了。我和同志們聊天的時候最經常聽到的是某某好牛逼啊,又會用這個又會用那個,又會這種語言又會那種語言。但很少聽人談論某人有啥牛叉的想法,提出了一個有意思的問題等等。似乎生物信息的人都在修自己的工具。但我認為秀工具是最Low的,畢竟搞的是生物,總扯些和生物無關的東西實在沒啥意思。呃,抱歉扯遠了,就醬吧。
首先,小弟的立場是利用Mac OS X 做生物信息分析十分合適。
我們先了解一下生物信息分析所用到的軟體:
- 幾乎所有的生物信息分析軟體都是針對linux系統進行開發的。這是因為生物數據較大,對處理性能要求遠遠大於UI操作需求。目前超級計算機排行榜中絕大多數是安裝linux系統(請參考http://top500.org)。
- 目前生物軟體可以分為兩類:一類基於C/C++/D語言開發的高性能處理軟體,如比對,組裝;另一類是基於java開發的對性能要求不是很迫切的通用處理工具,如call 變異和QC。第一類軟體如BWA,bowtie,tophat,SOAP系列,blast/blat等等,「必須」安裝在*nix系統下,裝在window下純粹找虐。第二類軟體如GATK,picard,各種viewer等等,天生跨平台因此不必考慮系統的影響。
- 其餘基於perl,python等腳本開發處理程序多是簡單的文本查找和數據條目匹配,像這些高級語言一般對系統要求不多,盡量可以滿足在不同操作環境下的兼容。但是腳本語言的包含著大量的擴展包,如bioperl,biopython,bioconductor等則對系統存在要求,主要體現在文件管理系統和動態庫調用方面。
我們在看看mac系統的一些特點:
- 界面精美,屏幕一流。無論是看文獻還是看代碼,都甩其他品牌幾條街。做生物信息就是看文獻+寫代碼。你看看retina屏幕,再看看街機的屏幕就知道差別在哪裡了。哪怕是同樣的java軟體,在mac下面的界面也遠遠好看過在其他系統上的表現(偏主觀?)。
- 相對於windows系統,mac系統更簡單高效。不用安裝殺毒軟體,搞一堆配置,出了問題就束手無策,動不動就重裝系統什麼亂七八糟的。相對於linux系統,配置簡單,高質量的程序特別多。舉幾個簡單的例子,mac系統的office、PDF閱讀器以及國人最常用的QQ軟體是linux系統用戶痛。當然liunx系統非常優秀,如果沒有條件上mac的建議儘早換裝linux。做生物信息除了天天搞大數據外,零散的小數據,excel表格什麼的也會經常遇到,如醫生提供的樣品信息表型等等。不要說linux下面的什麼libreoffice/openoffice多優秀什麼的,你用用mac下的office吧(當然linux下的wps也是不錯的)。
- 性價比高。雖然我們討論的是系統,但平心而論,與相同價格mac機相同配置的其他品牌電腦價格都多少會高於mac。不信去看看thinkpad W系列或者配固態硬碟的T系列。
- 眾所周知,linux的精髓在於Gnu軟體+高穩定性。Mac OSX 下的brew等軟體管理系統可以使你的mac安裝gnu的所有軟體。而高穩定性的秘訣就是少往系統文件裡面寫東西,這一點上mac和linux是一致的。所以可以這麼「武斷」地說,mac os x = linux + mac的高質量軟體。而剛剛提到的生物信息分析需要用到的軟體,在linux下可以用的,在mac osx下也都可以用!mac osx的文件系統和linux幾乎一致。
- 續航能力。個人認為這是最重要的一點。想像一下當你正在跟領導開會時,領導突然有個idea,你打算實現時,電腦沒電了。然後灰溜溜的對領導說,「等我下去試試看先」。當你坐在機場了等待飛機時,打開你的macbook pro,寫了幾百行代碼,隔壁的美女做到你的旁邊投來好奇的目光時,是種什麼感受。。。
綜上所述,對於應對像生物信息系這種高度綜合的工作,必須有一台像macbook pro這樣的優秀生產力工具才能夠屹立不倒,力挽狂瀾!
當然是Linux方便,mac(曾經花了一周時間改裝上一小時就刪了)不了解,Linux下面很多工具可以處理生物信息,awk sed這兩個是常用的,還有一些命令,比如grep之類,然後是文本處理語言使用非常頻繁而且用處很大,比如perl之類,shell腳本是必須精通的,還有正則表達式必須當一門學科來學習,當然還有Linux的高效和穩定性,生物信息隨隨便便就以g計算的文檔,命令行處理非常穩定,相比之下Windows簡直弱爆了,各種軟體配置起來很啰嗦,而且打開個文件不死機就萬幸了。另外成本上和實用上考量,老古董的個人電腦,幾千的新機器,還是幾十萬上百萬的伺服器,Linux都支持,mac應該做不到吧
感覺都一樣,把項目放虛擬機里,一個項目一個虛擬機,免得各種環境配置搞亂了。虛擬機里推薦linux,mac太大了主機系統無所謂,mac的話鍵位略蛋疼
都挺方便的
先看軟體對系統的要求,不支持mac就沒辦法。都支持的話:最方便的當然是linux,但是看你要分析的數據量,小的話直接在mac上處理。linux不太適合平時辦公使用。
輕活本地各種Macbook跑跑沒問題,重活還是扔給linux伺服器吧,遠程桌面+dropbox。當然壕的話上MacPro也沒問題,用到的各種環境基本OSX下都可以滿足。
推薦閱讀:
※怎麼解釋蜜蜂和菌落不懂數學卻能做出比人類還要完美的事情?
※生物信息學領域有哪些正在進行或將要進行的重要計算?
※美國生物信息學方面大牛博導有哪些?
※北大生科院生物信息有哪些不push的導師呢?
※生物信息雲分析平台,哪家做得好?求推薦