我們課題組想買伺服器跑生物信息學的數據,有必要嗎?
01-12
我們課題組都是很破爛的計算機,所以有時候一個數據要跑一個月。。想想就嚇人,所以想買幾萬塊的伺服器來跑,我想問下伺服器主攻方向好像不是跑數據?cpu是不是不強勁?因為我覺得伺服器優勢貌似都是大吞吐量的io?
還是買幾台性能強勁的計算機來跑數據比較合適呢?
建議你買一個。
伺服器不見得會讓你的程序跑得更快。但伺服器可以非常穩定地保證跑一個月不掛(有ECC校驗),台式機不太容易做到。
然後,伺服器通常有硬碟陣列,你將來數據多了就知道好處了。最後,伺服器好歹可以弄雙路的,而且E5 CPU的總計算能力還是強。如果你程序的並發程度高,提升還是會明顯的。特別是在你原來台式機很破的情況下。我們實驗室有倆戴爾的雙路2U伺服器,都配滿了硬碟或者掛了額外的陣列,每台在5W左右。如果你不配那麼多硬碟,價格可以便宜一半。伺服器的優勢是穩定性。
要提高性能,應當從優化軟體入手,增大並行計算量,充分利用計算機群和顯卡加速。對於要跑一個月才能出結果的程序,這不是可以簡單依靠硬體升級來獲得改善的。
優化這種事情,哪裡有通用解決方案呢?都是依照每個案例的特殊情況進行處理的。
說用GPU加速的,用超算來算的,都TM扯淡,憑這不過百字的問題描述就給別人開方子不是坑人是什麼?。一個問題本身難以並行計算,你買10000塊GPU,用天河來算也快不了。把預算的一半拿出來,找幾個有經驗,有實力的程序員來幫你們寫程序才是正道。否則憑這點錢,連個水花都砸不出來。
首先伺服器也有專門計算用的,我們院里就有一台浪潮的伺服器,分了七個計算節點來跑並行計算。
實話說,如果沒有專門的管理員,從搭建並行環境到寫並行程序一整個下來一般人搞不來的,這些活都是苦逼的It民工的幹活= =,而那些要跑程序的哥們,老師會分帳號給他們,讓他們自己傳程序上去跑。
所以,真的想花幾萬塊來解決這個問題的話,買伺服器明顯不是好主意。不知道題主具體跑的是什麼,所以也沒有辦法給出什麼具體的建議。恩,其實我真正想說的是,這點錢真的不夠好嘛,一台正兒八經的伺服器單單硬體都幾十萬,請個碼農寫程序一個月工資也不低,買國外的雲計算服務又不一定適用啊= =
苦逼的小管理員路過...
應該先確定性能的瓶頸,是浮點運算能力?內存?IO?再考慮軟體的限制。如果是商業軟體,它是否支持伺服器、集群?正版的話還要考慮授權的問題。自編程序的話,要考慮程序是否有能力擴展到多核、多CPU。
為什麼不考慮公共雲?
不知道GAE或者BAE能否滿足題主的需要
我覺得這種事情去問問老闆比來知乎提問好的多
為什麼自己買,而不是不試試 vps paas 之類的東西
現在有沒有伺服器採購計劃?
先分析一下你們程序運行時時間消耗在哪些環節了,再根據情況優化代碼和增強硬體吧。
如果有實力自己做軟體跑,那麼你需要並行運算很強大的GPU。很多時候好一點的台式機自己配一台也夠了。如果可以用Mathematica處理數據,這東西支持聯網並行計算;或者買Wolfram Alpha的Pro帳戶。
花幾萬配台塔式伺服器(其實就是一台配置高的PC機,怕你不懂),類似於什麼96G內存,什麼12核24線程的就可以了,信我的,沒錯的,什麼買幾台強勁的計算機一塊跑(分散式?),或是弄個嚇死人的集群(裝B拉項目專用)都是耍牛氓,因為到最後你會發現,你們課題組用不了那麼牛逼的東西,或者分析數據時的軟體根本並行不起來而內存又非常的不夠用,恩,就是這樣
強勁不強勁主要看配置, 伺服器和計算機沒有本質區別
具體的我不知道,但是我知道一個北大的學姐就是生物這方面的博士生,他們用的是伺服器。所以,以此推斷,是有必要的。
推薦閱讀: