生信分析平台搭建(十五):RAID
本文首發於微信公眾號「基因學苑」,未經授權,不得轉載,搜索「genecollege」。
經常有人問我自己的個人電腦是否能用來分析,有些配置已經很高,內存可以達到16G。其實伺服器並不是一個配置更好的個人電腦,它與普通電腦之間有很多差別,其中最大的一點不同我想應該是伺服器使用RAID。
二十:RAID
1、raid簡介
磁碟陣列,英文為Redundant Arrays of Independent Disks,簡稱為RAID,有「獨立磁碟構成的具有冗餘能力的陣列」之意。現在的伺服器上都是用了RAID技術,可以解決硬碟IO性能弱,穩定性差的問題。
圖1-多塊磁碟構成磁碟陣列
2、raid讀寫文件
個人PC一份數據寫到一塊硬碟上,採用RAID技術之後,可以一塊數據寫到多塊磁碟上,這樣速度就變成原來n分之一。讀一塊數據並行從多塊磁碟讀取,這樣讀速度就變成原來的n倍。
3、RAID級別
現在的RAID級別從raid0到raid10,raid50等很多種,每一種都有特定的使用範圍,raid級別不同,主要是利用率與讀寫速度和冗餘性的平衡。
RAID 0
RAID 1
RAID0+1
RAID: LSI MegaRAID、Nytro和Syncro帶海明碼校驗
RAID3:帶奇偶校驗碼的並行傳送
RAID4:帶奇偶校驗碼的獨立磁碟結構
RAID5:分散式奇偶校驗的獨立磁碟結構
RAID6:帶有兩種分布存儲的奇偶校驗碼的獨立磁碟結構
RAID7:優化的高速數據傳送磁碟結構
RAID10:高可靠性與高效磁碟結構
RAID53:高效數據傳送磁碟結構
4、raid 0
raid 0是最早的raid形式,它是磁碟利用率的極端,利用效率最高,同一份數據分開寫入多塊磁碟,因此讀寫速度最快。但是沒有提供冗餘或錯誤修復能力,任何一塊磁碟壞掉,整個數據就無法恢復。
5、raid 1
raid1也稱為磁碟鏡像,冗餘性的極端,將同一份數據同時寫入多塊磁碟,非常浪費磁碟,因此,冗餘性最高,讀數據時一次從多塊磁碟讀取,因此讀數據速度很快。raid 0主要用於重要數據的讀寫,例如銀行賬戶。任何一塊磁碟壞了,還有多份備份。
6、raid 5
raid 0和1都是極端情況,raid
5保持利用率,冗餘性,讀寫速度一個平衡,raid5最少使用3塊硬碟,注意不是要求至少5塊硬碟,raid5與raid0類似,讀寫數據的時候,會將數據分散式的讀寫到所有硬碟上,但是多了一步操作,在寫數據的時候,會對數據進行奇偶校驗運算,將校驗信息同時保存在硬碟上,這個校驗信息要比實際數據小很多,比如現在有4塊磁碟構建的raid5,每個磁碟4T,那麼浪費掉1塊用於校驗,實際磁碟可用大小應該是12T。7、raid製作,在購買伺服器的時候,有些設備提供方已經做好了raid,這樣拿回來之後就會當成一塊硬碟來使用(不要去爭辯為什麼少了一塊磁碟的容量)。如果錢沒到位,就需要自己手動製作,也並不是很難。不同品牌會有一些差別。下面是一個示意圖,實際操作中有很多步驟。
Tips:1、除了raid5 還有其他很多raid級別,都有各自的使用範圍。
2、製作raid最好選擇同一品牌磁碟,並且同樣大小,這樣性能和穩定性更好。
推薦閱讀:
※知因發布「未來圖」引領「精準健康」新時代
※轉基因技術是不是像拼圖一樣,可以隨意定製被轉基因物種的特徵?如果不行,為什麼?
※可以幫我看一下基因檢測結果么?遺傳幾率多大?
※(基因-運動)天生不愛動?看這裡
※身高差帶來幸福感:基因決定"最萌身高差"不常見
TAG:基因 |