標籤:

生信分析平台搭建(十五):RAID

本文首發於微信公眾號「基因學苑」,未經授權,不得轉載,搜索「genecollege」。

經常有人問我自己的個人電腦是否能用來分析,有些配置已經很高,內存可以達到16G。其實伺服器並不是一個配置更好的個人電腦,它與普通電腦之間有很多差別,其中最大的一點不同我想應該是伺服器使用RAID。

二十:RAID

1、raid簡介

磁碟陣列,英文為Redundant Arrays of Independent Disks,簡稱為RAID,有「獨立磁碟構成的具有冗餘能力的陣列」之意。現在的伺服器上都是用了RAID技術,可以解決硬碟IO性能弱,穩定性差的問題。

圖1-多塊磁碟構成磁碟陣列

2、raid讀寫文件

個人PC一份數據寫到一塊硬碟上,採用RAID技術之後,可以一塊數據寫到多塊磁碟上,這樣速度就變成原來n分之一。讀一塊數據並行從多塊磁碟讀取,這樣讀速度就變成原來的n倍。

3、RAID級別

現在的RAID級別從raid0到raid10,raid50等很多種,每一種都有特定的使用範圍,raid級別不同,主要是利用率與讀寫速度和冗餘性的平衡。

RAID 0

RAID 1

RAID0+1

RAID: LSI MegaRAID、Nytro和Syncro帶海明碼校驗

RAID3:帶奇偶校驗碼的並行傳送

RAID4:帶奇偶校驗碼的獨立磁碟結構

RAID5:分散式奇偶校驗的獨立磁碟結構

RAID6:帶有兩種分布存儲的奇偶校驗碼的獨立磁碟結構

RAID7:優化的高速數據傳送磁碟結構

RAID10:高可靠性與高效磁碟結構

RAID53:高效數據傳送磁碟結構

4、raid 0

raid 0是最早的raid形式,它是磁碟利用率的極端,利用效率最高,同一份數據分開寫入多塊磁碟,因此讀寫速度最快。但是沒有提供冗餘或錯誤修復能力,任何一塊磁碟壞掉,整個數據就無法恢復。

5、raid 1

raid1也稱為磁碟鏡像,冗餘性的極端,將同一份數據同時寫入多塊磁碟,非常浪費磁碟,因此,冗餘性最高,讀數據時一次從多塊磁碟讀取,因此讀數據速度很快。raid 0主要用於重要數據的讀寫,例如銀行賬戶。任何一塊磁碟壞了,還有多份備份。

6、raid 5

raid 0和1都是極端情況,raid

5保持利用率,冗餘性,讀寫速度一個平衡,raid5最少使用3塊硬碟,注意不是要求至少5塊硬碟,raid5與raid0類似,讀寫數據的時候,會將數據分散式的讀寫到所有硬碟上,但是多了一步操作,在寫數據的時候,會對數據進行奇偶校驗運算,將校驗信息同時保存在硬碟上,這個校驗信息要比實際數據小很多,比如現在有4塊磁碟構建的raid5,每個磁碟4T,那麼浪費掉1塊用於校驗,實際磁碟可用大小應該是12T。

7、raid製作,在購買伺服器的時候,有些設備提供方已經做好了raid,這樣拿回來之後就會當成一塊硬碟來使用(不要去爭辯為什麼少了一塊磁碟的容量)。如果錢沒到位,就需要自己手動製作,也並不是很難。不同品牌會有一些差別。下面是一個示意圖,實際操作中有很多步驟。

Tips:1、除了raid5 還有其他很多raid級別,都有各自的使用範圍。

2、製作raid最好選擇同一品牌磁碟,並且同樣大小,這樣性能和穩定性更好。


推薦閱讀:

知因發布「未來圖」引領「精準健康」新時代
轉基因技術是不是像拼圖一樣,可以隨意定製被轉基因物種的特徵?如果不行,為什麼?
可以幫我看一下基因檢測結果么?遺傳幾率多大?
(基因-運動)天生不愛動?看這裡
身高差帶來幸福感:基因決定"最萌身高差"不常見

TAG:基因 |