民用檔案管理(硬體篇)
來自專欄 IT哲學
在技術領域,很多我們生活中覺得稀鬆平常的需求,很多時候只是被巨量的用戶分攤了成本。實際上,只要稍微超出普通用戶的常見需求(自認為對數據保存、保密無需求,刷刷微博看看視頻,每天用一用,幾年一換新的),就會馬上遇到各種預想不到的問題。
本文對非 IT 背景的自由職業者、小型團隊的 TB 級檔案保管提供基本的掃盲,並推薦基於民用設備的半專業化存儲方案。
一、次品率
數碼產品如果有問題,那就基本出場就是次品,一上來就故障不斷,而且不大可能避免或修好;如果開始不壞,就基本不會中途損壞,而可以用到理論壽命。所以剛買來測試、退換貨是比較重要的。
另外民用產品的使用前提都是穩定電源、常溫、濕度較低、空氣灰塵較少、無強磁場等,否則以下理論值免談。
此外,任何工作用數碼產品(嚴謹地講是除 CPU 以外的數碼產品,因為那玩意根本仿造不出來)都應從正規渠道購買大廠產品,並且注意一分錢一分貨,除非是需求場景差異,否則切勿盲目比價。
二、機械硬碟
機械磁碟是最常見的計算機硬碟,容量大、價格便宜,內部工作原理非常像光碟(磁頭在高速旋轉的磁碟上讀寫),它的壽命主要取決於以下因素:
- 使用中突然斷電、傾斜、反轉、顛簸,或被達到共振頻率的音頻波及等強烈震動。可能導致磁頭撞擊磁碟,當場損壞。找專業的數據恢復公司把硬碟大卸八塊可以拯救其它部分的數據。
- 分區時沒有 4K 對齊。會導致每個單位的數據讀寫橫跨多個存儲單元,數倍增加讀寫負荷。好在新的 Windows 系統自帶分區默認是對齊的,而且機械硬碟本來讀寫壽命就很高。只是硬碟使用速度體驗會明顯變差。
- 使用優化不到位的 BT 下載等功能,頻繁寫入同一位置,造成局部損壞。不過系統自帶的磁碟檢查工具會將其標記為跳過,不影響其它部位的正常使用。
- 沒有以上意外的正常情況下,壽命主要取決於通電時間。3 萬小時理論壽命,每天 24 小時開機通電(如果硬碟沒有休眠,那麼不管在不在讀寫使用),不到 3 年報廢。不過不是磁碟損壞,只是硬碟不能用了,數據可以找專業公司拆盤找回。選購企業級硬碟可以獲得數倍壽命。超過那個時間,按照民用設備兼容性和容積的升級速度,也應該淘汰並將數據導入新設備了,所以機械硬碟是存儲/備份數據首選的方案。
- 自然掉磁。理論值 100 年,重新寫入可以恢復該部分的磁性。實際上溫度濕度都有很大影響,擦寫次數越多的地方磁性也越容易消失。不是主要考慮因素,不過這意味著它實際上不宜作為超過 10 年的「永久」(終生、傳家)保管方案。
在選購機械硬碟時,以西部數據台式機3.5寸硬碟為例,會有一些不同子型號,它們不僅影響價格,也對應不同方式的使用壽命。
- 普通級(藍盤)。民用場景下的成本最低的硬碟。
- 監控級(紫盤)。普通硬碟常年連續工作會有問題(發熱、震動、速度),同時在此均勻覆蓋的使用場景下隨機讀寫、壽命平衡演算法等成本投入也沒有意義,而對硬碟工藝質量要求更高。價格比普通級高一些。
- NAS 級(紅盤)。搭建家庭或工作室雲盤用,多塊組合、長期連續工作。在監控盤的基礎上,還要提升正常硬碟使用場景下的隨機讀寫性能。主要添加了一個特殊功能,TLER,針對磁碟陣列協同工作場景的優化,使得單塊硬碟忙碌時也能保持彙報工作狀態、不會被誤認為永久不可用而踢出陣列(有一種說法是非陣列場景使用 NAS 盤是不可靠的,因為它簡單讀取失敗後不會再深入嘗試修復而是直接放棄,我沒有深入研究,不過個人認為這種說法有經不住推敲的成分,倘若果真如此那 TLER 也太弱智了)。價格比監控級高一些。
- 遊戲級(黑盤)。是對普通級硬碟使用場景的讀寫性能提升,適合玩大型遊戲或專業辦公。價格在 NAS 盤之上。相對於監控、NAS 而言,是不同的使用場景,浪費錢的同時效果反而可能不如,另外耗電和噪音都會適度增加。
- 企業級(金盤)。靠高出以上一大截的成本全面碾壓上述方案,不過對於不必要的監控場景、大體量備份場景可能是一種浪費。數據量不大或資金雄厚的商務人士可以考慮。
另外,越先進(新、貴)的硬碟,誤碼率和故障率(MTBF)也越低。
簡單來說,
- 如果用於外置備份,或台式機擴展存儲不常用的大體量資料,購買一堆藍盤就行(目前 3TB 500 元的性價比最高,再大由於工藝限制,單位價格更昂貴,再小通常是落後技術,不好買的同時歷史遺留價格也未必便宜)。
- 如果常年不間斷工作,用於監控就購買紫盤,用於搭建家庭、工作室雲盤就購買紅盤(或紫盤)。大小根據具體使用需求定奪(在不考慮昂貴而且有限的盤位等因素的情況下,硬碟本身 3TB 仍是最經濟的方案;如果數據量巨大,則多大的硬碟都不嫌大,比如 8TB、12TB)。
三、固態硬碟
固態硬碟比較像是一個加強版的 U 盤,直接在晶體晶元上存儲。
讀寫速度遠勝機械硬碟,並發、隨機、小文件讀寫更是完操。民用乃至遊戲、辦公體驗碾壓機械硬碟,同時沒有噪音,也不怕震動。
- 不過價格高、容量小(大不過幾百 GB,而且此時已經很貴了),如果遊戲或工程文件較大,可能還是無法勝任。蘋果電腦,以及目前常見的超極本幾乎都是這種硬碟。當然,如果不計購入成本,買一堆大容量固態硬碟性質的設備(如下文談及的存儲卡等),其體積、重量確實較小,存放、運輸成本可能更低。
- 可更要命的是,固態硬碟在斷電情況下,一兩年後(30°環境)數據會消失,而且受溫度影響較大,40°時企業級也只能頂幾個月,55°時一個禮拜數據就沒了。
上述原因使得固態硬碟不大適合作為大量數據的長期存儲使用。
撇開不通電數據壽命不談的話,設備本身的壽命主要只和寫入次數有關,與機械硬碟不同,和通電時間、讀取次數都無關。
而且一處達到壽命就會整體不能使用,而且可以認為損壞時所有數據都無法可靠恢復。相對而言更適合存放操作系統、常用中型軟體,以及少量正在處理的工作文件。
這個寫入次數,主要和固態硬碟的兩個構成部分有關。
- 快閃記憶體晶體。這個部分花頭很少,只是材質分為 TLC(500 次)、MLC(3 千~1 萬次)、SLC(10 萬次) 三種,價格差異也巨大。建議至少購買 MLC 的。固態硬碟和現在的 U 盤、手機存儲、存儲卡的介質是相同的,因此它們也同樣是寫入決定設備壽命、斷電時長溫度決定數據壽命。
- 主控晶元。這個部分,就是不同固態硬碟廠商、不同檔次優劣的產品各顯神通的地方了,也是固態硬碟雖然使用相同的存儲介質,性能卻遠超 U 盤的主要原因。如果只是簡單粗暴地讀寫快閃記憶體晶體,那麼以起可憐的寫入壽命,以及最為廣泛使用的 TLC 材質,很快就會損壞。可是主控晶元是非常「聰明」的,它會自動判斷哪些存儲單元使用次數較多、哪些較少,均衡使用,從而使得貌似巨量的寫入操作被儘可能均勻地分攤了,所以實際上好的固態硬碟的寫入壽命,接近於容量乘以單位擦寫次數。實際使用中,最應當注意的還是要預留儘可能大的未使用空間,供主控晶元「輾轉騰挪」;很多廠商也會自行保留一部分用戶不可使用的後備空間,用途相同;甚至有的時候主控晶元還會在硬碟空閑時對調頻繁使用的單元和使用較少的單元上的數據。另外固態硬碟在壽命即將終結前,可能會保護性拒絕正常訪問用於留下拯救數據的機會。不過不建議這樣挑戰固態硬碟的極限,省了錢時就要更加自己上心。順帶一提,平衡調度演算法也帶來了銷毀單個機密文件數據的難度(幾乎不可能),這裡就不多談了。
四、光碟
常識中有一種流行的說法,就是光碟比磁碟更穩定,更適合長期備份。是不是這樣呢?
- 首先,好的光碟的與差的光碟的壽命是天差地別的,並不是只要是個光碟,就一定壽命比磁碟長的,差的光碟壽命驚人地低;差的光碟對保存環境的溫度、濕度、灰塵等也更敏感。當然,好在價格也不貴,所以只要注意購買高規格光碟即可。
- 更麻煩的是,好的光碟的總壽命雖然比磁碟長,但是它的數據壽命不是一個時間點,而是從存儲的第一天起,就開始以一種越來越高的概率丟失數據,這個情況貫穿了光碟的整個生命周期,是一個連續和均勻的過程。因此如果想要存儲十幾年到幾十年,工作也不是一次性的,而需要每兩年(隨著錯誤率提升,後來要每半年)都逐個光碟檢查校驗,數據是否有局部失效,並進行糾正。
再加上使用的麻煩程度,以及單個容量和數量,光碟並不是一種取代機械硬碟進行長期備份工作的最佳方式。
五、磁帶乃至非數碼介質
更進一步的方案,並不太適合於個人或中小團隊,不過還是簡單介紹一下。
巨型商業機構的大數據冷備份(僅備份,不需要經常拿出來頻繁使用),通常使用磁帶,壽命在幾十年的樣子,和硬碟原理一樣,但購入、保存條件、運輸成本也更低。在需要跨中心傳輸大量數據時,網路傳輸的速度,也遠遠比不上用磁帶拷出來裝滿一卡車開過去(自己想一下,給人快遞 3TB 的一塊硬碟,和在線傳輸這 3TB 數據)。
另外,貧窮和卑微也限制了我們的想像力。我們傾向於電子檔案,很多時候是因為我們沒有穩定的土地、樓房、安保運維人員,而個人資料那一點兒數據作為電子檔案時剛好小到能隨身攜帶,而紙質的不能。但是對於國家機構等,把數據記錄在非電子介質上放在那裡,要遠比任何數碼介質方案可靠,同時對這種資料的管理系統也已經存在千年,遠比只出現了幾十年的計算機工業體系來得成熟。特別是計算機領域的核心技術存在發達國家控制性。
六、結論性建議
- 我們基於民用機械硬碟設備構建一種以 5 年為更替周期、10 年為保險周期的方案,超出這個時間,整個設備生態都快淘汰了(沒有介面連得上、沒有系統兼容、新的多媒體格式更占空間、新的更大更便宜的設備),就及時導入新的介質。這一步解決入門級設備壽命烏龍,別幾個月沒用數據沒了,幾年沒用設備壞了,或所有設備型號相同、使用頻率相當,要壞一起壞了。
- 台式機、私人云一定要配後備電源(足夠功率的在線式 UPS,且具備電用完自動關機功能),移動硬碟使用中一定要避免碰到線意外斷電。這一步是為了防止備份時斷電,主設備和備份設備一起損壞。另外也要警惕計算機病毒等在這個時候搞破壞。
- 配合 iCloud、OneDrive、微雲等大品牌網盤。可以解決家庭失竊、火災、地震等功能,是一種方便的異地備份方案。不過要注意的是,目前網盤比較突出的主要有兩個問題。一個是有些資源文件會被封殺失效(統一封禁所有人網盤裡的相同文件,或基於對內容的智能檢測),一個是私人數據保密性問題(監守自盜/黑客入侵/帳號泄漏),建議加密後同步。當然,大部分人用的是家用操作系統、第三方郵箱、運營商手機號 ID,保密性可能是有限的。
- 對普通小型團隊的內部公開數據來說,最實用的方案,還是每人那裡存一份(每個人的電腦使用習慣、操作系統、殺毒軟體等都不同,人也不住在一起,反而最不容易一起出問題)。
- 一旦存在了備份,頻繁的數據同步就成為非常麻煩的事了,手動進行除了工作量大,還容易遺漏、出錯(新版本被舊版本覆蓋或誤刪除),所以需要配合軟體使用。我會在該系列後面的文章中單獨介紹。
七、格式化時的文件系統選擇
設備買來後,要進行初始格式化才能使用,而這就需要根據設備硬體特性和操作系統兼容性選擇適合的文件系統。
- NTFS:Windows 御用,Mac 上只能讀不能寫。U 盤上使用容易增加讀寫負擔(日誌系統),影響性能、降低壽命,適合硬碟(機械或固態)。
- FAT32:Windows 和 Mac 通用。機械硬碟上刪改內容容易造成文件碎片,降低讀寫性能,需要經常碎片整理,適合 U 盤(否則硬碟性能會像 U 盤一樣低),固態硬碟也可以使用(不過不支持一些 NTFS 等硬碟專用系統特有的功能,比如回收站)。無法存儲超過 4GB 的單個文件。
- exFAT:Windows 和 Mac 通用,Windows XP SP2 之前需要安裝補丁。是對 FAT32 的增強,支持超過 4GB 的單個文件。為 U 盤而生;固態硬碟不清楚,聽說傷壽命,不過一定不要嘗試在機械硬碟上使用,似乎因為沒有日誌系統,有很多造成數據損壞的案例。
簡單來說,
- 硬碟的話,如果只在 Windows 上用,沒有 Mac 共用的需求,那就 U 盤用 exFAT、硬碟用 NTFS(反之用 Mac 上專用的文件系統)。
- 如果要在 Windows 和 Mac 上通用,那麼 U 盤用 exFAT,硬碟的話並沒有比較好的方案。可以根據上述情況酌情選擇使用、配合使用(比如機械硬碟主要是 NTFS,留一點兒空間弄個分區格成 exFAT,用於 Mac 存進去後再插到 Windows 上歸檔),或用區域網傳輸文件。
推薦閱讀: