都說固態硬碟主控先掛,能不能換主控?


事實上主控先掛也只是通俗說法,固態故障大部分情況下掛的是由主控管理的FTL(Flash Translation Layer,快閃記憶體翻譯層)。FTL損壞,換主控也是沒用的。

對比一台完整的電腦,主控晶元本身的故障率可以參考CPU,快閃記憶體顆粒在壽命範圍內的故障率可以參考內存——這是電腦中故障率最低的兩個配件,絕大部分電腦直到因為性能落後不得不淘汰,這兩個配件都是可以正常工作的。固態硬碟也是如此,單獨的主控、快閃記憶體顆粒損壞的概率是很低的。

傳統的操作系統/文件系統是按照扇區來讀寫數據的,之前因為主流的存儲設備都是磁存儲,並沒有快閃記憶體的先擦除再寫入和寫入次數限制的問題,因此文件系統的設計中,根據不同的文件操作,會有部分扇區需要多次改寫的情況,對於快閃記憶體來說,這是不可接受的——這會導致非常低下的寫入性能,以及對應快閃記憶體單元的快速損壞。

因此,任何快閃記憶體存儲設備,如果使用傳統的文件系統,就必須通過FTL,把對同一個扇區的多次寫入,分布到不同的物理單元上。例如扇區X,第一次寫入快閃記憶體的頁A,第二次寫入到頁B,第三次寫入到頁,…。FTL就是用來記錄這個對應關係的一組數據。

正常情況FTL是不會有問題的,但攔不住有非正常情況的出現。如果SSD的固件有BUG,又或者正在修改FTL數據時突然斷電改了一半沒改完,就會導致FTL損壞。好運氣的,固件程序自己就能修復,運氣差修復不了的,表現就是整個固態掛了。

如果運氣不是太差,可以用專用設備把快閃記憶體數據讀取出來分析後,人工修復——前提是對固件和FTL結構有足夠的了解。如果不了解,又或者損壞的數據足夠關鍵人工也無法修復,那就一點辦法都沒有。

如果說你並不關心數據只是想繼續使用這個固態硬碟的話,理論上是可以重新初始化,把所有快閃記憶體擦除一遍,建一張空白的FTL的,但會有一個問題,就是快閃記憶體的擦除次數丟失,假設某個頁的擦除次數限制是3000,現在已經擦除過2000次了,只能再擦除1000次。重建的FTL是沒有這個信息的,還是當可以再擦除3000次使用的話,後面就可能出現數據丟失問題了——對於存儲設備來說,這是非常嚴重的問題,這也是某些不入流廠商,使用非正規渠道快閃記憶體顆粒生產的SSD最大的風險所在。


先說是不是

「主控先掛」論,在我看來,

簡直不可李玉。


首先,「主控先掛」這個結論沒有任何數據依據。

網上爛大街的主控先掛論者,

我追問他們:你不是說主控先掛嗎?你有主控先掛在SSD總故障的比例數據嗎?

通常給我的回復,

要麼誠實點就是「我不知道,別人都這麼說」。

要麼就是邏輯帶濕:「不是快閃記憶體掛就是主控掛,快閃記憶體壞的少,那就是主控壞的多」。

但是也遇到過一些人撒潑打滾。

甚至還有直接罵人的?

(我一開始也想不明白為何有人反應這麼激烈,一個回答讓我醒悟了:

這些人就是某些雜牌固態品牌洗垃圾顆粒的托。鼓吹主控先掛,讓人們的注意力從顆粒質量上轉移。)

其實觀察了這一段時間,很多人得出這個結論,憑藉的不是數據,不是返修率排查出來的主控故障率,而是「猜想」。

他們的推論邏輯基本就是:

快閃記憶體壽命夠用→快閃記憶體肯定不會壞→既然不是快閃記憶體壞,那就是主控壞。

其實這個邏輯也有一定的事實基礎:

某些DIYer發現:一些壞的SSD,把顆粒焊下來,這些顆粒做U盤是正常的。

從而他們產生了一種經驗性的認識:

那就是顆粒沒壞,主控先掛。

但問題是:

一個壞固態的顆粒能用,

就一定是主控掛了嗎?


【馬牌三十分鐘大法】

早些年傳說的馬牌主控可以在掉盤後通電30分鐘救活。

目前主要認為是異常斷電導致SSD的FTL出錯,不接數據線只接電源線,讓SSD自行修復FTL。

這種情況,顯然你給固態換焊一百個主控還是沒能亮機。

所以:這既不是主控壞了,也不是快閃記憶體壞了。


【被人們忽視的固件】

【三星850Pro變磚】

2015年850Pro出現了更新固件變磚問題。這個事情雖然最後解決了,但是給我們留下了一個印象,那就是:

固件,作為軟實力,與主控快閃記憶體這些硬體實力,是同等重要的。

我們再來看看數據恢復公司對SSD故障的描述:

沒錯,裡面明確提到一種故障:

固件損壞,

也包括了快閃記憶體壞塊導致的固件損壞。

數據恢復公司跟DIYer最大不同就是:

面對壞盤,DIY可以不關心具體的故障,大不了拆顆粒+套料,從新做個新盤 。

而恢復公司,必須弄清楚哪裡出了故障,如何正確修復。不然顆粒存儲的數據就徹底完了。

雖然數據恢復公司給的案例沒有數據統計意義。我也因此不能斷言xx%的故障是固件引起的。

因為沒有統計數據,就不能確定。

某天,你的固態掉盤了,可能是主控損壞,也可能是固件損壞了,還可能是快閃記憶體嚴重壞塊導致的,或者FTL斷電損壞,甚至有可能是SSD電源管理晶元失效。。。。

SSD除了快閃記憶體和主控,還有緩存、電源晶元,以及其他各種電路和部件。每個部件,哪怕一個小電阻都有可能故障導致盤不能用了。

所以,

你不先判斷故障原因,

一出問題就換主控有用嗎?


從另一個角度考慮,按一些人喜歡的推定法則:

主控的本質就是一個ARM CPU。

而固件類似操作系統。

那麼問題來了,我們也做一個「推論」:

你覺得是CPU壞的概率高,還是操作系統壞的概率高?


單純的固件損壞,通過修復固件,可以很高概率恢復SSD內的數據。

如果兼容通用固件,那麼更方便了。

所以金士頓群聯之類這些公版產品的恢復率相對很高。。。

反而三星英特爾等定製固件的產品,恢復極其困難。

不過SSD面對的故障五花八門。

就連美光固態的負責人也表示:

用戶報修固態的80%沒法查出具體問題。


現實中修電腦也會遇到類似情況:

有人說他電腦出問題了。

我一過去,電腦好了。

我不在的時候,電腦故障了。。。

最後我乾脆把他電腦報我家,連續開機一個禮拜才發現問題。。。

可SSD售後並不一定有這個耐心。很多硬碟只能留三天時間,檢查更不可能一連一個禮拜倆星期這麼陪你耗。

於是最常見的售後結果就是:

沒有查到顯性故障,就直接退回了。


而SSD掉盤很少有能提前通知你的,

這些隱性的故障幾乎防不勝防。

雖然群聯繫主控因為固件和編譯器公開,恢復成功率高。

但是顯然我們不能把救護車當飯吃。每天不是在搶救,就是在搶救的路上,這種生活太刺激。

更何況普通人也沒有判斷主控損壞的能力,更沒有焊主控的技術。

很多DIY SSD玩家,所使用的主控基本都是套料,很少有人玩焊主控的。


金xx之流的固態,它們遇到壞的硬碟,常用的伎倆也不是換主控。

而是重新用軟體開卡,然後屏蔽壞塊,清零刷新smart。

能用幾分錢電費來對付過去的問題,非要換主控花更多的錢?

更何況這些雜牌固態,大部分問題來自於白片快閃記憶體不穩定的品控,

換主控等於頭疼去吃痔瘡膏。

而過保以後壞的SSD,被主人焊下顆粒做成新SSD或U盤,那就是另一個故事了。


所以說淘寶上有大量的拆機顆粒,人家不是換主控,人家直接是換基板。


廠商用來洗垃圾qlc顆粒的說辭你也信


換主控?估計錢都夠再換一塊硬碟了呀


只是除顆粒壞之外的其他所有損壞都被稱為主控壞,其實大多數情況是電路或者元器件損壞,並不一定是主控


理論上只要這個SSD沒進水,沒摔過.主控玩完的可能性不大.不知道`你從哪聽說的主控先掛論,人家SLC固態不活的好好的.....

我就用崩了一塊QLC快閃記憶體SSD,我想問問能換顆粒嘛?(doge)


推薦閱讀:

顏值性能我都要!西部數據移動固態硬碟
iMac 2017 5K 硬體升級:加內存、外接 SSD
給固態硬碟插網線 新SSD存儲技術發展風向標
建興 T10 Plus 512G固態硬碟測評
SSD(固態硬碟)出現RAW的解決方法

TAG:固態硬碟 | 硬碟 | 機械硬碟 |