標籤:

XSKY胥昕:高度產品化是軟體定義存儲成功的關鍵 | 愛分析訪談

調研 | 李喆

撰寫 | 李喆

傳統SAN(Storage Area Network)存儲市場一直是一個封閉的高技術壁壘市場,因為涉及到用戶的數據,所以產品的高性能和高可用性一直是傳統存儲廠商拿來鎖定用戶的關鍵性指標。

隨著數據量的大幅增長,企業除了對高性能和高可用性之外,對數據存儲的可擴展性提出更高要求。傳統SAN存儲技術出現了技術短板,無法實現性能和容量同時線性增長,必須依賴高性能硬體,價格昂貴,同時擴展性比較差。

這時出現了以Ceph、Gluster等開源分散式存儲技術,底層使用X86等通用硬體,依靠軟體將底層硬體資源池化,通過軟體提升存儲能力,保證穩定性,滿足客戶對存儲的需求,這就是所謂的SDS(軟體定義存儲)。

XSKY就是這樣一家基於Ceph技術開發商業存儲產品的公司,其產品將大型互聯網架構運維經驗、主流的開源技術、企業關鍵業務的最佳實踐相結合,為客戶提供高性能、高可靠性的軟體定義存儲產品。並今年5月完成1.2億的B輪融資,投資方為啟明創投、北極光創投和紅點中國。

XSKY創始人胥昕曾在國內第一家OpenStack廠商擔任CTO,在做雲計算期間發覺存儲行業的痛點和未來趨勢,決定以此為方向創業,於2015年創建XSKY。

XSKY成立之初就瞄準了線下傳統企業客群。對象存儲在互聯網企業中應用很廣,而傳統企業對塊存儲需求旺盛,塊存儲對性能、穩定性要求很高,這恰恰是之前SDS一直無法完美解決的問題。

經過兩年研發和迭代升級,XSKY的分散式塊存儲產品X-EBS已經支持多路徑的光纖協議、iSCSI等介面,並與VMware官方介面整合。同時增加了監控體系、自動恢復機制等企業級存儲功能,可以在上面運行Oracle資料庫等關鍵負載,基本滿足企業級客戶的需求。

僅僅滿足企業現有需求是不夠的,未來所有IT產品都將為應用服務,存儲同樣如此,數據將成為連接存儲和應用的橋樑。除了數據存放之外,數據的冷熱分離、整個生命周期的運營都將成為客戶需求。

國外已經明顯呈現出以上趨勢,並出現了數據平台(Data Platform)這個新領域,湧現出Cohesity、Hedvig等初創公司,其中Cohesity最新一輪融資達到9000萬美金,Hedvig最近同樣也拿到惠普2150萬美金投資。

基於對未來趨勢和國外發展現狀的判斷,XSKY發布新產品企業級統一數據存儲平台X-EDP,在提供對象存儲、塊存儲和文件存儲服務的基礎上,增加了很多以數據價值管理為中心的功能。

近期,愛分析對XSKY創始人胥昕進行訪談,他分享了XSKY的業務模式、運營財務狀況以及未來戰略,以及他對存儲市場未來發展趨勢的判斷,現將部分內容分享如下。

業務與戰略

愛分析:X-EDP是不是理解為X-EOS加X-EBS?

胥昕:並不是,X-EBS加X-EOS僅僅是一個基礎,上面還做了很多事情。

比如提供了內置的備份,加了很多數據保護的功能,塊存儲可以備份到對象存儲,對象存儲可以恢復到塊存儲。還可以做到數據混合雲,塊存儲的同城雙活、對象存儲的兩地三中心,實現了很多數據流動和數據保護的高級特性。

用戶在企業中關注的是一個「數據平台」,而不是一個簡單的「存儲平台」。以前的存儲機制是對象存儲、塊存儲、文件存儲等多種介面,數據能不能可靠、高效的存放訪問,那個叫存儲平台;X-EDP全面的考慮數據的存放、流動、生命周期,以及跨越數據中心和多雲的部署,以數據為中心去管理。

愛分析:這和大數據公司幫助企業做基於Hadoop的平台有哪些不同?

胥昕:Hadoop是一個很垂直的產品,重點在於讓分析型數據靠近計算。而我們幫助用戶解決數據存放的所有問題——交易型數據和分析型數據,業務數據和備份數據,在線數據和離線數據等。Hadoop是獨立的分析集群,不是用來做數據長期存放的,要分析什麼就把相關數據從X-EDP上拷貝過來,進行分析。

愛分析:X-EDP與傳統資料庫的區別是什麼?

胥昕:資料庫是解決結構化數據存放和訪問問題,不能存儲圖片,資料庫下面需要存儲,通常是塊存儲。X-EDP存放的數據可以同時是非結構化和結構化數據,包含資料庫、虛擬機、圖片、視頻、音頻、保單、備份等等。

我們其實是一個數據存儲平台,資料庫在我上面,Hadoop在我旁邊,可以從我們這裡拿數據做分析。

愛分析:現在重點會布局哪些行業?

胥昕:從公司目前的業務來看,第一大行業是金融,第二大行業是媒體,第三是運營商,第四是政府,後面就比較散。目標定位於數據量較大,本身客戶群較大,對數據進行高附加值利用的行業客戶。

愛分析:針對塊存儲的策略是什麼?

胥昕:很多人問我一個很尖銳的問題,軟體定義存儲,特別是做塊存儲,不是一個新行業,是一個老行業。很多人問為什麼這些SDS做塊存儲的公司在美國創業十年沒有成功?

做存儲不是同類產品的對比,替代什麼很重要,要能替代SAN。SAN的特點就是高性能、穩定性,這是企業級存儲和個人存儲的差異。同時,性能容量的線性擴展也是現在客戶越來越關心的問題。

愛分析:什麼是企業存儲?

胥昕:滿足三點,一是有一個機制把下面的多個硬碟管理起來,做到性能損耗最低;二是能夠把接過來的硬碟能力對接出去,支持很多企業級的介面,比如光纖協議、iSCSI協議,雲原生的虛擬化協議、VMware私有化協議;三是要支持企業級的功能,包括加密、壓縮、去重,高度的可靠性、完善的監控體系、強大的資源調用體系、自動恢復機制等功能,這些都是企業級功能。

很多企業買存儲認為可靠性和高性能是基本能力,真正打動用戶購買的一定是功能,能解決用戶什麼問題。

我們看到SDS第一步發展是從專用硬體將軟體抽出來,這很偉大,但是不夠,第二步是把它做到擁有高可靠性和高性能,真正想在積累了20年的傳統存儲功能的標準上產品化很難。ScaleIO被收購時連界面都沒有,更談不上功能。這一點上現有的軟體定義存儲,甚至是很多國際知名的產品,做到替代傳統存儲是有距離的。

所以我們的策略是將先進的分散式技術和20年積累的傳統存儲產品化程度和功能相結合,才能做出一個將互聯網技術充分產品化的分散式產品,用戶買技術沒有用,要買產品才有用。

愛分析:針對這個策略,團隊是如何組建的?

胥昕:我們目前的團隊是碰撞結合的。Team-A是全球Ceph開源社區貢獻排名前列的團隊,來自於一線的互聯網公司以及開源領袖,比如360、新浪、Intel等等,都是做先進的分散式演算法,包括Ceph本身的存儲引擎。

還有來自IBM、華為、中興研發團隊的Team-B,他們有豐富的做傳統存儲的經驗,兩個團隊相結合在內部碰撞,做出自己的企業哲學,將新的分散式存儲技術和傳統產品化結合,最後做出用戶需要的產品。

我們的產品很強調企業級能力,之前SDS在單點的性能上是不如SAN,所以跑不了Oracle,我們現在的性能可以跑Oracle。

如果沒進入高性能場景,相當於沒有進入存儲主戰場。光是雲存儲或者冷數據存儲,其實市場滲透率很低。

愛分析:從技術到實現產品化過程中需要克服哪些難點?

胥昕:一、創業開始階段,從CEO到整個核心團隊一定要把80%的精力放在產品上而不是技術,好技術和好產品是兩碼事,我們更關注用戶在不同場景下使用產品的感受。

二、國內的底層技術團隊陷入一個怪圈,沒有技術遠見就會陷入外包和項目型。美國創業公司比我們好的地方,VC容忍燒三年的錢,公司會專註於打磨技術和產品。中國不一樣,第一年就要做營收,產品不穩定就要先做項目,界面都沒有就要賣產品,產品不夠靠人堆,研發團隊跑到一線機房去給別人做24小時運維,那麼研發產品就更無從談起。

今天很多創業公司的產品版本號都沒有內部標準,就更難去做產品化。一旦有產品版本號就有完整的生命周期管理,從預研階段到研發階段到QA階段到GA階段到交付階段是一個很嚴肅的過程,有這麼一個過程可以把產品做得很完整。

前兩點決定了內部流程,流程決定產品。

三是產品的方法論,例如買一台思科、DELL的交換機,他的產品是包括說明書、安裝包、法律法規、每個版本迭代更新內容、潛在Bug的Q&A的完整產品,這才是產品完整性。

國內很多僅是提供產品安裝包的形式,不是能力不夠,而是沒有把精力放在產品完整性,一般都是放到技術研發或者做項目上,在前期的產品線不夠完善或者產品本身不夠可靠的情況下,如何平衡營收和產品質量的問題是創業公司特別是基礎設施創業公司最大的挑戰。

愛分析:XSKY採取的做法是什麼?

胥昕:一、我們有志同道合的股東,我們知道自己的策略和資源整合方式,創業公司在市場中取勝的法寶就是快,但我們也要平衡產品質量和發展速度的關係,公司的董事會成員觀點一致,比較和諧。今年上半年營收增長特別快,董事會的首要態度是要求質量是否有保障。

二、本身所處的行業比較好,因為越往上做行業屬性越強越好,預算就會越高,比如給醫院做一套挂號系統,相對來說,本身的技術研發成本不高,但是預算很高,因為不同的醫院挂號系統也有很大不同,所以編輯成本會很高、定製需求會很強,項目無法標準化,存儲行業很難出現定製化需求,比如不用光纖協議換個別的定製的協議,技術創業者擅長做技術但不一定擅長定製,也不好管理。

三、明確商業價值觀,明確哪些東西能做哪些東西不能做,把精力專註於做產品,對自己擅長的,要做到完美。開源本身不是商業模式,無論開源還是閉源,商業模式無非是三種:一是做產品,二是做服務,三是做外包。開源技術越成熟越很難做產品,用戶自己下載一個開源版本就行,他有很強的自己的想法,肯定全定製了,不會買產品。

開源技術不是不好用,而是一個部分。如果存儲是一輛車,Ceph是一個發動機,用戶不能只買發動機,而是需要買一輛汽車。還有方向盤、座椅、空調和底盤,它都是沒辦法缺失的,Ceph只是XSKY的最重要的一個模塊,這樣就很好產品化,用戶最後在意的是整個產品的能力。

愛分析:未來的戰略是什麼?

胥昕:解決用戶在混合雲時代數據的管理、存放、讀取、保護、流動等一攬子數據基礎設施問題的產品化公司,高度產品化,保障工程質量和速度持續提升優化,不是解決單個問題而是一攬子問題。

運營與財務

愛分析:團隊多少人?

胥昕:XSKY員工人數不到200人,研發及服務團隊約不到100人。之前介紹過,我們研發團隊來自一線互聯網公司和傳統存儲公司的碰撞結合,其他部分是營銷和職能部門,我們營銷部門人員也大多來自DELL、Intel等一線公司,有著豐富的營銷經驗。

愛分析:現在成本大部分是人力成本和機器成本?

胥昕:從會計準則來講,佔大頭的主要是人力成本,固定資產按3到5年折舊。工程師成本非常高,核心競爭力也是人力,而且要讓核心團隊留在公司,讓技術人員在一定的職業規划下,穩步提高和成長。

愛分析:現在銷售層面渠道多一些還是直銷多一些?

胥昕:從目前的情況來看,自己做的項目比較多,有些行業標杆項目都是我們自己做下來的,渠道也會有一些。

愛分析:收費模式是什麼?

胥昕:收費模式很簡單,license。授權模式按節點或TB兩種都可以。

愛分析:預計今年營收多少?

胥昕: 今年全年的預計營收增速是四倍多。明年壓力可能會大一點,對純軟體公司來講,營收過億門檻很高。所以更多焦點放在明年的布局,而不是今年下半年。

行業與市場

愛分析:有沒有哪些對標公司?如何考慮未來競爭格局?

胥昕:對標Data Platform公司,主要是美國的Hedvig、Cohesity。

我們不怕美國公司進入國內,最大的挑戰在於進入後會有一堆公司在模仿他們,這會對我們產生衝擊。

在國內我們的主要市場有兩塊:一個是SDS增量市場,另一個是傳統存儲轉移至SDS的市場。SDS的增量市場XSKY有著天生的優勢,所以未來我們會重點關注傳統存儲轉移至SDS的這塊市場。

愛分析:Ceph社區中Red Hat貢獻最大,他現在有在做存儲嗎?

胥昕:企業哲學不太一樣,我們其實是一家商業軟體公司,基於開源技術,完全遵守LGPL協議。

Red Hat的大多數產品都是開源的,紅帽商業模式很簡單,相當於把地球上絕大部分的海水轉化為可以食用的純凈水,純凈水很多時候還是原料,可樂、雪碧需要純凈水製造,我們則是相當於專註於可樂產品。

為什麼在Ceph社區里紅帽一家獨大,這是必須的。在一些開源項目里看到的可能是完全平等化,大家都很平等地在玩,容易造成分裂,大家很難有一致的目標規劃,比如安卓至今也沒有分裂,因為Google一家獨大,完全可以決定安卓未來的走向。

每個成功的開源項目後面一定有一個一家獨大的主導者,決定技術的明確發展方向。

愛分析:公有雲考慮自己做存儲嗎?

胥昕:當然,但我認為未來是混合雲時代,有些數據在私有雲,有些數據在公有雲。

混合雲會產生新的問題,具體哪些數據放在公有雲,哪些數據放在私有雲,很難搞清楚。X-EDP有一個功能,可以對接所有的七牛雲、騰訊雲、阿里雲、AWS,數據統一寫在我們這個私有數據平台上

一是之後我們會做數據的生命周期管理,比如一個月都不讀的數據會自動放到阿里雲和AWS,數據到我這兒會留存一份,實時拷貝到騰訊雲和阿雲,實現分發,當用戶不需要的時候,可以幫他刪掉。

二是幫助用戶解決綁架問題,大家以前最怕被IBM捆綁,用了之後就不太容易再遷移,但是現在雲廠商捆綁用戶才是最可怕的,而我們可以把用戶所有的數據按策略分發到各個雲平台,這樣客戶不會被某個雲所捆綁。

所以X-EDP真正在混合雲時代幫助用戶解決上雲的問題,上雲不是直接用就可以,還產生一大堆的新問題,所以這是X-EDP的關鍵所在。

愛分析:全球的存儲行業300億美金市場規模,為什麼中國只有兩三百億人民幣的市場規模?

胥昕:全球存儲的發展其實可以看作全球經濟發展的一個縮影,美國,中國,日本分別是世界GDP的前三名,其存儲的市場規模也分別是前三名,但是美國一家的數據量太大,佔全球43%的市場份額,中國雖然是第二但是只有9%的市場份額,這說明我們還有很多路要走。

一、國內對數據的重視程度不夠,中國的數字化轉型起點落後,比如以前國內大部分醫院X光片直接存儲在倉庫,廣電的媒體庫資料也都是光碟磁帶放在倉庫,數據在線率幾乎為零。

大數據時代的衝擊,迫使國內數據在線化轉型。現在衛計委要求醫院X光片電子病歷也要存30年,全國地區的身份證數據也正在打通,大數據需求現在才剛剛開始增長。

二、數據的使用價值沒有被挖掘。

三、存儲行業的單位售價低。美國一個存儲賣30萬美金,到了中國賣三十萬人民幣,一家公司能改變整個行業,搞得大家都沒法玩。華為現在只做40億,32%的市場佔有率,側面影響了整個盤子不到200億。

全球整體的傳統存儲在下降,而中國每年保持增長17%,原因來自以上三點在發生改變,中國SDS每年高達150%左右的年增長率(YoY Growth)。

愛分析:您判斷未來存儲會佔到整個基礎設施的比例是多少?

胥昕:全球一直是35%~40%左右的比例,因為存儲貴,然後網路、伺服器差不多百分之二三十,我覺得這個比例不會變化。

愛分析是一家專註創新領域的獨立投研機構,研究領域包括新金融、企業服務、人工智慧、教育科技、汽車出行和新零售等。關注愛分析公眾號ifenxicom,及時獲取重要信息。

添加愛分析群小秘微信(ID:ifenxi502)即刻加入愛分析行業討論群。


推薦閱讀:

TAG:大数据 |