標籤:

大數據那些事(21):腰斬的大象之Hortonworks

有讀者指出我文章不夠嚴謹,Cloudera Manager是一直可以下載的。我仔細看了一下,這的確是我不夠嚴謹,Cloudera Manager的確是可以免費下載。只是所有enterprise相關的功能只給了60天的試用期。而Cloudera manager沒有了那些enterpise的功能也就聊勝於無了。再此就錯誤道個歉。

Hadoop的世界裡,Hortonworks算是一個不知道應該怎麼去描述的角色了。這個公司起源於2011年Yahoo的spinoff。說白了就是在Yahoo和其他人的投資下,原來Yahoo內部做Hadoop的那個團隊被拆出來單獨成立了一個公司。當然,在這個公司成立之前,Yahoo是整個Hadoop系統的源代碼的最大貢獻者,而Cloudera則拿著開源的Hadoop,包裝一下開始賣自己的distribution。

Eric Baldeschwieler當年是Yahoo的VP,一手掌管了整個Hadoop團隊。在Hortonworks從Yahoo分家的過程中,他先後做了這個公司的CEO和CTO。之後又因為各種原因下野,被人取代了。這個故事曲折,私下裡聽說過很多八卦,包括一場官司,等等。不過不是本文的重點,就不再展開了。

江湖傳聞,據說在Yahoo的時候,Doug Cutting就和當時的VP Eric不和,這就讓Cloudera有了可乘之機,順利挖走了他。之後Eric估計看著Cloudera天天賺錢自己肯定也不爽。我以小人之心去猜測,這是Hortonworks出來成為單獨的公司的動力之一。

Hortonworks的早年,賺錢很困難。而對手Cloudera不但先進入了市場,挖到了Hadoop的精神領袖,更重要的,很早的就開始專註於一些enterprise需要的東西,包括許可權管理,資源管理,以及對用戶行為的監督之類企業級應用必然需要的東西。這些東西當然一部分被Cloudera給貢獻進了Hadoop,另外一部分則稱為了Cloudera的收費的不開源的服務。而寫了Hadoop大部分code的Hortonworks早年其實並沒有這個覺悟。他們認為開源就是好的,所以和MapR以及Cloudera不一樣的是,這個公司從一開始就打出來口號,我們的東西100%是開源的。100%開源這個到底好還是不好,大家見仁見智了。但是不可否認的,既然是100%開源的,那麼阿貓阿狗也可以隨便組個局,開始賣自己的Hadoop了,為什麼非要用Hortonworks的呢?所以Hortonworks的另外一招只剩下cheap了,他們就到處打價格戰搶客戶。這個生意顯然也沒做成功,雖然Hadoop市場的餅在逐漸變大,Hortonworks的生意卻沒有因為這樣而變好。

Hortonworks成立的時候,最大的一單生意來自於微軟。那個時候微軟特別的恐慌,因為Hadoop只能跑在linux上,不能跑在Windows上。所以這樣一來,必然會影響到Windows的liscence的銷售。在那個以Windows為綱的年代裡,微軟對任何影響到windows銷售的東西都需要想辦法解決。解決之道就是把Hadoop做到Windows上來。於是微軟給了Hortonworks很多錢,讓Hortonworks把Hadoop for Windows做起來。大概到2013年吧,這個版本就出來了。到今天其實也只有Hortonworks一家的版本是支持Windows的。不過然並卵,Windows的銷售並沒有因為這樣而上去。大家該用Linux繼續用Linux。尤其是現在AWS上同樣的instance,Linux便宜Windows貴。

Hortonworks當時被投資人問的最多的問題是,你們的錢從哪裡賺的,是不是還是主要從微軟來。而他們也沒有下定決心和矽谷公敵微軟沆瀣一氣,所以這就像是一筆買賣,微軟有需求,Hortonworks要Money,但是遮遮掩掩,若即若離。這在Hortonworks先後搞定了Teradata,SAP,VMWare之類的公司作為合作夥伴以後,某次的座談會上說我們的收入已經過半不從微軟來了標誌著蜜月期的結束。當然此間最為巨大的變化是微軟的巴爾默下台Satya上台。Satya上台以後對以Windows為導向的政策有了巨大變化,從而導致了Hadoop到底能不能在Windows上順利的跑起來這個命題變得沒那麼重要了。不像Cloudera和Intel這種Sugar Daddy的深厚情誼,Hortonworks遮遮掩掩下,終究錯失了和微軟更為緊密的合作。

Hortonworks做的最傻13的一件事情是和Cloudera互相PK到底誰對Hadoop的貢獻大,幾篇文章下來大家都想證明誰寫了Hadoop更多的code。這場撕逼的結果導致近兩年內Hadoop沒有一個大的release,開源項目上指望Hadoop的項目都沒有盼頭。無論如何,爭個頭名,不代表賺錢。

在interactive query起來以後不論是MapR還是Cloudera都開始了自己的項目,只有Hortonworks堅持說,我們只需要improve HIVE就夠了,關於這個的詳細情況我們在interactive query里再講吧。

Hortonworks融資的路上越來越艱難,於是決定IPO,既然騙不到投資者的錢,不妨去騙public的錢,反正股市裡人傻錢多。資金鏈的危機據說是Hortonworks急速上市很重要的原因。作為結果,HDP上市以後基本上腰斬了1半,1個Billion的market Cap只留下半個Billion了,這點錢,還不如Cloudera問乾爹要開Data Center的錢的一半呢?

至於未來如何,看起來我覺得Hortonworks的日子是非常的艱難啊。Cloudera一家獨大的樣子看來是可期的。我其實不知道Hortonworks的股票還要怎麼跌下去,但我覺得比發行價還要低那麼多,最高點1/3的價格的股票,可以歸為不值得投資的股票了。前有Zynga,GroupOn,後有Hortonworks啊。

推薦閱讀:

數據分析學習計劃
這麼輕鬆學會桑基圖製作,小夥伴都驚呆了!
數據平台維度模型設計十個技巧
數據冰山專欄歷史文章

TAG:Hadoop | 大数据 |