大數據那些事(20):有乾爹的Cloudera
文有個說法叫Sugar Daddy。翻譯成中文還是乾爹比較合適。大家都知道文字在發展,近年來尤其在加速發展。同志,小姐都賦予了新的含義,隨著長城的上演,乾爹的新含義也越來越明確起來。今天的主角是Hadoop批發商裡面最牛的一位,叫Cloudera。它可是有乾爹的
今年8月底的一則消息非常的有意思,標題我貼一下,全文請大家放狗或者某度搜:
Cloudera asked Intel for $1 billion tobuild a cloud service
我一直有一個困惑,為什麼這個公司明明是賣Hadoop Distribution的,卻取了一個帶cloud的名字。其實後來有次看到Cloudera的某創始人接受採訪的時候,對方說最開始他們也搞不清楚雲計算和大數據是什麼區別。他們最初的想法是提供大數據的雲方案,讓大小企業都運行在他們的data center上。但是後來迅速發現此路不通,於是趕緊改頭換面,改做企業級的Hadoop版本的收費服務。於是公司迅速轉型,但是名字卻留了下來。
只是這個標題還是透露出來Cloudera的人心目中的夢想。最主要的是,有乾爹的Cloudera的底氣,終究和其他批發商比起來,很不一樣了。舉個例子來說,已經上市的Hortonworks的市值才半個Billion,這幾位問乾爹開口要就是1個Billion,那上市以後要吹出多大的泡泡來,才能讓乾爹心滿意足呢?
今天文章的主角就是這個有乾爹的Cloudera。Cloudera成立於2009年,當初Berkeley DB這個東西被Oracle買了以後,Mike Olson,就像其他被收購的公司的CEO一樣,在Oracle待一段時間,拿了Oracle的錢就打算做點別的。於是就拉上了Christophe Bisciglia, Amr Awadallah 還有 Jeff Hammerbacher一起開了個新公司,如今Hadoop批發商裡面最牛的Cloudera。
我和這裡面大部分人沒有緣分,大概只見過Jeff Hammerbacherh,對方在facebook的時候面的我,自稱負責Facebook的data組,面完之後和我說,你這個人不適合做碼農,不如改行做data analyst吧。從此我在FB的內部檔案裡面留下了不適合做碼農的評價。想來也是,如果我真適合做碼農的話,今時今日也不至於還混得如此寒磣。
Cloudera成立以後做的第一件大事,就是從Yahoo挖了最初寫了Hadoop 的Doug Cutting。這位成了他們公司的首席構架師。當然他還做了Apache基金會的老大很長一段時間。由此也開啟了他和Yahoo裡面做Hadoop的團隊之間的你沒死我也還活著的戰鬥。
我們姑且不說Doug的寫code水平怎麼樣,起碼的他在合適的時候做了合適的東西,所以機緣巧合也好,真的很牛也罷,是時勢造的英雄也好,風口的豬也罷,這位Hadoop之老爹一跳槽,Cloudera一直就成了標杆。起碼是業界其他公司願意選擇用他們的Hadoop的標杆。
Cloudera的生意經方面也沒有MapR那麼強悍的技術底蘊。它們的基本做法就是什麼都是開源,但是寫了一套自己的管理和部署Hadoop cluster的東西叫做Cloudera Manager。這套東西不花錢你是看不到買不到的,花了錢可以,按年按機器收費。當然收費據說不便宜。所以蘋果從某個時期就被廉價的Hortonworks搶走了生意,原來是Cloudera的忠實客戶。
Cloudera的另外一個大項目就是Impala,關於這個東西因為我們還沒有談interactive query和Dremel的故事,所以我只能先挖個坑,以後再談。
在Cloudera歷史上有幾個大事件,其中之一就是和Hortonworks的一場大撕逼,雙方比較誰才是Hadoop的正統。當然今天來看,基本上Hadoop的PMC都是這兩家公司分了,談不上誰比誰牛,講完Hortonworks之後我會專門聊聊這場大撕逼的故事。所以也只能先挖個坑了。
Cloudera有很多戰略夥伴,比如說Oracle啊SAP啊還有埃森哲之類的,等到2015年連微軟也上了賊船。微軟之前一直和Hortonworks非常的曖昧,但是因為Hortonworks的一些舉動,使得微軟沒有能夠成為它的乾爹。我想現在Hortonworks看到有乾爹的Cloudera一定充滿了羨慕嫉妒恨。
Intel是怎麼成為Cloudera的乾爹的,其實也涉及到了Intel內部的一場政治鬥爭。Intel進入了Hadoop市場,準備做自己的Hadoop distribution。這件事情是上海的團隊在做。之後內部又發生了政治鬥爭,然後整個項目被砍,上海的老大走人。Intel轉向給Cloudera投了740million,外加70個delicated的員工,據說大部分在美國。大致上是一場美國幫搞掉了中國幫的故事。可惜我不在Intel裡面,所以只聽說了Intel成了中國Hadoop開源的黃埔軍校,各路人才紛紛出走的故事。這種事情不斷在不同公司上演。當然,據說做Spark的團隊還是留下來了。而且因為和伯克利合作的早,頗有幾個comitter在裡面。我想Intel現在做Spark很大程度上還是想在Deep Learning市場上搶吃的。只是NVIDIA布局已經很久了,Intel這個後來者,真的能分到吃的嗎?當然這就算題外話了。
Intel作為瘦死的駱駝,當然不是阿貓阿狗能比的,要做Cloudera的Sugar Daddy也是綽綽有餘了。其實我不清楚這兩位合作到底有多緊密,但是我想怎麼樣對於即將沒落中的Intel,Hadoop都還是一根稻草吧。反正美元放兜里也是貶值,不如就掃點給Cloudera吧。
我至今沒見到Intel真的開始和Cloudera一起搞Data Center。如果開始了,我想就算和Amazon干仗的時候到了。Cloudera顯然不想成為下一個Hortonworks。上市以後腰斬一半,舉步維艱。這樣一來,就必須有新的突破口。在這個資本寒冬的時候,Cloudera的出路到底在哪裡,其實也不好說。但是不管怎麼樣,Cloudera上輪 Intel領投的融資已經是900Million了,怎麼樣都不可能市值上去之後只有不到500Million的,如果真的這樣,那Intel這個乾爹可就要跪了。
這一個Billion到底給不給,怎麼給,可能真的關係到了Cloudera的未來和Intel的未來,所以我們只能拭目以待了。
推薦閱讀: