PingCAP 這家公司的前景如何?

PingCAP 的盈利模式是怎樣的,市場規模多大,未來的發展前景怎樣?被某家大公司收購的可能性如何?


利益相關:PingCAP 聯合創始人, CTO

在灣區出差,昨晚看到問題的時候已經深夜了,早上起來發現不用回答了呃。。。但是還是簡單回答下吧。

TL;DR

我覺得這家公司還蠻靠譜的。

這年頭人越來越貴,好點的架構師/開發者/DBA的薪資差不多都在和美帝看齊,同時數據存儲的問題越來越突出,慢慢的我們發現關係型資料庫變成整個後端架構裡面最難 scale 的單點,你說我可以 sharding 啊,我可以分庫分表啊,對大公司來說,當然可以,無數的大公司就開始養人自己造 mysql sharding 中間件了,功能差不多,質量良莠不齊,對於中型公司和傳統企業來說基本沒啥辦法,即使這樣每年還得花好多錢養著團隊,更別提開發效率低帶來的時間成本。另外一個方面分庫分表 sharding,聽起來簡單,用起來維護起來簡直不要太痛苦,當初要不是維護過豌豆莢的 mysql sharding 集群,我也不知道這個事情那麼屎。後來不行了,決定徹底解決一下這個問題,看到了 Spanner 和 F1 的論文,於是出來拿了筆錢開始搞了。

首先啊,PingCAP 到現在兩歲多了,融資保持著一年一輪的健康的節奏,各輪 VC 都是國內頂級 VC, 比如天使輪的經緯,險峰華興啊,A 輪的雲啟,FreeS啊,B 輪的華創。每輪 Closed 都很快,也感謝各方投資人的認可~

做的事情說起來其實 pretty simple, 就是從解決 MySQL 的 Scale 問題入手,發展出一套 HTAP 的資料庫並儘可能形成開源的事實標準,將開發者從數據基礎設施中解放出來,Make Data Smart.

但是這個目標背後的工程難度極高。也是在我們之前沒人做出來的原因,這個是少見的因為技術太難,沒人做的事情。這太好了,我覺得比較適合我們幾個碼農。

盈利模式也很簡單,其實也沒什麼複雜的,幾個關鍵的指標:

1. 資料庫的市場多大(天花板在哪)

2. MySQL 的 install base 多大,和在 MySQL 上遇到擴展性問題的用戶比例,遷移到 TiDB 上的遷移成本(這個關係到增長及 market size)

3. Cloud 的發展速度(渠道)

4. 隨著 Adoption 的增長,用於銷售,客戶支持,服務及維護的成本會不會隨之線性增長(成本)

資料庫的市場大小不用說,看看 Oracle 的市值就知道了,更不用說國內的去 IOE 和開源自主可控什麼的,MySQL 也是世界上最流行的開源資料庫。剩下幾個問題就是增長,渠道和成本控制。通過一些黑科技,我們讓 MySQL 到 TiDB 的 Migration Cost 幾乎為 0,所以我們的前期 POC 成本很低,甚至大多數情況不需要我們上, 用戶自己就完成了,所以 Pipeline 增長很健康;Open source 天生自帶病毒傳播特性,我們在幾乎 0 市場成本的情況下完成了國內開發者社區的覆蓋(嗯,就是寫文章有點累。。。);第三,我們已經談下了國內幾家最大的公有雲廠商資料庫首級入口,正在進行技術整合,大家在不久的未來就會看見,所以也算完成了渠道的布局和卡位;

其實也沒那麼多複雜的東西,盈利模式簡單一句話就是:收人錢財與人消災,同時這個消災的過程是可以 scale 的,That"s all,亘古不變的樸素道理。

天時地利都不錯,剩下最最重要的問題就是人的問題了,誰能搞定這個事情很重要,不過我相信其他的幾個回答能看得出來,我們還是比較幸運的,湊了一個務實而兇悍的技術團隊,我愛你們。

在 Infra 領域,我們就是新的巨頭。

#簡歷不要發給我,我內推沒有 iPhone 8 拿(這 tm 誰定的政策 T_T)。。發給 @zhexuany (他缺手機了) @韓飛 @申礫 @Xiaoyu Ma @姚維 就好了


作為 TiDB 的開發者來強答一發~

我是 16 年 4 月初加入的 PingCAP,主要負責 SQL 計算引擎,包括 Planner 和 Executor 兩部分。我剛開始加入的時候,整個 SQL 層做的比較亂,計算層不是完整的 volcano 模型,很多計算的東西要基於 ast,沒有 hash join,plan 層幾乎都是基於單機的思路。之後到 7 月末 beta 1.0 對 plan 層重構,區分了 Logical 和 Physical Plan。 @周昱行 寫了第一版基於採樣的 statistic 模塊。executor 層和表達式計算不再基於 ast,實現了 hash join。8月份的時候實現了第一版 cost based optimizer, @申礫 貢獻了 aggregation 下推和並行 hash join,為我們爭取了第一個大客戶。

9月-10月我在夢遊

11月-12月 SQL Team 來了兩個 ACM 神級選手實習,其中一個為我們優化了 analyze 語句。planner 加入了 eager aggregation功能,並且參考 SQL Server 實現了 subquery 的去關聯化。

17年 1月 - 4月,兩個妹子重構了 SQL 運算元下推的邏輯,懷宇開始設計新的表達式計算框架,最重要的改動是,我們有了完全不基於分散式鎖的 statistics 實時更新 / 通知機制,並儘可能的保證了一致性。

5月-8月,新的基於動態規劃演算法的 cost-based optimizer 完工,支持 index look-up join / sort merge join / hash join 的自動選擇,TopN Query 更好的支持(很少有優化器可以做好這一點)。TiSpark beta 發布,讓 TiDB 有了真正的 OLAP 引擎。

接下來的一年,我們會實現真正的 parallel execution,支持真正分散式的帶 distinct 聚合運算元的下推,基於動態規劃的 Join Reorder,完全自動化更新統計信息(DBA 可以下崗了)。

我們這一年做的事情非常的。。。夢幻,沒錯,就是夢幻。。。從剛加入 PingCAP 的時候開始,我對「完美」的資料庫的幻想正在一步步變成現實。我最喜歡一個作品初期的樣子:它有無限的可能性,而讓這些可能性成真的人,正是你,是我們每一個工程師。

這也許是一家在國內最能讓你體驗作為「工程師」的價值的公司。你彷彿是一個畫家,一個雕塑家,你可以告別任何無意義的勞動,盡情發揮自己的才華。你每一個自以為天才(實際上可能愚蠢)的想法,即使失敗了,仍然可以推倒重來,在一篇又一篇的論文里尋找正確答案。這裡是可以實踐每一個前沿理論的地方。

自由,專註,創新,嚴謹,也許這些就是這家公司的基因,由此而誕生的產品必然卓越,由此而形成的市場必然廣闊。前方也許有很多未知的考驗,但是走好這段路的每一步,讓我十分心安。


非 PingCAP 相關人士只從人員來稍微分析下…

之前他們在豌豆莢做 Codis 的時候我們有過一次交流(畢竟我們也是原生 Cluster 的唯一代表了,在當年)。他們的團隊創始人如果沒認錯的話,很有想法也很有行動力,Codis 的優劣心裡有數,也很清晰的勾勒出了未來的數據層應該的樣子,當時沒記錯就已經開始動了心思做 Tidb 類似的事情了,不像我們這種鹹魚抱著大腿好乾活……

後來才知道他們創始人中間有一個是我前同事的老公…而我前同事雖然是個女性,在豆瓣時期那可是引領 iOS 開發潮流還能跳舞所以我覺得等價於他老公也是1個能打10個吧……

再然後發現他們用 Rust,而且是深思熟慮的情況下。你看我們用 Rust 下了 Redis Cluster 第一個 smart proxy demo 就放棄了,所以說他們是很有行動力的。畢竟以當年的情況 Rust 的輪子很多都要自己搞,語言特性也沒穩定(到現在也就那樣),隔壁的 Golang 被某些人描述得秒天秒地。能清晰的看出兩者的優劣,並評估研發成本和時間成本,很了不起。

接著我發現之前我吐槽的前 KSO 轉 KIS 的一位小哥去了 PingCAP,拋開關於 Golang 和 Python 的爭執那篇文章,這位小哥在 KSO 前同事口中還是很有能力的。而且我也詳細看過這位小哥 github 上的 mysql 相關項目,很有想法,金山系務實的風格。我對他們團隊組成和能力評估就更高了。

最後…我金山的老大去了 PingCAP。聰頭年紀輕輕就在後許世偉時代接起了 WPS 的大旗,KSO 真正技術派的實力代表之一,快盤後端之父,親爹,我頂多算幾個奶爸之一。我當年在金山被他虐得不要不要的,經常是我改了2天重構了幾個函數,他一怒之下1晚上就把全部項目代碼重構了。那一天 1 年新手終於回想起了被 7 年老司機支配的恐懼,躲在角落懾懾發抖……媽個雞的當年聰頭還是 CPP 轉 Python 入門,JAVA 拋棄了好久後重寫的能力……

而且他無論是在做人還是做工程上都教給了我極多的淫生經驗,是那個年代真正意義上的全棧 tech leader ┑( ̄Д  ̄)┍ 想想當年寫的一個 PaaS,琢磨了我幾個晚上媽個雞。

所以你問我這公司如何,國內後端技術系的公司我只看好2個。一個是 hyper,真正的掌握核心科技,一個是 pingcap,雖然我認為你們 codis 科技樹點歪了,但 tidb 想法和產品真是不錯。最重要的是,不是事有沒有前景,不是說撈了一票就走人那樣,這個團隊,太強太務實。有這種團隊,做啥前景都不會差的。


非PingCAP相關人員來回復一下,幾個月前去面試了一次。

我個人是這麼看的,當程序員越來越多、門檻越來越低時,像資料庫、OS這樣的基礎軟體就越需要靠譜的團隊公司來維護,PingCAP做的就是面向這樣公司、項目的生意:公司的業務開發者快速的去擼業務,至於分庫分表、數據一致性、容災等事情就交給我們吧,一般的sql怎麼寫,在我們這裡就怎麼寫。

實際上各種雲做的也是類似的生意。

所不同的是,雲賣的是流量,PingCAP賣的是軟體授權。

我個人對這個方向還是看好的。我認為中國互聯網發展到這個階段,論市值影響力等,我們已經有BAT這樣的公司,未來也一定會出現像Nginx、docker、Spark這樣以一款自主開源軟體來立足的純技術導向公司,PingCAP不知道未來會不會做成,但是這方面走在了前面,祝福他們。


我們的業務現在都在阿里雲,希望能在雲上看到TiDB.畢竟自建資料庫維護實在太累


上面這麼多回答,一個指明盈利模式的都沒有(也可能是我沒看懂ㄟ(▔ ,▔)ㄏ)
並不是在批評,只是質疑,希望後面的答題者能解答我的疑惑


盈利模式估計未來和我現在實習的公司差不多吧,差不多就是甲骨文玩的那套,軟體分兩版,社區版和商業版,商業版高額付費授權,並提供售後技術支持。
雖然tidb是一個很新的名字,但是在殼子是很大程度上兼容MySQL的,所以只要他們搞銷售的人比較給力,會慢慢賣出去的——不過我很好奇他們有多少現場支持工程師,現場支持工程師也是產品的一部分啊,我司現在就有些捉襟見肘,研發工程師兼職去現場會耽誤開發進度的


偷偷寫點簡歷:
我們的客戶國企偏多一點,像國家電網什麼的,我實習第一個月寫了一個oracle資料庫的數據導出工具,現在已經投入了生產環境,暫時還沒什麼bug。

現在在搞類似TiSpark的東西,我自己從頭寫,限制條件是要用c++去操作spark集群來優化MySQL的語句,因為要作為擴展融合在公司原來的產品里。目前定下來的方案是用Python的API,然後cython一下封裝成c的API。
實習結束在明年五月份,希望到時候能有去pingcap面試的機會


推薦閱讀:

截止到2017年末(原為2014年),龍芯處理器的發展狀況如何?
印度經濟為何跳過輕重工業的發展階段,直接進入軟體業這種高大上行業?
如何備考 CCNA CCNP 和 CCIE?
生活中哪些地方應用了 Oracle 的產品或服務?
我國將開始部署和建設 IPv6 地址項目,有什麼意義?

TAG:創業公司 | 資料庫 | 程序員 | 信息技術IT | IT行業 |