當我們投大數據時,我們在投什麼

《經濟學人》雜誌在今年提出過一個有意思的觀點,它認為『數據』是數字經濟時代的『石油』,是後工業時代數一數二的大宗商品。這個比喻非常貼切,在這篇文章中,我們來看看數字經濟時代開採『石油』的基礎設施技術。文末彩蛋是華創資本2017年在大數據基礎設施領域的布局。

過去五年,『大數據技術』從概念提出,最初被互聯網公司採用,到現在已經在金融、電信、零售、能源、安防、交通等等傳統大行業普及開來,湧現出了大量新興技術公司。『大數據』這個概念在各種場合被提到過太多次,以至於相比『人工智慧』,『大數據』已經顯得過時,某種意義上講,Big Data是AI的前提與基礎。從落地場景的角度來看,大數據技術的應用場景從互聯網到傳統行業,這本身也是大數據技術摸索商業化落地的過程,可以說,走過了新技術商業化的一個小周期,褪去熱詞的外表,成為了一個更加嚴肅的門類。從功能的角度來看,過去幾年成長起來的大數據公司有應用層的創新也有底層技術的創新,但大部分是應用層的創新。

為什麼會湧現出大量的大數據技術公司?背後的驅動力是什麼呢?如果將數據比作『石油』,將圍繞數據而形成的商業環境定義為『數字經濟』的話,我們認為數據在以下4個『V』維度的增長是數字經濟持續發展的關鍵,也正是數據在這4個維度的持續增長驅動了大數據時代的創新機會

  • Value 數據價值:無論是從個人角度、社會角度還是從企業業務價值的角度,數據在承載的價值越來越大。我們觀察到,企業運用數據技術的場景在不斷蔓延。過去,數據技術僅僅被應用於支持企業最核心的IT研發,例如支持銀行的Core banking系統,因此數據技術更像是一個B2D的生意,Business-to-Developer;在此基礎上,數據技術被逐步應用到企業的內部運營支持上,例如BI系統和用戶數據分析系統,這兩個品類下產生了大量公司,我們還看到越來越多的『Analytics類』細分品類被發明;與此同時,越來越多傳統行業的業務實現線上化,數據技術成為支持企業完整業務運營的關鍵。
  • Variety 數據維度:我們可獲取到的數據維度在呈多元化發展,這與數據產生方式的多樣化相關,本質上是生活、生產、社會的方方面面實現數字化的過程。例如移動應用產生的用戶內容及用戶行為數據,伺服器端產生的日誌數據,工業物聯網感測器產生的機器數據,安防攝像頭產生的實時視頻數據等,數據在以越來越豐富的維度被採集。我們可以期待,每一個關鍵的數據維度都是一個能產生若干上市公司的品類
  • Velocity 增長速度 & Volume 數據規模:據Oracle的預測,到2020年,全球每年產生和複製的數據將達到45ZB(1ZB=十萬億億位元組),年複合增長率為40%左右。在數據全方面爆發的趨勢下,未來必然產生數據存儲及計算領域多次『系統性』升級的機會

大數據技術的版圖百花齊放,在華創內部,我們通常把它簡化為兩層:應用層和基礎設施層。從創業的角度講,應用層的關鍵在於業務理解能力,基礎層的關鍵在於技術領先性及商業落地能力。

應用層通常是大數據技術在一個行業場景的落地,例如金融風控、供應鏈優化等,或者是一個職能的分析工具,例如銷售線索推薦、用戶數據分析、社交輿情分析等。應用層的創新機會通常呈多元化分布,處於不斷開創新品類市場的狀態,往往從中小客戶需求切入,對於創業者而言,對業務理解的要求大於技術複雜度的要求,由於離業務比較近,應用層 "本土化" 的競爭更明顯,誰更懂本土需求誰就有機會勝出,這也更加考驗創業者的『短跑』能力,特別是把握需求和時機找到空白市場並快速開創新品類的能力。應用層的大數據創新也更加容易被大眾理解,成為 「buzz word/熱詞」。

基礎層是與業務場景鬆散耦合、更加通用的底層技術,以數據的『計算與存儲』處理性能為核心,例如NewSQL、Elastic DataWarehouse等OLAP/分析型資料庫,Hadoop計算框架等『數據湖』平台,以及FlashArray、Storage Computing、In-Memory Computing等涉及硬體創新的計算和存儲技術。基礎層的創新周期比較長,通常是 「結構性」 代際升級的創新機會,挑戰現有市場格局。基礎層的產品服務通常是面向企業級客戶,對於創業者而言,考驗的是『長跑』能力,在巨頭籠罩之下找准市場定位,領跑者必須具備足夠的技術領先性及商業落地能力。由於與業務層有一定距離,基礎層通常是超越本土的 "全球化競爭" 格局,因此,做到世界級的技術領先是抓住大機會的前提。此外,以資料庫產品為代表,基礎層市場的特點是具有 「技術鎖定」 效應,客戶更換產品的成本通常比較高。

大數據基礎層技術的創新往往不會特別『熱鬧』,但是,是支持數字經濟發展最核心的基礎設施,這也是為什麼華創將大數據底層技術定為主要投資方向之一,底層技術的投資我們通常看下一代大數據基礎設施『結構性』升級換代的機會

將數據技術看作一個整體市場的話,操作型資料庫/OLTP(以Oracle/Microsoft/IBM關係資料庫為代表)和分析型資料庫/OLAP(以TeraData為代表)作為數據技術最核心的部分,佔據過半比例。未來,我們可以期待OLTP和OLAP迎來技術升級的機會,同時,應用層數據技術的市場空間被打開。

以資料庫為例,『上雲』是一個升級換代的歷史性機遇,不同品類也有自身的下一代機會:

  • 上云:單機 -> 分散式集群 -> ,上雲的本質上是對無限計算存儲資源高效調度的實現
  • 新型資料庫:SQL -> NoSQL -> NewSQL,NewSQL增加了對分散式關係型資料庫的支持,且打通了OLAP與OLTP,是資料庫領域的革命性創新機會
  • 數據倉庫:單機 -> MPP -> Hadoop-based(分散式) -> Cloud-based(存儲計算分離,彈性伸縮)

在商業模式方面的特性包括:

  • 雲端可用:基於雲的Pay-as-you-go按需訂閱銷售模式
  • 開源可控:相比閉源商業產品,開源的優勢包括低採用成本、社區推動技術演進、技術可控等,也正是因為這些特性,開源已經漸漸成為底層基礎設施的主旋律。

此外,底層技術安身立命的技術特點包括:高可用性、彈性擴展能力,高並發處理能力,實時分析能力,etc.

初創公司 vs. 雲計算巨頭

提到雲就不得不提到雲計算巨頭對初創公司的影響,我們認為即便巨頭的產品布局已經面面俱到,初創團隊作為精銳部隊仍然有機會突出重圍,前提是你至少需要考慮到兩方面:

  • 市場定位:是否有足夠的空間成長為一個相對獨立的產品服務體系,而不僅僅是雲計算平台的一個單點功能級產品?客戶是否存在跨雲需求?
  • 技術門檻:將自己放到一個全球化競爭的格局中,是否有足夠核心的技術創新?

華創對美國科技類上市公司做過一系列梳理研究,在大數據相關的領域可以發現:

  • 隨著數據4V的增長,不斷有新的數據技術品類產生上市公司
  • 解決的問題越普遍則市值越高
  • 產品化程度越高越則有機會做成大公司

最後,我們整理了華創資本2017年在大數據基礎設施領域的布局,這些公司在各自的細分領域都是世界級領先的下一代技術公司,其中大部分的總部設在矽谷。


推薦閱讀:

李世石黑163,超越了AI勝率的定義!
那個曾經黑掉iPhone和PS3的少年,要把你的車破解成無人車
Patchouli的機器學習系列教程四:基底函數——『器』

TAG:大数据 | 人工智能 | 风险投资VC |