定位大數據分析平台,Kyligence憑開源優勢謀全球業務擴張

調研 | 李喆 倪賢豪

撰寫 | 倪賢豪

基於開源軟體推出企業級產品或服務是開源軟體的典型盈利模式,於Kyligence亦是如此。

Kyligence是領先的大數據分析創新公司, 由Apache Kylin核心成員組建。Apache Kylin是世界領先的開源OLAP on Hadoop項目,是首個來自中國的Apache軟體基金會頂級開源項目。

2017年是Kyligence成立的第二年,愛分析拜訪了Kyligence聯合創始人兼CEO韓卿,對這一年的得失做了復盤。

2017年Kyligence的發展可以從開源軟體和企業級產品兩方面闡述。

開源軟體Apache Kylin方面,2017年的主要改進是:增加了對於雪花模型的支持,有利於減少冗餘,節省存儲空間;引入了Spark,相比於原來用MapReduce構建Cube,效率更高;除此之外,還增加了對於雲存儲框架的支持並修補了不少BUG。

至於Kyligence本身,2017年也取得了長足的進步。可以概括如下:豐富產品組合,打造行業案例,完善組織架構,明確戰略方向。

完善產品體系,數據倉庫的架構趨於完備

KAP(Kyligence Analytics Platform),是Kyligence的核心企業級產品。該產品基於OLAP構建數據倉庫,以數據立方體的預計算來實現秒級查詢。

2017年,Kyligence團隊圍繞核心產品KAP做了產品體系完善。

截至2017年底,KAP已是十足的基於Hadoop的數據倉庫,擁有了較為完整的數據倉庫框架。具體來說,KAP的完善由兩部分組成。

第一,Apache Kylin的改進帶來的產品升級。

KAP是以Apache Kylin為核心的產品。Apache Kylin在2017年的這幾次版本發布帶來的新特性也同樣賦予了KAP。這也是基於開源軟體開發企業版本為盈利模式帶來的優勢之一。

第二,Kyligence針對KAP推出了很多企業級的功能,比如安全性管理等,並就企業客戶的需求重點做了性能優化。

結合已研發的替代HBase用於Cube存儲的KyStorage,KAP作為數據倉庫的架構已經完備。作為數據倉庫,這也是Kyligence給予其的定位。

除了KAP外,Kyligence在雲端也做了投入,於2017年底推出了Kyligence Cloud及Kyligence Robot(KyBot)。前者基於KAP提供雲上可擴展的企業級OLAP on Hadoop服務。後者則利用日誌分析、數據統計及AI,對Apache Kylin及KAP系統問題做診斷、優化,並可集成於KAP使用。

擁有整套數據倉庫框架的KAP接入客戶業務系統,通過ETL工具對數據做抽取、清洗、轉換、載入、刷新等操作後,便能為客戶提供快捷有效的服務,比如秒級查詢、高級複雜篩選、數據可視化能力等等。

加上內置的KyBot、KyAnalyzer、KyStorage等模塊以及雲端版本Cloud,Kyligence針對不同行業的需求形成了整體解決方案。其中,在所布局的幾大行業中均已形成了標準化的解決方案,如金融業的多維分析平台,通信業的用戶行為分析平台,互聯網電商領域的運營管理平台,以及針對手機廠商的日誌分析平台。考慮到Kyligence不做定製化內容,後續在規模複製上會有一定優勢。

目前,Kyligence的解決方案適用的應用場景眾多,比如數據查詢和分析,用戶行為分析,數據可視化及日誌數據分析等等。這主要還是數據倉庫類產品比較常見的場景,但考慮到多維數據模型下,數據立方體預計算帶來的秒級查詢能力很強,在數據查詢相關場景,Kyligence做的更為深入。

另外,Kyligence的目標市場主要還是數據倉庫及BI市場,具體到客戶層面,Kyligence目前更多地定位於大客戶,致力於為客戶的核心分析業務提供服務。

在數據倉庫細分市場上,傳統的領導者諸如Teradata、IBM等有著很強的競爭力和市場地位,KAP擁有完整的數倉架構後,將具備更強的挑戰該市場眾多先入玩家的能力。

在BI市場方面,雖然推出了自有敏捷BI工具KyAnalyzer,完善了數據倉庫的應用層結構,但Kyligence的核心策略是與其他展現、可視化廠家深入合作,通過Kyligence認證體系(KCP),與Tableau, MicroStrategy,Cognos,PowerBI,SmartBI等進行對接,完成兼容性測試,因此未來可以預見Kyligecne與其他BI玩家將會有更多的市場合作形式。

優化組織架構,國內外市場齊齊發力

2017年Kyligence的另一個改變在於團隊方面。

相較於年初的20多人,如今團隊規模已擴大3倍,達到了60餘人,研發人員佔比達到了60%~70%,其餘人員則以銷售及相關行政人員為主。

當前,Kyligence的獲客模式還是以直銷和合作夥伴推薦為主,但渠道的建設在後續會加強力度。與銷售環節相對的,Kyligence的收費方式是按年訂閱,具體的報價基於節點數,客單價多在百萬級以上。

組織架構上,過去的一年中Kyligence建立了專門的售後隊伍,研發人員得以從繁重的運營維護任務中抽身出來,專註於產品和技術的研發。

至於戰略的執行上,Kyligence在2017年貫徹了在金融、電信、製造及零售等領域的布局,堅持對於客群的定位,拿下了一批標杆客戶。

此外,Apache Kylin作為中國第一個貢獻到Apache軟體基金會的頂級開源項目,在助力開源社區建設的同時,也享受到了社區的反哺。

除了直銷獲客外,不少客戶是開源軟體Kylin的用戶轉化而來。2017年,Apache Kylin用戶由原先100多家增加到了500多家,其中不乏Adobe、百度、美團、鏈家、農業銀行等中大型企業。

未來加大力度建設開源生態,注重開源用戶到付費用戶的轉化,會給Kyligence帶來不小的紅利。

最後,在全球化上,Kyligence也取得了突破。2017年5月,Kyligence美國分公司正式成立,現在美國團隊也已成立並開始跟進項目。Kyligence Cloud這款產品也對海外市場的開拓有所助力,對於尚未建立辦公室的國家和地區,Kyligence可以通過Cloud為當地客戶服務。

近期,愛分析對Kyligence聯合創始人兼CEO韓卿做了訪談,現將部分內容分享如下。

雲端產品推出,Kyligence初探海外市場

愛分析:KAP是一款OLAP on Hadoop產品,針對HBase推出了KyStorage這一替代功能,過去的一年有無新的進展?

韓卿:KyStorage的主體工作已於2016年完成,2017年更多的是原有基礎上的優化。

2017年更多的還是針對KAP的新功能的引入,包括BI的整合,以及對於聚合查詢的支持等。

可以說,在用戶角度來看,KAP已經是一個數據倉庫了,不再依賴HBase,只是將數據存儲在HDFS上,是一個純粹的Hadoop上的數據倉庫。

愛分析:對於已經使用很多Hadoop集群的金融企業來說,使用KAP會否面臨兼容性的問題?

韓卿:不會。對於已經使用Hadoop的企業,只需將KAP安裝即可,並不會出現兼容性問題。

愛分析:Kyligence現在主要能解決客戶的哪些需求?

韓卿:第一,Kyligence為用戶提供了將部署在舊有OLAP系統上的應用遷移出來的很好選擇。

舊有OLAP系統已經很難支撐今天大數據的場景,客戶急需將應用遷移到大數據平台上,而Kyligence是很好的選擇。

第二,Kyligence能簡化用戶自舊有系統遷移應用的複雜程度。用戶從舊有系統遷移到KAP上,不需要寫任何程序,絕大多數操作都只是配置、安裝、調優。

愛分析:客戶從舊有平台遷移到KAP,會遇到哪些挑戰?

韓卿:對客戶來說,面臨的挑戰是在舊有平台上的應用版本比較陳舊,需要做必要的升級。

對Kyligence來說,舊有平台和KAP之間不可能完全兼容,我們需要解決兼容性的問題,確保遷移過來的應用良好運行。

愛分析:Apache Kylin在2017年發布了幾個新版本,主要有哪幾方面的更新?

韓卿:2017年4月30日推出的v2.0是Kylin誕生以來的最重要更新之一,引入了Spark Cubing以及雲存儲框架的支持、增加了雪花模型的支持等等。8月中旬的v2.1主要是修復了超過100個Bug以及擴大數據輸入源和SQL的支持。11月初的v2.2則是在穩定性和安全性上的改進。

愛分析:KAP的應用場景都有哪些?

韓卿:應用場景可以分為幾大類:

一、業務部門的實時數據查詢和分析。比如金融業的持卡用戶行為分析,管理會計領域的財務指標分析,電商領域的運營數據多維分析等。

二、業務數據可視化。KAP提供內置的敏捷BI工具KyAnalyzer,並支持主流的BI工具接入,實現數據可視化。

三、手機日誌數據分析。比如手機廠商對海量日誌數據的分析。

四、運營管理平台。KAP具備的秒級查詢能力,豐富的RestAPI介面,以及對現有Hadoop集群的良好兼容,能很好的勝任運營管理平台的功能要求。

愛分析:前端展現上,KAP與主流BI工具的兼容性如何?

韓卿:兼容性很不錯。在過去的一年,我們投入很大的精力去拓展與主流BI的連通性。

為此,我們推出了面向合作夥伴廠商的產品認證體系,適用場景不僅包括KAP與BI廠商的對接,還包括KAP與Hadoop及雲計算平台的對接等。

此外,我們還推出了新版本的ODBC(Open Database Connectivity,開放數據互聯)驅動,提供了一組對資料庫訪問的標準API,提高了對Tableau等主流BI的支持。

愛分析:KAP的產品定位是什麼?

韓卿:KAP現在的定位就是數據倉庫。從抽取數據,到後續的數據分析、查詢,包括前端展現,不管是通過內置BI工具還是接入主流BI廠商的工具,可以說已經是一個全站的數據倉庫。

與市面上其他做數據倉庫產品的友商相比,KAP的定位可進一步細化到Data Mart(數據集市)方向。對於一個企業的決策層來說,並不需要整個Data Lake的數據來輔助決策,更多地只需要與決策相關的數據即可。這部分數據對Data Lake的佔比可能也就在20%-30%。Kyligence重視的也正是把這部分與決策相關的數據做深。

愛分析:Kyligence Cloud產品的客群定位是?

韓卿:Cloud主要關注業務急速擴張的中大型企業。這類企業的特點在於絕大多數資源都投注在了業務上,對於大數據分析平台的建設力度往往不足。對此,Kyligence Cloud能很好地予以幫助。

此外,我們還通過Cloud去探索海外市場。國外在雲的成熟度和普及度上比國內高,對於還未能建立海外辦公室的地區,以Cloud產品能更方便快捷地給以客戶服務。

愛分析:Kyligence Robot產品能滿足客戶什麼需求?

韓卿:這款產品的定位是在線的診斷和優化平台,目前面向Apache Kylin用戶、KAP企業版(含高級企業版)客戶及Kyligence Cloud客戶。

在2018年,我們會投入更多的資源在上面,在服務好上述客戶的同時,也讓開源用戶受益。

愛分析:Kyligence開拓海外市場是出於什麼考慮?

韓卿:一方面是因為Kylin是開源技術,有很多開源社區過來的海外客戶。另一方面就是出於Kyligence全球化戰略的考量,通過產品出海,我們能獲得更好的發展。

新人不斷冒頭,國內數倉領域還在蓬勃發展期

愛分析:近年來,國內做大數據基礎軟體的公司越來越多,對此您怎麼看?

韓卿:首先,中國在過去的20年時間裡,培養了一個巨大的開發者群體,素質素養很高。

其次,過去10年里,國內互聯網發展迅速,包括移動應用等的發展,積累了海量的數據,隨之而來的技術挑戰是史無前例的。當國內的相關從業者具備解決這類問題的能力時,那麼在全球範圍內也就具備了優勢。

最後,開源技術和開源社區的發展帶來了很大的衝擊,國內從業者可以通過開源讓全球社區對其實力有所認知,也在其中獲得了很大的受益。

以上兩方面促成了這一現象。

愛分析:對於數據分析、數據倉庫這類底層技術的需求,您認為還有哪些行業存在很大需求?

韓卿:製造業對此的需求相當旺盛。

中國是製造大國,同時製造業的產業升級也面臨著很大的挑戰,可以看到這些年製造業出現了急劇變化。現階段製造業的轉型是離不開數據和數據分析的。這其中蘊藏著極大的需求。

愛分析:數據分析和數據倉庫在製造業有哪些應用場景?

韓卿:一方面是精細化管理。不管是通過互聯網還是物聯網,收集上來的數據通過數據倉庫、數據分析完成查詢、分析等工作,為企業決策提供幫助,把企業管理做深做細。

另一方面就是智能製造和下游的工業物聯網。對於製造企業而言,如何通過自動化技術,提升整體實力,進而達成智能製造。數據分析和數據倉庫能在其中起到很大的作用。

定位頭部客戶,標準化產品有利於規模複製

愛分析:目前合作的各行業客戶,大多處於什麼規模?

韓卿:在目前開展的業務中,更偏向和各行業的頭部客戶開展合作,比如行業里的TOP 10,TOP 100。

愛分析:目前的團隊規模如何?人員結構與2017年初有何變化?

韓卿:團隊人數從去年的20多人多人增加到了60多人。人員結構和去年差不多,研發的佔比在60%~70%,剩下的是銷售和市場人員。

愛分析:銷售模式以直銷還是渠道為主?

韓卿:還是以直銷為主,同時也在做渠道,新一年會在渠道上做更大投入。

愛分析:收費方式是怎樣的?

韓卿:Kyligence採取的是按年訂閱的方式,根據節點數報價。這也是目前唯一的收費方式。

愛分析:有無做定製化內容?

韓卿:沒有。目前Kyligence不提供內容定製,目前所有客戶使用的都是同一個發行版。

愛分析:Kyligence的目標市場是?

韓卿:企業級數據倉庫和BI的市場都是我們的目標市場,比如Teradata、IBM等廠商在數據倉庫和數據分析上的市場等。


推薦閱讀:

大數據時代普通人也要懂得,否則錢掉頭上只知道痛而不知道撿
大數據商業價值突破之路
HDFS中的Namenode和Datanode
用Apache Spark進行大數據處理——第一部分:入門介紹
大數據時代來了,你準備好了嗎?

TAG:大數據 | 大數據分析 |