標籤:

如何選擇適當的數據可視化軟體?

caravel,tableau,spache kylin 之間怎麼選擇,各自特點優劣情況


Tableau

Tableau是一家提供商業智能的軟體公司,總部位於美國華盛頓州西雅圖市,致力於幫助人們看清並理解數據,幫助不同個體快速且簡便的分析、可視化和分享信息。

Tableau是新一代的BI軟體,基於斯坦福大學的突破性技術,Tableau公司在全球擁有9000多家企業或組織客戶,遍及各個行業的各類規模企業。2011年,Tableau被美國(Gartner)高德納諮詢公司評為世界上發展速度最快的商業智能公司。

Tableau 是桌面系統中最簡單的商業智能工具軟體,Tableau 沒有強迫用戶編寫自定義代碼,新的控制台也可完全自定義配置。在控制台上,不僅能夠監測信息,而且還提供完整的分析能力。Tableau控制台靈活,具有高度的動態性。

Tableau公司將數據運算與美觀的圖表完美地嫁接在一起。它的程序很容易上手,各公司可以用它將大量數據拖放到數字「畫布」上,轉眼間就能創建好各種圖表。這一軟體的理念是,界面上的數據越容易操控,公司對自己在所在業務領域裡的所作所為到底是正確還是錯誤,就能了解得越透徹。

特性:

輕鬆整合。共享內置於 Tableau Desktop 的分析視角。

交互性。您可以過濾、排序並深入挖掘特定的詳細信息。

完全免費。只需下載即可開始瀏覽數據。

Caravel

Caravel 是 Airbnb (知名在線房屋短租公司)開源的數據探查與可視化平台(曾用名Panoramix),該工具在可視化、易用性和交互性上非常有特色,用戶可以輕鬆對數據進行可視化分析。

核心功能:
快速創建數據可視化互動儀錶盤
豐富的可視化圖表模板,靈活可擴展
細粒度高可擴展性的安全訪問模型,支持主要的認證供應商(資料庫、OpenID、LDAP、OAuth 等)
簡潔的語義層,可以控制數據資源在 UI 的展現方式
與 Druid 深度集成,可以快速解析大規模數據集

Apache Kylin

Apache Kylin(麒麟)是由eBay貢獻給開源社區的大數據分析引擎,支持在超大數據集上進行秒級別的SQL及OLAP查詢,目前是Apache基金會的孵化項目[1]。本文是一系列介紹快速數據立方體計算(Fast Cubing)的第一篇,將從概念上介紹新演算法與舊演算法的區別以及分析它的優劣。該演算法目前正在內部進行測試和改進,將在Apache Kylin 後續版本中發布。源代碼已經公開在Kylin的Git代碼庫中[2],感興趣的讀者可以到相應分支查看。


真理和美感一直是同一枚硬幣的兩面。

——莫里茨-史泰芬

創建信息圖是在「審美」和「信息」兩端之間移動。

——弗朗切斯科-弗蘭奇

————————————我是名人名言的分割線————————————

二十一世紀,諸多神器湧現江湖。類BI者有之。功能全者有之。簡便易上手者有之。令人眼花繚亂,難以抉擇。

然則有人,訪遍江湖,擇佳者而嘗之,又借百曉生之名,編《數據可視化兵器譜》。

今摘錄於此,如有雷同,實屬巧合。

第一,Tableau。又名「每個人都能使用的分析工具」。

官方網站: Tableau Software

Tableau的可視化產品以軟體為主,兼有saas及app。用戶定位為CXO等商業用戶(business user),主要價值在於,幫助企業釋放最有價值的資產——數據和人員的能量。

Tableau在各方面都甚為強大。

數據源方面,已開發的有Tableau server、amazon aurora、amazon EMR、amazon Redshift、Anaplan、Apache Drill、Aster Database、Cloudera Hadoop、EXASOL、Firebird、Google Analytics、Google BigQuery、Google CLOUD SQL、Google表格、Hortonworks Haddop Hive、HP Vertica、Kognitio、MapR hADOOP hIVE、Marketo、MemSQL、Microsoft SQL Server、MySQL、OData、Oracle、Oracle Eloqua、Pivotal Greenplym Database、PostgreSQL、Presto、QuickBooks Online、Salesforce、SAP HANA、SharePoint列表、Snowflake、Spark SQL、Teradata……此外還有web數據連接器,並且支持數據api、sql查詢、同步客戶端等。

數據處理方面,支持數據關聯、合併、混合、SQL查詢、篩選、數據透視、欄位拆分、自動歸類等。

數據可視化方面,擁有文本表、熱圖、突出顯示錶、符號地圖、填充地圖、餅圖、水平條、堆疊條、並排條、樹狀圖、圓視圖、並排圖、線(連續)、線(離散)、雙線、面積圖(連續)、面積圖(離散)、雙組合、散點圖、直方圖、甘特圖、盒須圖、標靶圖、填充氣泡圖等等。

交互方面:支持上鑽、下鑽、透視圖、組合圖、頁面控制項、過濾、預測、趨勢線、數據桶、參數控制項、定義唯一值、添加動作等。

還能實現:計算欄位、使用表計算轉換至、詳細級別表達式、在數據中查找群集、百分比、參考線/區間/分布/箱、合集、參數、對數軸等等。

在2017年2月gartner發布的MAGIC BI魔力象限報告中,Tableau保持領導者的位置。王者之位當之無愧。

價格方面也相當合理,更有兩個免費版本:NGO版及學生版。

公司總部在夜未眠的美國華盛頓州西雅圖,中國地區的子公司與辦事處就有6處,更遑論多家代理商,從客戶數量、行業廣度、以及令人眼前一亮的典型客戶可以看出,Tableau的市場佔有率相當之高了。

從運營角度整理了一下Tableau的成功因素,但是,大家心裡都知道,產品本身的牛逼是最關鍵的。

有誰家產品的app多於Tableau,請踴躍舉手讓百曉生知道……

最後,雞蛋裡挑骨頭,說一說改進空間:

1、數據準備方面,很多工具都內嵌了etl工具,tableau貌似是沒有的。也因此,市面上出現了專門為彌補tableau數據整合缺陷而設計的產品出現&<如:snaplogic&>

2、tableau支持報告導出、列印、郵件通知、站點訪問等,但是沒有建立群組實時溝通的功能,類似於domo的buzz,數據觀的數據協作之類。如果能夠實現在某個故事裡面成員直接溝通,就更強大了。

第二、Qliksense。又名「以用戶為導向的管理型自助式BI類產品」

官方網站:http://www.qlik.com/

qlik旗下包括qlikview和qliksense,其中sense更偏向自服務,因此下文所說均是qliksense的產品特點。

也是在Gartner Magic BI裡面進入領導者象限的一個產品。以網站為主,saas為輔,自我定位為免費的數據可視化和發現工具,使每個人都能夠便捷地分析數據,並快速作出商業決策。

從數據源可以看出要少於Tableau,包括Apache Hive、cloudera、IBM DB2、Microsoft sql Server、 MySQL Enterprise Edition、Oracle、PostgreSQL、Sybase ASE、TERADATA、ESSBASE等。有開放式的數據連接器:"REST"(通過輸入url與sequence ID、用戶名、密碼來連接網路數據);ODBC;OLE DB;還可以連接QVD文件、QVX文件、Web文件、所有文件、csv文件、excel文件(一個文件多個sheet頁,上傳一次即可)

第三方雲應用目前暫時只有salesforce。

公共數據方面強於tableau,提供一個QLIK DataMarket(包括1個免費版、5個高級版,可選擇購買;涵蓋氣候、貨幣、人口統計學、經濟、財報、股票等方面)

另外,也支持數據API,SQL查詢、同步客戶端。

數據處理方面,支持數據關聯、SQL腳本編輯。可以添加維度、度量;(在添加維度時添加下鑽)

可視化方面,擁有表格、餅圖、地圖、散點圖、樹形圖、條形圖、透視表、文本和圖片、儀錶、折線圖、組合圖、kpi等。

交互方面有篩選器窗格(過濾);下鑽;聯動;多種選擇項類型;智能搜索

qlik公司成立最早,全球市場耕耘時間也長一些。但在中國市場,應該還是tableau的表現更亮眼。

最後說說對產品的感覺。雖然說易用性要高於qlikview,但也是繼承了bi的路子,說是自助式,真的數據小白上手還是有點困難的。甚至說,如果非得要付出學習成本的話,那還不如直接選擇tableau。畢竟學會tableau,是真刀真槍給自己職場鍍了金的。

第三,數據觀 又稱「最易上手的數據分析雲平台」

官方網站:數據觀|新一代商業管理雲

這是一個沒有出現在gartner魔力象限的產品,但還是義無反顧把它放第三了,主要因為以下兩點:

第一,它的底層資料庫是GBase 8a MPP列存式資料庫,隸屬於南大通用,品牌多年蟬聯「國產資料庫市場佔有率第一」,在很多方面的表現是超越國外top廠商的,所以數據觀在處理tb-pb級數據量時,也能做到秒級響應。

第二,國內國外的各種產品,這個是設計的最容易上手的一個,從打開產品到做成第一個圖表,用的時間最短。產品內部也說人話,這點挺讓人感動的。

相信很多人有心做數據分析,但都敗給了工具。這個世界上80%的數據分析工具都是設計給20%的專業人員的,但另外80%沒用過BI、沒學過SQL、沒編過程、連一句最簡單的R語言都不會、卻在自己的業務領域——比如銷售、運營、財務、人力資源、產品等方面頗有心得與野心的人,他們也希望擁有一個可以馬上上手、挖掘數據價值的工具。這個產品就是開放給這80%的人的產品。

數據連接方面,有mysql、sqlserver、oracle、Gbase 8a,以及salesforce、金數據、明道、夥伴雲表格、微信公眾號、worktile、百度網盤、每人計、cloudcc等等等第三方雲應用,並支持本地excel與csv文件

此外支持數據API、同步客戶端

數據處理方面,有在線ETL,通過滑鼠拖拽點選來完成合併、關聯、分組聚合、計算、添加常量列、列轉行等等;此外支持sql,有更多需求的也可以自己寫

可視化方面,有表格、餅圖、柱圖、線圖、面積圖、散點圖、漏斗圖、地圖、GIS、雷達圖、KPI、金字塔等等,其中地圖又分為區域地圖、散點地圖、熱力地圖,展現區域性分析十分方便;

交互方面支持下鑽與全局過濾,另外可以一鍵計算同環比等等。

最後有數據協作功能,支持分享、建立群組、實時溝通。

所有的一切都是通過滑鼠拖拽、點選來實現的,特別簡單。

手機端有ios的app,android也可以通過關注公眾號實現手機端的應用。

SO,希望快速實現數據驅動、而且儘可能全面提升企業數據分析能力的,數據觀是一個很好的選擇。畢竟,上手簡單,無論是人員的學習成本還是賬號的購買成本,以及付出的時間,投入都很少。

第四:永洪BI 又稱「一站式大數據分析平台」

官網:北京永洪商智科技有限公司|大數據分析平台yonghongtech.com

在百度上搜索永洪bi,出現在第一條的居然是

有點替永洪委屈啊 下面百度推薦的幾個bi說說,你們對永洪做了什麼?(joking)

永洪是把自己定義為大數據領導者的,產品主要面向企業決策層,強調自服務,經過試用,仍需一定sql知識。

數據源方面,連接以下資料庫:mysql、sqlserver、oracle、GENERIC、ACCESS、DB2、DERBY、INFORMIX、SYBASE、VERTICA、DATA MART、HIVE、SPARK、POST GRESQL、HANA、KINGBASE、IMPALA、PRESTO

沒有第三方雲應用

支持數據API,sql查詢、script查詢、內嵌數據查詢、mongo查詢、數據集市查詢、定製查詢

數據處理方面,支持數據關聯、合併、SQL、自服務數據查詢

可視化方面,有表格、餅圖、柱圖、線圖、面積圖、散點圖、雷達圖、地圖、詞雲、瀑布圖、帕累托圖、矩形樹圖、圖片、文本

交互方面支持上鑽、下鑽、過濾等

reporting方面,支持報告導出,url傳參。

百萬行數據以內支持秒級響應,tb-pb級數據,需要另外購買mpp組件

價格就不知道了,應該是按照數據量收費的。

——————————————————————————————————————

感覺自己已經寫了很多。

其實如何選擇適當的數據可視化軟體——這個問題的題眼,就在於「適當」。

適當誰?當然是適當自己。

如果您是數據分析專業人員,大企業工作,預算充足,首選推薦購買Tableau。

如果您是業務人員,有數據分析需求,希望低成本進入這個領域,首選推薦數據觀。


推薦閱讀:

數據可視化是讓信息易讀,還是更複雜?
如何優雅的使用jupyter?
數據可視化的軟體,個人使用的,求推薦,最好多說幾個,多多益善?
哪些適合宿舍用的電腦椅 ?
如何將枯燥的大數據呈現為可視化的圖和動畫?

TAG:數據可視化 |