最近IBM發布了Watson Analytics,這意味著什麼?

最近IBM 發布了沃森分析系統(Watson Analytics),IBM稱,企業可藉助沃森分析將數據免費上傳到IBM雲端,隨後便可收到IBM認為是「可供商業人士使用的預測性見解」。

在網上搜索了一下,各種雲里霧裡。我想問一下,IBM解決了哪些問題,達成了怎樣的成果,這套系統可以做哪些事情,以後有怎樣的發展?


Watson Analytics是IBM基於Watson認知技術構建的一個創新雲分析平台,它為用戶提供了一系列自助式的分析服務,包括數據準備、數據探索、預測、構建分析儀錶盤等。

Watson Analytics的一項重要特點是簡單易用的基於自然語言的自助式分析,使得「人人都能做分析」,即便是不懂IT的人士

在體驗這項服務時,用戶只需要上傳數據,點擊「探索Explore」,Watson Analytics就會分析數據,用自然語言列舉出用戶可能感興趣的一系列問題。點擊其中的問題,Watson Analytics會針對該問題,展現出精美的圖表,和用戶進行互動式的分析。然後,用戶可以利用「預測Predict」功能進一步做深入分析,或者通過「組合Assemble」功能,組合一系列的分析圖表進行綜合分析。

「你幸福嗎」這個話題曾經一度是網上熱門話題。關於「你幸福嗎」的神回復也是層出不窮。在提問者收到無數回復以後,必然是以數據的形式記錄並展現出來。

那麼,到底該如何將大量數據轉換成可視化圖片?

我來帶您體驗一下。

數據準備

根據Watson Analytics社區的一篇教程,使用下載自Happy Planet Index的數據,各國的幸福指數數據(不代表官方數據,這裡純粹作為學習使用。)目前網站的數據時間大約是2010-2012年的,很多數據是根據蓋洛普Gallup等諮詢公司的問卷調查統計得到的。

數據是一個簡單的Excel表格,共11個欄位,欄位描述如上圖,數據中包括各個國家的HPI(Happy Planet Index)幸福指數和排名,以及一些相關數據例如人均GDP,人口,生活水平期望指數,生態足跡(Footprint gha/capita這個指標八卦幾句,指標評估人均對生態的影響,是個有趣的指標,有興趣的同學可以在Global Ecological Footprint Calculator網站計算自己的生態足跡。)

數據分析

數據準備好了,讓我們開始分析吧!分析前需要在Watson Analytics上註冊一個免費的試用賬號。註冊登錄後,進到歡迎頁面,點擊Add,然後選擇Desktop,選擇你的Excel數據文件,選擇Upload,頁面顯示Transfer,完成後數據就緒了。

下面點擊Explore開始分析。什麼?還沒有建模,還沒有設計報表格式?對不起,在Watson Analytics上真的不需要。更驚喜的是,點擊Explore後,Watson Analytics會分析Excel數據,並且通過自然語言處理,生成一系列你可能感興趣的問題(英文顯示,這裡翻譯成中文易於理解),例如:

  • 各個國家的幸福年份數是多少?(What are the values of Happy Life Years by Country?)

  • 各個國家目前的HPI幸福指數是多少?(Whatare the values of Happy Planet Index by Country?)

  • 哪些國家的幸福生活期望指數和幸福指數比較高?(Which countries have high measurements for life expectancy andwell-being?)

  • 幸福指數和人均GDP關係大嗎?(What isthe relationship between Well-being and GDP/capita by Country?)

讓我們首先點擊第一個問題:各個國家的幸福年份數是多少?(What are the values of Happy Life Years by Country?) Watson Analytics 會自動識別我們數據中包含國家數據,通過世界地圖展示 :

其中,顏色越深的部分代表這個國家幸福的年份越久。好吧,這項數據顯然老牌發達國家佔優勢。那麼撇開歷史,活在當下的話,哪些國家更幸福?

點擊圖中的分析指標」Happy Life Years」,從下拉菜單中將指標替換「Happy Planet Index」,圖形發生了變化,現在顯示的是當下的各個國家的幸福指數:嗯,顯然金磚四國為首的發展中國家當下更幸福。

下面我們想找出那些對幸福生活標準期望高而且現實也確實生活幸福(夢想成真)的國家,回到開始的界面,點擊另一個問題:哪些國家的幸福生活期望指數和幸福指數都比較高?(Which countries have high measurements for life expectancy andwell-being?) 我們得到了下圖:

這裡縱軸代表幸福感(Well-being),橫軸代表對幸福生活的期望(Life Expectancy),因此越靠近右上角的國家在兩個指標上都越高,越接近夢想成真了。這裡有丹麥(Denmark),加拿大(Canada),哥斯大黎加(Costa Rica)…

慢著,為什麼氣泡有大有小?原來圖裡還有一個玄機,這裡氣泡大小代表了另一個指標:生態足跡(Footprint),氣泡越大代表人均生態足跡越高,即對環境影響越大。光幸福還不夠,幸福不能以破壞自然環境為代價,保持可持續發展,才能持續幸福。比較一下右上限的氣泡大小,我們發現哥斯大黎加實在是人類楷模,不僅幸福指數高,而且那個氣泡比起丹麥,加拿大小了幾圈呢,說明人家對生態環境的影響還要小,給個大拇指吧!

說到幸福感(Well-being),腦中不由浮起了那首歌「幸福在哪裡?」,那麼幸福感和哪些因素有關呢?是財富嗎?讓我們點開這個問題:幸福指數和人均GDP關係大嗎?(What is the relationship between Well-being and GDP/capita byCountry?),出現了下圖:

這裡縱軸代表人均GDP,越靠上越高,橫軸代表幸福感(Well-being),越靠右越幸福。先看看右上角,丹麥,芬蘭,奧地利,比利時,還有加拿大,澳大利亞,這些國家不但富有而且幸福指數高。那麼難道真的沒錢就沒幸福,還不給人窮著樂了?請看回右下角,哥斯大黎加,巴西,阿根廷這些國家,雖說人均GDP只有15K左右,離右上角那些國家的40K人均GDP差了一倍多,但是幸福指數卻差距不大。看來幸福指數並不由人均GDP決定,錢確實不是萬能的。

那麼到底什麼才是幸福感的主要因素呢?

這裡我們就需要用到Watson Analytics中的預測(Predict)功能了,回憶一下我們的數據,在Excel的每一行數據中都含有幸福指數,以及相關的人均GDP,人口數量,人均生態足跡等數據,我們可以建立一個預測模型,看看哪些相關變數對幸福指數影響最大。點擊預測(Predict)功能,把上述指標放進要預測的列表,然後開始預測,我們得到下圖:

這張圖對關聯指標進行了各種組合(縱軸的Sub Region),並分析了它們對幸福指數(橫軸)的影響。我們發現第一組指標對幸福感的影響是最強的。那麼第一組中都有哪些因素?我們點擊最上面的橫條,具體來分析它:

在這張圖中,我們有了答案。圖中的標題顯示,原來對幸福指數貢獻最大的是生態足跡(Footprint)和幸福的年數(Happy Life Years),可信度是81%。圖中橫軸是生態足跡(Footprint),縱軸是幸福的年數(Happy Life Years),顏色越深代表幸福指數越高。對比這兩個指標,又以縱軸幸福的年數(Happy Life Years)影響更大,就是說幸福的年數越多,則繼續幸福的可能性越大。為什麼?難道幸福是可以遺傳的?非也,筆者的結論是只有每一代人都努力減少生態足跡,減少對環境的破壞,保持長期可持續發展,才能造福子孫後代,世代幸福。你贊同嗎?

如果對這個結論背後的演算法感興趣,可以切換一下視圖,下圖中Watson Analytics會告訴你它用的演算法,由於我們需要分析的幸福指數是一個連續變數,Watson Analytics自動使用了線性回歸(Liner Regression)演算法,建立了一個多階方程式來計算相關變數如人均GDP,生態足跡等因素與幸福指數之間的關係,並選擇了其中關聯性最緊密的組合。當然,這都是圖形背後的故事,Watson Analytics的強大之處在於分析人員根本不需要關注複雜的模型和演算法,一切都已經自動化,用戶需要關注的只是分析結果和它的含義。

結論

怎麼樣?通過本次對Watson Analytics分析服務的體驗,是不是對分析過程的易用性和基於自然語言的智能化引導印象深刻?通過Watson Analytics,只要有數據,點點按鈕,每個人都可以進行數據分析,而且並不需要關注高深的模型和演算法。實際上,「看圖講故事」,透過精緻的圖表,分析後面的業務含義,才是分析員真正的關注點,這不正是分析師們期待已久的下一代自助式分析嗎?

另外,本次體驗只使用了Watson Analytics基本的數據探索(Explore)和預測(Predict)服務,可以說只使用了Watson Analytics豐富服務的冰山一角。Watson Analytics上還提供了對數據的加工(Refine)服務,對各種分析結果進行綜合的組合(Assemble)服務,甚至可以讓Watson根據分析結果生成令人信服的故事。Watson Analytics還可以結合IBM Bluemix公有雲上的服務一起使用,例如使用Bluemix的DashDB存儲更複雜更大量的數據源進行分析;進行社交數據、天氣數據、物聯網數據的分析等。目前,各行業的分析人員正在使用Watson Analytics構建自己的創新分析應用。

在Watson Analytics的社區中,有些有趣的案例令人腦洞打開,例如用到Watson Analytics來挑選球員,構建自己攻守兼備的最佳陣型https://community.watsonanalytics.com/dream-el-salvador-soccer-team/

你幸福嗎?Watson Analytics,一個新時代懶人神器。不幸福都會幸胡哦!

如果您對IBM Analytics感興趣,可以微信搜索「IBM大數據與分析」公眾號進行關注。上面會有許多資源供參考!


現在還在邀請測試階段,號稱是可以分析非結構話數據


總覺得大數據背後有很多好處


神應用,以後會因為watson平台出一堆的創業公司。


推薦閱讀:

吳恩達帶斯坦福ML組發了篇新論文:深度學習識別14類心律不齊準確率超人類專家
寫給大家看的機器學習書(第一篇)
中國網民最關心這6項黑科技,一個比一個「黑」,個個改變世界
AlphaGo下贏了柯潔,還下出了一盤營銷大棋

TAG:雲計算 | 人工智慧 | IBM | 數據分析 | 自然語言處理 |