Power BI將超越python和D3,成為數據可視化的福音、定性數據分析的未來?
最近突然發現了Power BI,玩了玩,感覺真是不錯,而且最重要的是免費,比什麼tableau不知道高到哪裡去了。人本來就喜歡免費的東西,加上現在它的飛速發展,相信未來Power BI會和它的同胞兄弟excel一樣普及,未來在Power BI上展示分析就像用excel插入圖像一樣自然順暢。
之前一直使用Python(主要是pandas)進行的數據處理。簡單地使用Power BI 之後,發現一些看起來只有在python中編程才能實現的「還有這種操作」的操作,在Power BI中就是點點滑鼠、連鍵盤都不用碰。而且定製顏色、格式、布局等細節操作,更加方便合理。本來以為python已經接近高效簡便的數據處理分析巔峰了。。。現在想想還是too naive。。。此外,Power BI還參考了時下最流行的可視化工具D3.js的設計,各種動畫、交互,在D3中看起來很複雜的操作,就是點點滑鼠。編寫D3.js代碼快吐血的時候,看到這個,真不知道如何想。。
現在來看,Power BI正朝著整合Python(pandas)、D3.js的路上邁進,而且在快速簡便的應用上上已經超越了前者。原來以為,只有簡單地問題不需要編程,中等和複雜的數據分析必須用編程解決。現在看來,中等、甚至部分複雜的問題都能無需或者少量的編程解決。
另外,我覺得Power BI這類軟體另一個很大的優勢,就是可以把多個圖表放在一起,並且隨時動態的觀察各個圖表之間的聯繫。我相信用過這類軟體的應該都清楚這種動態關聯展示的強大。往往可以從中發現一些隱藏的insight。而python,一般來說,還是單個或者數個圖表的靜態展示。D3雖然可以做到動態關聯,但是畢竟用起來畢竟麻煩。
PBI確實在機器學習領域無法和其他工具抗衡。因為PBI側重於用圖像去直觀理解變數之間的動態關聯。機器學習是從量化方面給一個精確的判斷。但是機器學習也將面向大眾化,最終也就是幾個介面,遲早也會變成人人都可以使用的日常工具而已。未來,就是點點滑鼠就可以進行機器學習、深度學習了。
————————————————
根據評論區的評論,思考總結了一下:
很多人說PBI不能做機器學習。確實。它不能根據給出的n個維度,最後預測出0還是1。但是,機器學習我覺得並不是數據分析的全部。現實的商業生活中,根據雜亂無章的數據,我們要做很多複雜的判斷,掌握整體的感覺,觀察某些細節,這並不是給一個0還是1的預測,就能解決的。
Power Bi這類軟體適用於發現問題,尋找問題,側重於定性的數據分析,從圖像的關聯上理解數據潛在邏輯。python和R等編程演算法,側重於解決問題,定量分析,精確預測。這兩者應該是互為補充互為影響,沒有誰優誰劣。做機器學習,也需要事先理解數據邏輯;理解之後,才能用各種深度模型挖挖挖。PBI這類軟體為數據分析者提供了發現問題的機會和一個很好的數據分析起點。有的時候,發現問題同樣非常重要;起點,有時決定了過程和最後的終點。
我可能要在這裡講一段不那麼中聽的話,希望大家認不認同,不必介意,言者無罪嘛~
首先,我不太贊同題主的觀點,理由如下:
其一:數據科學(或者說數據分析體系)是從後端(數據獲取、存儲、抽取、轉換、清洗)到中端(數據處理、分析、挖掘建模)到前端的數據可視化、報告自動化輸出、結果演示等一整個流程的閉環。這個世界上還沒有那個公司或者哪款產品能夠通吃整個數據分析流程,都只是在某一個環節存在優勢罷了。(否則如今的行業里應該只剩下一家公司來統領數據科學,事實上不是)。
其二:微軟確實在後端的數據存儲、資料庫解決方案、商務BI和人工智慧領域引領潮流,但是即便微軟的這樣的全球巨頭,也無法通吃掉整個流程,資料庫來說,access或者MS SQL都不是獨佔鰲頭的產品,Excel只適合用於做有限數據量下的淺層次數據分析(匯總、整理、業務建模和基礎的統計分析)。PBI剛面世應該不足兩年而已。
其三:當前大數據熱潮下,自助式BI(商務智能工具)領域裡,微軟的PowerBI的即便可圈可點,但是依然是一款待優化的BI工具,PBI的在數據可視化層面的設計,可以說仍然沒有逃出Excel內置圖形的束縛。相比之下,Tableau的可視化構架在設計理念上更加接近於商務分析人員的思維邏輯,如果稍加註意就能出來,Tableau把Excel內強大的數據透視表理念融會貫通,開發了自己的基於維度透析的數據透視圖系統,而PBI仍然在試圖定義單個圖表。(可視化社區的存在就是因為這種缺陷,需要補充圖表的類型)。Tableau是在定義可視化的業務邏輯,而非單個圖表形式,所以Tableau不需要可視化擴展插件。(在這一點上,Tableau要高明微軟不是一籌兩籌,二是整整甩了好幾條街,但是PBI在底層的數據源支持,對接資料庫以及緯度建模擁有更加靈活的解決方案,如dax函數,M語言等~)
其四:針對題主所說的,PBI是否會替代R、Python、Tableau的問題,我覺得這個著實有些誇張了,R語言與Python作為數據科學領域的左膀右臂,兩朵金花,風頭正勁,如日中天,目前還不存在被替代的可能。(看下數據科學領域的主流工具排名趨勢就知道了)R語言與Python是依靠全世界數以萬計最優秀的大腦來維護的。各種細分專業領域的模型與解決方案都會被開發成擴展包(庫),業務問題的解決是實時、高效、強針對性的,絕非桌面端BI工具可比。
其五:PBI的不成熟還體現在它的更新速度(也只有微軟這種不差錢的公司能做到那麼大體量的工具能頻繁的月更,大概是為了追趕大數據趨勢下自己延誤的那些時間窗口吧,大公司病帶來的後知後覺不是一次兩次了,移動互聯網和操作系統都因為決策遲緩沒佔到什麼便宜)。
其六:自助式BI工具其實簡化的是過程,是一個黑箱,無論是模型演算法還是可視化過程。就是說不懂技術的業務人員可以不用考慮過程(模型與演算法的執行與計算過程)、不用考慮圖表設計的配色、版式、主題等。所有的都是預設好的,所以才能提高效率,但是如果數據科學被變成一個黑匣子 ,那麼分析的結果可信度有多高,模型需不需要調優,圖形質量要不要改善,圖表報告能不能達到出版物級別等等,這些問題,PBI都無法給予肯定的答案。所以說那些掌握前端技術,對性能和質量都有極高要求的團隊,都有足夠的實力自建BI系統,至於PBI,那是專門給沒有技術背景的業務人員用的。(對於有編程基礎的科班數據挖掘人士來講,可能會覺得用自己熟悉的編程語言來解決會更加得心應手)
我的結論是,PBI的確給能給廣大商務分析人士帶來福音,很多人不用再受制於Excel功能限制。但也不必過分樂觀,它能解決的問題是有限的,無需過分誇大,至於替代R、Pyhton亦或者Tableau、D3js,暫時不可能,除非它能把每一個領域的佼佼者產品全部整合成一個巨無霸,不過不存在這種可能,即便可行,反壟斷法也不允許。
_____________
剛剛看到了高飛大神的回答,著實讓人醍醐醒腦,我同意他所說的,數據分析體系應該是一個工具箱,每一款工具的定位不同,在各個環節都存在優勢,各有能力邊界。最好的結果是——這些工具之間能夠和諧共生,相互調用~巨無霸型的數據分析工具的現實意義不是很大,涉及到各種工具學習成本的問題,選擇自己最合適工具就好~把精力放到業務分析邏輯上去,再好的工具,能不能發揮實力,還是關乎使用工具的人。
杜雨童鞋回答的很好了,從宏觀與理論角度出發.我從實際操作出來回答一下.
從實際使用的角度上來說,總覺得可以可無的感覺.而且使用的不太習慣.當然是因為我的問題,太擅長使用excel.而在excel里同樣可以使用M語言與DAX表達式,於是就不怎麼想使用power bi,最多把power bi當然一個更穩定的數據倉庫,數據最終還是從power bi抽取出來完成可視化輸出
首先感覺power bi 面板空蕩蕩的,好像還不是很完善.如圖是power bi的頂層面板
再看Tableau,是不是多很多功能的感覺?
再看power bi 的兄弟,也就是excel 的power pivot面板也比其更豐富.
從實際使用角度來說,power pivot比power bi確實更豐富.如圖所示:
用兩種公式演算法,得出來的排名不一樣,我想檢查兩種排名之間的結果區別是什麼?感覺無從下手,因為缺少降序或升序排列功能,還有篩選功能.像Power pivot就好檢查兩種公式之間得出的排名結果有什麼區別了.所圖所示
其次是公式編輯功能,power bi缺少檢查錯誤的功能.一些很複雜的功能,如果不檢查,真難以編輯.而power pivot就很舒服了.如圖所示:
像這麼複雜的公式,如果有錯誤,他會告訴我,錯在哪裡,好進行修改.
至於說使用power bi就是點點按鈕就可以了,哪完全是錯覺.如果沒有涉及到大量的M語言與DAX編寫,那基本還算沒有入門.DAX很難學,根據我的經驗.比如國內有頂級excel大神在初學M時,我只給了對方几部視頻,一下子就學會了,水平也超過我了.當然他興趣很深厚,肯鑽研,善於做筆記.但對於DAX表達式,他說實話,不能像M語言那樣快速的學會,一口啃不下.對於我,深感如此,做了一年多的準備時間,學習編寫了大量的公式.把全球最頂級的DAX學習網站裡面百分之七十的作業都做完了.
我英語不太行,基本是一邊學習DAX一邊學習英語,凡是我動過手的文件,都翻譯成中文了.如果不涉及版權侵襲,基本可以出一本書了.囧.可以這麼說吧,我不是坐著看別人講視頻學出來的,對方未必就比我熟悉,因為是新鮮東西,都站同一起跑線上,國內還不是很成熟.(而且看視頻,其實最多最多吸收百分之三十,還沒看兩下,或許就想睡覺了.某位IT大神說:看視頻學習出來的優秀程序員根本就沒有,完全是是看自我學習實踐能力,碼了多少代碼多少公式...),基本是一年的時間大量的編寫那個網站所有文件上千萬次完成的.(裡面的題目很難,難是由於本身演算法確實複雜,其次是英語障礙).只有一邊看攻略,一邊手動編寫模仿每個文件,才能吸收百分之八十以上.這完全是是一種肌肉記憶.所以認為躺著點點按鈕就能搞定完全是錯覺.
至於可視化,用excel也能完成.反而比power bi更漂亮.同樣具有數據的動態化.曾經滄海難為水,除去巫山不是雲.見過好的excel編輯的dashboard.就會覺得好像不過如此,就像吃多了山珍海味,就麻木了.至於醜陋的dashboard一眼就能判斷出來.當然用power bi也能編輯出來,工具是次要的,主要還是版式設計水平要高.其次才是使有工具的嫻熟度.
用Tableau隨便弄了副長條信息圖.速度蠻快的.這才是點點按鈕就完成了.從頭點到尾,半個公式沒寫,一直點到我不想點了,直接爛尾留了一截空白.哈哈.(為了答題,特意用tableau做了副潦草的信息圖....)
希望power bi再接再厲.
滿江紅 和郭沫若同志
小小寰球,有幾個蒼蠅碰壁。嗡嗡叫,幾聲凄厲,幾聲抽泣。螞蟻緣槐誇大國,蚍蜉撼樹談何易。正西風落葉下長安,飛鳴鏑。 多少事,從來急;天地轉,光陰迫。一萬年太久,只爭朝夕。四海翻騰雲水怒,五洲震蕩風雷激。要掃除一切害人蟲,全無敵。 先上毛主席詩詞。微軟這種紙老虎就會玩點花里胡哨的,我打賭樓主不用linux,不會vi。Windows一直是世界搞一套,自己搞一套,搞得自以為很吊,c#等反應過來才開源,可惜晚了,這樣的例子你可以找到很多,hadoop雖然跨平台,可是你看那個機構和企業用Windows搞分散式呢? 我不是linux吹,有俗話叫開源軟體就要在開源系統上用,我這裡想說的是數據文化的本質,數據具有很好的公共資源特性,就這個特點而言,數據就應當開放和相互印證。那這和開源有什麼關係呢?問題就在於根上的對立,封閉對開放。微軟並沒有給予產品使用者足夠的尊重,不是功能上的,而是知情權,這恰是和數據文化背道而馳。 已經被hadoop生態圈拋棄的微軟靠pbi自己來玩?開什麼玩笑。如果你覺得動動滑鼠就可以出來結果而竊喜,那麼恭喜你,你已經被綁架了。 螞蟻緣槐誇大國,就是這麼個景象吧!這是一個非常講究知乎套路的營銷,或者說題主無意間給兩品牌PBI和TB提供了一個好契機。先是用這樣的標題,植入如此多熱門技術的關鍵詞造勢!然後感言肺腑寫了一段濃濃的宣揚PBI的描述,我敢打賭題主並不精通Python,因為真正的Python黨應該是不屑於PBI的,也知道兩者的側重不一樣,所謂的自助性、複雜、免費字眼,那都是針對小白和新手。是不是應該@知乎小管家?
兩個產品TB走企業商用路線(雖然酷炫的可視化引得一幫個人的垂涎三尺),PBI則一直主打免費,大有當年excel的味道。PBI有大量的excel用戶群體,功能也是從解決excel複雜功能入手,就數據處理和儀錶盤,Power BI的效率是高的,一定程度上取代了excel寫VBA。不知道Power BI在處理大數據量,對接企業紛繁複雜的數據倉庫,大數據平台性能如何,HANA 1000W的業務表會不會報崩?畢竟excel曾經雞肋。
而TB個人覺得定位很專,可視化分析工具,起碼做為分析處理的前端,這交互是PBI是沒法比的,畢竟商用,價格也擺在那。供數據分析團隊用不錯,但是在搭建企業業務的分析場景和數據分析體系,還不如國內幾大商。
總體的感覺土豪企業上Tableau,就像互聯網企業給員工配MAC一樣。PBI就像米飯換精米。
python 是一門計算機學科的編程語言呢。它的魅力在於從運維到web到機器學習以及大數據裡面的spark編程都能吃得很開,與R語言不同的是,它的編程模式是對程序員友好的。R語言玩久了感覺不會編程了。
利益相關,前Power bi重度使用者!首先Power bi代替Python和R是不可能的,但是在最新版本中Power bi加入了R的借口,在很大程度上將Power bi的天花板提高了!但是想取代Python的功能是基本不可能的,提問者你平時使用的數據可能已經是經過大數據團隊清洗過的了,所以才會有這樣的誤判!不過數據分析這個行業的天花板很高,不要過度依賴工具,解決手頭的問題是關鍵,至於使用的是什麼工具並不重要,工具本身的好壞沒有解決問題本身重要!見過幾百萬的Excel模型,見過價值千萬的神經網路,對於工具千萬不要帶有好壞的有色眼睛去看。
看了下問題描述,這是典型的降維攻擊啊。
如果你認為Data scientist = 數據分析師 = 會用python = 會用pandas = 會用pandas做visualisation,
我承認data scientist確實可以集體辭職回家打農藥了。如果不考慮數據建模和機器學習之類的東西,而只是做數據處理和儀錶盤可視化這種東西,power bi還是不錯的,能提高工作效率,但是我真沒看到power bi能做到我所說的前兩者啊喂,數據分析裡面SPSS也是懶人福音,點點點就OK了,誰看見它取代R和Python了?
提問者修改了問題描述,感覺之前的描述更準確一些。
先說我的結論:Power BI確實是面向淺編程用戶的敏捷BI工具,也是數據可視化的福音(免費且有用戶基礎足夠大),定性數據分析的未來是什麼這個我不清楚,數據分析不太可能有統一的工具,估計以後也很難出現,而且定性分析和定量分析經常是結合使用的,Power BI也可以做定量分析。
一個成功的提問需要一個吸引眼球的標題,這個問題的前半部分就是,但很明顯這不是事實,比如
- Python和R有豐富的scientific and statistical libraries,Power BI沒有,但沒關係,我可以調用你;
- D3有很多酷炫的交互圖表,Power BI沒有,沒關係,可以基於D3開發然後放到Power BI里,目前基於D3開發的Power BI可視化組件已經有不少了,微軟實驗室在未來三個月馬上會發布一個基於D3的很酷的圖表。點擊下面這篇文章,跳到TimeLine storyteller chart那裡可以看到動圖 Power BI 即將放出的黑科技-Microsoft Data Insight Summit精華回顧
無論Tableau、Qlik還是Power BI都強調自己對Python或R的支持,廠商很清楚這類工具的邊界在哪裡,把一個敏捷BI工具做大做全是不現實的。所以超越不可能,共生共榮倒是有可能,如果說Python和R集合了全世界各地開發者的智慧,那敏捷工具就站在了它們的肩膀上。
問題到這裡回答完了,看了其他人的答案,我覺得還可以補充一些關於Power BI的內容,因為有不少誤解。
---------------------------------------- 補充內容 ------------------------------------------------------------------
Power BI是一個統稱,集合了不同場景下(Excel、PBI Desktop、SQL Server和Web Service)的多個工具,背後有兩門語言。像Biling Biling 說的,微軟是想打造一個BI平台,這個平台其實就是廣義的Power BI,Power BI不只做可視化這一件事,它的兩門語言,M已經嵌入到SSIS,DAX是SQL Server未來的發展重點(MDX的發展已經明顯落後與DAX)。通過Power BI你可以完成從數據清洗、分析、可視化展現和共享報告這整個流程。
vs Tableau
Tableau對自己的定位是數據探索工具,業務人員使用T可以快速實現一個從數據到業務的閉環,Tableau有強大的VizQL,通過滑鼠拖拽就可以實現靈活的分析,簡單的操作呈現給用戶,複雜性都交給了軟體,這是了不起的成績。而Power BI desktop目前遠沒有達到這種靈活度,複雜的分析需要寫大量的代碼,這對業務人員並不友好。微軟也意識到這個問題,正在不斷的提升軟體的易用性和對業務人員的友好性,它的追趕速度是超過友商的。未來能否在易用性上Tableau,現在下結論還為時尚早。
杜雨的回答里提到 「Power BI試圖定義單個圖表,Tableau定義的是可視化的業務邏輯,所以不需要自定義圖表庫」,我覺得不是Tableau不想做自定義圖表庫,是自定義的圖表很難像原生圖表那樣融入到Tableau的可視化探索中,因為背後要考慮很多VizQL的邏輯,成本過高。目前想在Tableau中繪製桑基圖、玫瑰圖,工程量是很大的。Power BI的圖表則相對獨立,而且開箱即用。自定義圖表受到軟體層面的限制比較少,再加上熱情的第三方開發者,Power BI的圖表庫非常豐富,其中不乏功能強大的圖表、但也有些雞肋,這又是另外一個話題了。綜合來看,Power BI的圖表開箱即用,複雜的圖表的使用成本很低,這一點適合用來做報表工具。
除了交互邏輯上的差異,Power BI相比Tableau還有一些缺陷,詳情可以看下這篇文章 了解Power BI的局限 - 知乎專欄
更新頻率
Tableau的版本迭代已經超過了7年,Power BI 是一個推出剛滿兩年的產品,這裡的Power BI指的是Desktop和Web Service,從時間維度上看,這兩種產品存在差距是很正常的。一個後發的產品,如果更新的還比友商慢,那真的是大公司病了。事實是,在PBI更新頻率上,微軟表現的像個創業公司,小步快跑。也給友商帶來了很大的壓力,今年Tableau和Qlik不約而同的宣布,提升各自產品的更新頻率至季度更新,理由是為客戶提供更好的產品。如果沒有Power BI這條鯰魚進來,事情不會變化的這麼快。
黑箱
一個答案里提到BI工具的模型演算法和可視化過程是黑箱,可能影響計算結果的可信度。我覺得,可視化過程黑箱化是可以的,因為圖表改變的只是計算結果的展現形式,但得出結果的過程必須有據可查、邏輯清晰。之前提到Power BI在交互邏輯上不像Tableau那麼友好,原因正是它還過於依賴DAX 硬編碼(Hard-coding),而DAX函數的原理、演算法以及調優,已經有詳細的闡述(目前中文世界裡還看不到)。所以PBI並不是一個演算法的黑箱。
PBI強大在哪
M可能是第一個你明明一直在用,卻感覺不到它存在的語言,通過滑鼠操作,普通業務人員可以完成數據清洗,其中包括很多複雜操作。這背後,都是一個個封裝好的M函數。如果你是高級用戶,完全可以擺脫界面的束縛,直接在編輯器里coding,M語言的700個函數都可以為你所用,如果還有搞不定的清洗,可以自定義函數、還可以調用API。與Python和R相比,大部分數據清洗任務只要動動滑鼠就可以了。對了,整個清洗流程都是可視化、可復用的。
DAX是一門專為數據分析而生的語言,由於上下文概念的存在,同一個公式在不同的上下文環境里運算結果截然不同。而改變上下文是如此的簡單,以至於點幾下滑鼠之後,同一個公式就可以運行截然不同的查詢。它允許你以思維的速度展開分析,而不需要每次打開編輯器,重新調整代碼,再運行。
據說學習了powerbi的人都比較帥,堅持學習powerbi的人未來薪水都會比較高,不知道是不是,樓主趕緊驗證
贊同高飛 的回答,修改之前的問題描述更準確,即PowerBI是淺編程用戶和數據可視化分析的福音。
對於前半句PowerBI將超越Python?我把這類問題與PowerBI,Tableau,Excel,R,Python,DAX,M,SQL,哪個更好 統統歸類為不同烹飪工具的比較問題 (這也是我一直想不斷補充知識,致力於回答的問題)
微波爐(PowerBI)是否會超越炒鍋(Python)的存在?
如果你說微波爐好,為什麼有很多人用炒鍋來做菜?
如果你說炒鍋做的菜好吃,為什麼有人只會用微波爐而不會用炒鍋?
學習的成本不同,應用的場景有差異,用戶的知識水平高度也不一樣,這個問題的答案一定不同。不過提出這個開放性問題是非常有意義的,因為我們可以通過辯論和投票的方式來加深對工具的認識。
那麼,PowerBI適合什麼樣的場景?
舉一個例子,假設我們有下面的幾張數據(信息量保守地講,可以是百萬、千萬行級),我們想針對該公司的產品,城市、顧客不同維度快速分析銷售業績、顧客數量、銷售額、佔比、環比增長率這些指標,並可視化輸出圖表(柱形圖、折線圖、氣泡圖...),最終評價業績表現、挖掘業務波動原因,為管理層提建設性意見。
對於該類商業分析需求,在PowerBI中做數據清洗、關聯表格建模、可視化輸出一氣呵成,不需要寫任何代碼就可以完成,甚至在PowerBI Service 中可以智能問答和快速見解的方式在秒秒鐘輸出可視化報表。
在這個場景下,PowerBI的敏捷速度是寫代碼的方式無法匹敵的,最重要的是,即使你不懂計算機編程語言,你也可以用PowerIBI瞬間完成這項工作,學習的門檻非常之低。相比之下,Python的學習時間成本會讓很多業務人員望而卻步。
當然,如果你的場景是抓取上證交易所過去多年海量的股票交易數據,並利用機器學習演算法預測股票的走勢,PowerBI絕對不是為這個需求而生的。
所以,PowerBI一定有顛覆性的超越,前提是你的場景是什麼。
如果想了解更多關於PowerBI的探討,我在下面放了幾篇最近寫過的文章:
站在Excel的肩膀上 - 知乎專欄
從Excel到PowerBI的5個理由 - 知乎專欄
PowerBI的M與DAX之爭 - 知乎專欄
16年年底無意間了解到了power BI,感覺很不簡單,就在知乎上搜了一下,略感很屌的樣子,當時我對這個完全沒概念,就因為感覺挺厲害的,花錢買的Power工坊的教程。
真心不便宜,買完以後三分鐘熱度,看了一點就特么把這茬扔腦後去了。今年5月份有個公司同事讓我給設計一個表格,當時感覺用Power BI做出來可能比較好,然後開始惡補視頻教程,聽的頭疼,硬生生給看了一遍,邊看邊做,居然還讓我給做出來了,反饋效果很好,吊炸天有木有!而且學習難度中等,只要勤快點多練習練習普通人就能比較快的掌握,簡直是神器,讓我開啟了新世界的大門。
尤其是學了Power Query清洗數據實在太方便了,雖然還不會M函數,但是處理一般的問題還是好用到爆!作為一位 參加了 2017年的 Microsoft Data Insight Summer Commit 的小NewBie. 我還是可以回答一下 這個問題的。
手機 像素差 將就著看。
從這張圖 我們可以看出來 微軟 真正的想要做的是一個BI平台,而PowerBI 只是 其實的一個部分這個部分的主要職責就是Data Visualization(數據可視化)。
不可否認的是,PowerBI 存在一些數據分析的功能 像是 data cleaning 之類的 甚至有一些資料庫功能。但是這些功能只是為了讓PowerBI更好的實現他的data visualization的功能而已。
「我就是要讓別人覺得:相聲界我影視演的最好,演員界我導演導的最棒,導演界我編劇編的最巧,編劇界我相聲說的最逗,這年頭,就要玩個綜合實力!」
但是,我們不能忘了,PowerBI的本職工作是 Data Visualization。
從這個圖我們還是可以看出,微軟的野心。微軟確實想一統江山,甚至無論在PowerBI 還是Azure 裡面都兼容R語言跟Python。
目前來說,PowerBI 還是搞不動數據可視化行業老大Tableau(我覺得)的,PowerBI 我能想到的優勢大概就是免費版比Tableau 的免費版能做的更多吧 = =。
你可以看到現在PowerBI只有這些Visualization,而且 這些visualizations 功能不夠全(我最不滿意的是不能自定義sort)。
為了解決這個問題,微軟把PowerBI customize visualization面向大眾,你可以自己做你自己喜歡的visualization,微軟則提供相應的API以及框架 。
如何寫呢? 微軟就兼容了D3js 等等 現在流行的編寫語言。
總的來說,微軟確實是想組建一個BI平台,而且已經初具雛形。我個人非常看好,也正在學習這些東西。
但是,我覺得PowerBI 只是其中的一部分,並不是全部。
當年我曾經以為,會使用UG/ProE/CATIA/SolidWorks中的一種就算是一名優秀的機械工程師了。
後來發現,這只是一個工具而已。
一份工作的核心是如何獲得結果,而不是如何絢麗的展示結果。
我沒有接觸過powerBI。但是我相信題主對python的理解還很naive。你說的所謂的『還有這種操作』或者『複雜的數據處理』,應該是很基礎很簡單的東西。我不太相信powerBI可以做到python的各種優秀的機器學習演算法,自動化數據處理,NLP,API收集等等。至於馬雲說的未來不會有數據科學崗位,我覺得說的是當AI發展到很牛逼的程度的時候,不需要。
IBM Watson一直在朝著這種,不需要數據分析師的BI工具努力。最終目標就是,你跟Watson問一句話,比如今天公司業績如何,哪裡出了問題,是什麼導致的,有什麼辦法解決。Watson就可以理解你得意思,自己查你得數據,自己上網找數據,自己分析,自己建模型,最後給一個人能理解而且可行性很高的答案。這就是BI工具的最終形態。但是還要多少年,我就真不知道了。
絕對支持,vba那破爛語法讓我實在沒興趣學下去。身邊還有兩個vba大神啪啪打臉。正在學,準備憝回去的
原來PBI 這麼高大上,我自己掌握了神器都還不知道
應該是要收費的,如果要power bi pro的許可權
建議題主先搞清楚PBI, Python, D3這幾樣產品/技術的特點和市場定位,再來問這樣的問題。
一款還不成熟的產品就大談福音、未來,是否為時尚早?
你們啊,不要動不動就想搞個大新聞。
只是把數據展示的漂亮一些。。。
和騙炮有啥區別?
推薦閱讀:
※怎樣用 Excel 做數據分析?
※在科學計算和數據分析領域中,今後 Python、R、Julia 各自會有什麼樣的發展趨勢?
※sklearn 中的模型對於大數據集如何處理?
※有沒有一些入門級的機器學習或數據挖掘的書推薦呢?演算法理論實戰都行的。
※有哪些免費軟體能夠根據數據生成分析圖,簡易一些的,能夠讓數據分析的新手快速掌握數據分析方法?