數據分析工具類軟體,好用的有哪些?

從事數據分析工作半年,一直使用Excel,感覺已經可以滿足大部分需求。現在發現一些公司需要使用過SPASS、SAS、Clementine、R、Rapid-miner等工具類軟體 ,求指導和分析,哪款比較好用?


這類軟體主要用於更專業的數據分析挖掘工作,尤其是在銀行、金融、保險業。

SPSS、SAS都是用於統計分析,圍繞統計學知識的一些基本應用,包括描述統計,方差分析,因子分析,主成分分析,基本的回歸,分布的檢驗等等。SPSS用於市場研究較多,SAS銀行金融和醫學統計較多,有一些難度。

R語言像是綜合性較強的一類數據分析工具,集統計分析、數據挖掘,數據可視化。

展開來,講講數據分析~

這些數據分析工具的使用還是看需求,每個企業應用的選擇和方式都不同。數據分析的概念很廣,站在IT的角度,實際應用中可以把數據分析工具分成兩個維度:

第一維度:數據存儲層——數據報表層——數據分析層——數據展現層

第二維度:用戶級——部門級——企業級——BI級

1、數據存儲層

數據存儲設計到資料庫的概念和資料庫語言,這方面不一定要深鑽研,但至少要理解數據的存儲方式,數據的基本結構和數據類型。SQL查詢語言必不可少,精通最好。可從常用的selece查詢,update修改,delete刪除,insert插入的基本結構和讀取入手。

Access2003、Access07等,這是最基本的個人資料庫,經常用於個人或部分基本的數據存儲;MySQL資料庫,這個對於部門級或者互聯網的資料庫應用是必要的,這個時候關鍵掌握資料庫的庫結構和SQL語言的數據查詢能力;

SQL Server2005或更高版本,對中小企業,一些大型企業也可以採用SQL Server資料庫,其實這個時候本身除了數據存儲,也包括了數據報表和數據分析了,甚至數據挖掘工具都在其中了;

DB2,Oracle資料庫都是大型資料庫,主要是企業級,特別是大型企業或者對數據海量存儲需求的就是必須的了,一般大型資料庫公司都提供非常好的數據整合應用平台;

BI級別,實際上這個不是資料庫,而是建立在前面資料庫基礎上的,企業級應用的數據倉庫。Data Warehouse,建立在DW機上的數據存儲基本上都是商業智能平台,整合了各種數據分析,報表、分析和展現,BI級別的數據倉庫結合BI產品也是近幾年的大趨勢。

2、報表/BI層

企業存儲了數據需要讀取,需要展現,報表工具是最普遍應用的工具,尤其是在國內。過去傳統報表大多解決的是展現問題,如今像帆軟報表FineReport也會和其他應用交叉,做數據分析報表,通過介面開放功能、填報、決策報表功能,能夠做到打通數據的進出,涵蓋了早期商業智能的功能。

Tableau、Qlikview、FineBI這類BI工具,可分在報表層也可分為數據展現層,涵蓋了數據整合、數據分析和數據展現。FineBI和Tableau同屬於近年來非常棒的軟體,可作為可視化數據分析軟體,可常用FineBI從資料庫中取數進行報表和可視化分析。相對而言,可視化Tableau更優,但FineBI又有另一種身份——商業智能,所以在大數據處理方面的能力更勝一籌。

3、數據分析層

這個層其實有很多分析工具,當然我們最常用的就是Excel。

Excel軟體,首先版本越高越好用這是肯定的;當然對excel來講很多人只是掌握了5%Excel功能,Excel功能非常強大,甚至可以完成所有的統計分析工作!但是我也常說,有能力把Excel玩成統計工具不如專門學會統計軟體;

SPSS軟體:當前版本是18,名字也改成了PASW Statistics;我從3.0開始Dos環境下編程分析,到現在版本的變遷也可以看出SPSS社會科學統計軟體包的變化,從重視醫學、化學等開始越來越重視商業分析,現在已經成為了預測分析軟體;

SAS軟體:SAS相對SPSS其實功能更強大,SAS是平台化的,EM挖掘模塊平台整合,相對來講,SAS比較難學些,但如果掌握了SAS會更有價值,比如離散選擇模型,抽樣問題,正交實驗設計等還是SAS比較好用,另外,SAS的學習材料比較多,也公開,會有收穫的!

JMP分析:SAS的一個分析分支

XLstat:Excel的插件,可以完成大部分SPSS統計分析功能

4、表現層

表現層也叫數據可視化,以上每種工具都幾乎提供了一點展現功能。FineBI和Tableau的可視化功能上文有提過。其實,近年來Excel的可視化越來越棒,配上一些插件,使用感更佳。

PPT:辦公常用,用來寫數據分析報告;

Xmind百度腦圖:梳理流程,幫助思考分析,展現數據分析的層次;

Xcelsius軟體:Dashboard製作和數據可視化報表工具,可以直接讀取資料庫,在Excel里建模,互聯網展現,最大特色還是可以在PPT中實現動態報表。

最後,需要說明的是,這樣的分類並不是區分軟體,只是想說明軟體的應用。有時候我們把資料庫就用來進行報表分析,有時候報表就是分析,有時候分析就是展現;當然有時候展現就是分析,分析也是報表,報表就是數據存儲了!


我自己常用的數據分析工具就是excel和BDP個人版,之前還用過Tableau,可以大致跟大家分享一下自己的使用情況吧:

1、excel:這是最普通的數據分析工具了,大部分人都會點,只是有的人可以做的很好,各種高級功能都會用,什麼宏啊......我對象就是數據分析師,他們就是能把excel玩的特別好,讓excel顯得特別高大上,有什麼很多平時根本不知道的功能,每次看完他的excel內容,總感覺自己暴殄天物了,好多excel的高級功能都白白浪費了,而我就是會點數據透視表、vlookup等比較常見的函數和功能。

2、Tableau:之前他為了學習特地花錢買過Tabluea的個人版,話說真的蠻貴的,一年要999刀,就只買了一年,我也玩過他們很多功能,工具挺不錯的,功能挺強大的,特別是可視化效果真心不錯,但是真的太貴了。

3、BDP個人版:除了excel,我還會用BDP個人版,操作並不難,函數那些不需要自己寫,拖拽就行。其實很多分析通過excel都能展示,但BDP個人版有個好處:就是當我替換了工作表數據,我做的分析結果(即可視化圖表)就會自動更新了,不需要重新勞動的感覺也是蠻好的。


謝邀。

題主的問題深想一下,有點意思~

首先,題主已經從市數據分析工作半年,使用Excel,已經可以滿足大部分需求了。這說明,excel題主會用,而且還夠用。

然後,題主[發現]一些公司會使用SPASS、SAS、Clementine、R、Rapid-miner等工具類軟體。

&>&>那麼,我們是不是應該挖掘一下,這位題主真正的需求是什麼?

可能並非是短期的、目標明確的、由業務驅動所以要換工具的需求;

而是想要知道,目前什麼工具最前端、流行、值得一學。現在是有備無患;未來,就是[升值]與[升職]!

——————我是「如果說中請贊我、說的不對別打我」分割線——————

所以,首先我認為應當分析的是,數據分析工具、或者說商業智能,從現在到未來的一個發展趨勢是什麼。

&>&>商業智能發展趨勢

我用的資料來自Gartner發布的《2017BI和數據分析軟體市場統計報告》,其中提到了如下趨勢:

(1)、傳統的商業智能平台市場佔有率正在逐年降低。從2013年的49%,降至2015年的41%。而與之相反的,是新一代商業智能平台,它的市場佔有率從7%上升至14%,幾乎「吃」掉了傳統BI失掉的所有市場。

(2)、根據預測,未來10年將有更多的分析工具/商業智能產品部署於雲。

接下來我們要回答的問題就變成了:什麼是新一代商業智能?究竟它「新」在何處?為什麼有能力蠶食傳統BI的市場呢?

&>&>新一代商業智能「新」在何處?

對於還在100%依賴excel的人來說,這事兒可能有點恐慌,因為還沒開始接觸商業智能,商業智能就out了。但所有的烏雲都有一道金邊兒。2000年之後出生的孩子從來沒有打過算盤珠子、沒學過打字機、沒按過老式計算器、沒用過固定電話;但是他們是智能移動設備的「原住民」。2017年之前沒用過商業智能的人也不必恐慌,因為我們都可以成為「新一代商業智能」的"原住民"

Gartner2015年提出「Modern BI Platform」這一概念時,曾經從五個方面描述了傳統BI與新一代BI之間的區別:

從上圖中可以看出,新一代BI最大的變化,就是把商業分析全流程的中心從專家轉向了業務人員,IT部門不再是數據採集、準備與內容創作的主力或靈魂,僅在分析的流程中提供一小部分的支持工作;以前業務人員跟數據之間隔著一個IT部門,像隔著一座大山;新一代商業智能,允許業務人員直接跟數據對話、直接創建分析內容、自由的用可視化進行數據探索,還可以彼此協作。

1936年,查理-卓別林執導並主演的《摩登時代》里,曾經把工人比作城市大機器中的一個零件,在設定好的固定程序下每天重複。今天,工業社會已發展成為信息社會,我們的工作比過去需要更多的主動與創新,但企業依舊是一個環環相扣的生產線,每一個環節都影響著企業的最終盈利,每一個環節都不容出錯。

因此,我們為什麼不把最適合這個時代的利器,交到每一個一線業務的責任人手中呢?

這就是新一代BI存在的意義。


1.一般用excel就夠了;

2.可視化的話,一般BDP個人版也夠了;(http://me.bdp.cn)

3.寫演算法的話,SQL就夠了

看你怎麼做。。。


大數據分析,不管是會excel,還是會sql,多多少少要有點基礎的。大數據分析的工具很多,以下就列舉了不同技術背景的人士,在大數據分析工具方面的進修技術路徑:

一、Excel起步

作為一個入門級工具,Excel是快速分析數據的理想工具,也能創建供內部使用的數據圖。如果在眾多數據分析工具中您只了解最基本的Excel,以下是最好的進階路線

二、SQL起步

如果你了解SQL,說明你已經具備了更快提升的基礎,建議如下進階路線:

三、R語言起步

作為用來分析大數據集的統計組件包,R是一個非常複雜的工具,掌握R意味著你比其他IT專業人士可以更快上手一些專業分析工具和服務。

四、Python起步

五、MySQL起步

六、微軟SQL Server起步

七、Tableau/FineBI起步

作為大數據前端分析工具,Tableau和FineBI都很容易上手

八、Java起步

九、PostgreSQL起步

十、Visual Basic起步


FineBI http://www.finebi.com


哪個工具用來解決問題順手就用哪個,EXCEL已經可以解決大部分需求了,某些公司JD都是抄來抄去的,比如,百度有些數據崗位寫著熟悉一款統計軟體,如SPSS、SAS、R等,結果進去後一天的工作就是用EXCEL點幾下滑鼠解決工作。這些本來就是統計軟體,不搞專門的統計工作,只是一些數據分析工作,何苦費時間學這些。如果想學,我推薦python。


居然沒人提KNIME,太不幸了。

Gartner對KNIME的評價,還是相當高的(有帳號的自己進去搜),沒帳號的參考這個:

SAS, IBM, RapidMiner, Knime leaders in Gartner MQ for Advanced Analytics Platforms


Tableau


excel 2013.能把excel用好,基本夠用了


如果說EXCEL OFFICE系列的,那簡直都不敢苟同,真正一流分析公司都使用專業化軟體,Tableau 支持80%資料庫包括office,可以不能緯度生成你想要的信息。具體看軟體介紹視頻。


目前市面上很多數據分析及建模工具,下面為您推薦幾款最實用的建模工具

1.Tableau

(http://www.tableau.com/)

數據可視化做的最好的平台之一

功能十分強大,可以說是excel的升級版

2.Python

www.python.com)

Python作為近幾年強勢崛起的變成語言,由於其易用性和強大的擴展性,迅速成為數據分析最強大的工具,只需一點編程基礎,熟練使用旗下的pandas庫就可玩轉數據分析

3. SAS

(www.sas.com)

作為為統計而生的語言,SAS的統計和數據分析功能十分強大,可以托拉拽也可以通過編程來實現,只不過SAS語言比較奇怪

4.R語言

(p&:/&/&www.bai&d&u.com/link?url=8pHuyZ1vQIdQO9cnDQHqxYhfWHZmrKxSZ8zqYsFkRiSgjfMaSDZ3UnTwKpAhhSwf">https://www.r-project.org/)

R作為一種統計分析軟體,是集統計分析與圖形顯示於一體的。它可以運行於UNIX,Windows和Macintosh的操作系統上,而且嵌入了一個非常方便實用的幫助系統,相比於其他統計分析軟體,R還有以下特點:

1.R是自由軟體。這意味著它是完全免費,開放源代碼的。可以在它的網站及其鏡像中下載任何有關的安裝程序、源代碼、程序包及其源代碼、文檔資料。標準的安裝文件身自身就帶有許多模塊和內嵌統計函數,安裝好後可以直接實現許多常用的統計功能。

2.R是一種可編程的語言。作為一個開放的統計編程環境,語法通俗易懂,很容易學會和掌握語言的語法。而且學會之後,我們可以編製自己的函數來擴展現有的語言。這也就是為什麼它的更新速度比一般統計軟體,如,SPSS,SAS等快得多。大多數最新的統計方法和技術都可以在R中直接得到。

3. 所有R的函數和數據集是保存在程序包裡面的。只有當一個包被載入時,它的內容才可以被訪問。一些常用、基本的程序包已經被收入了標準安裝文件中,隨著新的統計分析方法的出現,標準安裝文件中所包含的程序包也隨著版本的更新而不斷變化。在另外版安裝文件中,已經包含的程序包有:base一R的基礎模塊、mle一極大似然估計模塊、ts一時間序列分析模塊、mva一多元統計分析模塊、survival一生存分析模塊等等.

5.Radiance

(www.datazen.ai)

新興的機器學習建模平台,簡單,快速,集成了多個機器學習演算法,讓你迅速建立機器學習模型


Cobub Razor,專業的APP數據統計分析工具,不僅開源而且支持私有化部署。


感覺這個好不好用屬於重口難調的問題,有第三方雲化的服務工具,也有本地化的軟體工具,關鍵得看分析什麼數據;對於從事互聯網運營和產品相關的夥伴,可能更關注的是用戶行為數據,關於用戶行為數據的雲化分析工具推薦下自己家的還是很好用,可視化便捷操作,精細化維度展現,http://zhugeio.com。


感覺Eviews是不是out了。。。


學習了


分頁阅读: 1 2