雨沐田:數據分析之資料庫與Excel的區別
來自專欄 大數據力量
搞技術的童鞋或高手請直接路過.....
作為一個合格的數據分析師,Excel是必備工具,但僅Excel還不夠,數據量的激增和複雜性提高,以及數據平台話的趨勢,要求我們必須要了解並熟練掌握資料庫的操作,但在學習資料庫操作前,先全面對比下資料庫和Excel。
Excel不用多說,地球人都知道是干神馬的,而且零門檻使用;資料庫相信很多人也聽過或用過,但對於非技術的童鞋們,可能還是還有不太清楚2到底有什麼區別,今天就來捋一捋它們的區別。
一、相同點
都是用來處理數據的工具,而且特別擅長處理一維二維表形式的數據。在工作中都很常用。
二、不同點
1、Excel是一個具體的工具,而資料庫是個大的概念,具體的產品很多,常見的有MS SQL Server、MySql,Oracle等,分屬於不同的公司。
2、Excel是由sheet組成的,可以有多個sheet;資料庫由表組成,可以有多個表。
3、Excel更適合較為少量的數據,雖然高版本的Excel理論上一個sheet 可以存放幾十萬行的數據,但要是真存放了那麼多,可以想想打開的速度; 而資料庫可以存放大批量的數據,一個表隨隨便便存個幾十萬是一點問題沒有的,上百萬千萬也是很常見。
4、Excel的多個sheet之間不能設計複雜的數據關係,而資料庫的的表之間可以有複雜的關係,這也是資料庫的最大特點,關係型資料庫的名字由此而來。
5、Excel不能共享,而資料庫可以輕鬆共享,如我們每天看到的各種網站信息都是資料庫信息被共享的實例。
6、能力方面,Excel可以實現的數據處理功能資料庫都可以做到,同時又具備很多Excel沒有的功能,如SQL查詢、數據聚合、數據索引等等。
7、安全方面,Excel作為一個辦公軟體,其安全性可想而知,沒有太多的安全性功能,而資料庫庫則不同,有著複雜的安全機制和許可權驗證,也有非常完善的數據備份機制,能最大限度的保證數據的安全。
其實羅列太多也意義不大,只要說清了兩者的主要區別即可,總結就是在使用定位、功能性、共享性、安全性4個方面的區別。
2者各有所長,各有適合的使用場景,但千萬不要取2選1,了解他們的不同是為了更好的使用他們,實際工作中這兩種工具都是離不開的。
具體哪些資料庫是那些公司的,可以自行度娘一下,主要了解清楚資料庫的結構特點和存儲數據的方式即可,對數據分析師來說,最關鍵的是提取使用數據。之後的文章再說如何通過SQL語句讀取數據。
推薦閱讀:
※數據分析 | 想入門數據分析要先了解這些才行
※小白零基礎學數據分析年終總結
※Hello world! 數據分析我來了
※Kaggle機器學習之泰坦尼克號生還預測
※數據分析、數據挖掘和機器學習共享
TAG:數據分析 |