標籤:

資料庫及資料庫軟體MySQL簡介

1、數據分析的數據來源於哪裡?資料庫。這就需要從資料庫中讀取數據並進行分析得出結果。

需要掌握兩個知識點:1.1)資料庫是什麼?

1.2)SQL語句:從資料庫中獲取數據,並進行分析的語言。

本文按照下圖:依次簡單介紹資料庫是什麼和MySQL實戰

2、資料庫是個什麼鬼

資料庫(DB, Database)是存儲數據的地方,可以所有人直接從資料庫中查找和修改數據。

資料庫通常包含一個或多個表組成,每個表有列和行組成,其中每一列都用名字來標識出來,類似於Excel,不過每個表之間是有聯繫的。所以有如下的等式關係:

資料庫=多張表+各表之間的關係

從上述關係中,可看出資料庫需要從兩方面著手:2.1)資料庫表的結構;

2.2)各表之間的關係。

2.1) 資料庫表的結構

資料庫中每個表由一個名字標識,表包含帶有列名的列和記錄數據的行。如下所示,表名為大數據社群會員表:

上述表中每一列有一個名字來標識,行則記錄著數據。其中「會員ID」用來唯一標識用戶。而姓名是不能唯一確定一個用戶的,如兩個會員的姓名都叫「經緯」。所以,資料庫中的表,都會加一個ID欄位來表示數據的唯一性。類似於社會中唯一識別人的身份證號。

ID是資料庫中重要的概念,叫做唯一標識符或者主鍵,用來表示數據的唯一性。且每張表中只能有一個主鍵。

2.2) 各表之間的關係

資料庫是表的集合,同一個資料庫下的多張表,而表與表之間能有互相聯繫。如下所示:

大數據社群會員表和教育背景表通過「會員ID」關聯起來,

聯繫就是數據能夠對應匹配,在資料庫中正式名稱叫聯接,對應的操作叫做join。

資料庫中,如果你要關聯其他表,一般以「表名_ID」作為聯接。

這部分都是資料庫原理方面的基本理論。理論(設計草圖)有了,實踐(施工團隊)才行。實現資料庫原理的「施工團隊」就是常用的資料庫軟體,如MySQL、Oracle、SQL Server等。

3、關係資料庫軟體(MySQL)實戰

3.1) MySQL的特點如下:

1、MySQL是一種關係型資料庫軟體,且開源。不需要支付額外的費用即可使用。

2、MySQL支持大型資料庫,可處理擁有上千萬條記錄的資料庫。

3、MySQL使用標準的SQL數據語言形式。

4、MySQL可在多個系統中使用,並且支持多種語言,如:R、Python、Java 、 PHP、Ruby等

3.2)安裝MySQL和GUI(圖形界面)

安裝MySQL了兩次,第一次在搜索地方輸入「mysql」時沒有出現打開mysql登陸的界面即「MySQL 5.7 Command Line Client」,從搜索的結果看顯示幾項的結果,與猴子老師上面顯示的34條不同。而且第一次安裝完成後沒有出現添加「Accounts and Roles」這一步。也不知道什麼問題(受挫嚴重不過又鼓起勇氣),回頭重裝,有一步感覺需要點擊載入就操作了,終於出現了「Accounts and Roles」這一步,感覺這次對了。不明所以然的情況下成功安裝(知道具體情況的高手可以補充哦)。

而安裝GUI即WorkBench時,最新版本是64位,我的電腦是32位,又出現了不能安裝,

在右半部分可以找之前的版本,終於找到32位的版本,成功安裝。

左側是資料庫管理欄,中間是寫SQL語句的地方,再下面是執行結果的顯示。

打開系統默認帶的資料庫「world」,在Tables下面可以看到「city」、「country」和「countrylanguage」三種表,選中」country」表,並在下圖紅框的地方點擊就可以看到右邊的SQL語句和執行結果。

點擊語句開頭,再點上方帶有閃電符號的操作。就可以運行,執行SQL語句。

總結:1、碰到問題時,能夠積極地應對,想辦法去解決,這真是顯著並看的見的進步。

2、對資料庫原理了解後,並且可在軟體上執行簡單的語句,剩下的就是多操作,多熟練。

推薦閱讀:

R語言 數據Excel的導入與導出
清單|小白轉行數據分析
Python學習(二)
數據分析的基礎過程之:Numpy和Pandas的使用
Python 數據分析學習路線

TAG:SQL | 數據分析 |