數據分析核心語言Python

1為什麼學習Python?

簡單的說就是無論大數據分析還是人工智慧,學會Python都是必要的,因為它是目前最流行的數據分析和人工智慧語言。

2安裝環境

Anaconda是包管理器和環境管理器

Jupyter notebook可以將數據分析的代碼、圖像和文檔全部組合到一個web

在安裝這兩個程序的過程中還是比較順利的,除了改變notebook存儲路徑時對應文件夾建錯位置,沒有直接建在c盤下,別的問題都靠自己研究處理好了。

3數據

·數據、變數、注釋

注釋就是解釋說明,增強代碼的可讀性;

變數就像我們學數學的a,b代表長方形的長和寬、單位是長度一樣,變數也可以反映出數據的類型和數值兩個信息;

數據就是各種類型信息的匯總,比如淘寶購物數據就包括購買頻次、種類、價格、地址、偏愛顏色等各個方面的信息。

練習:

在定義數據類型以及print()函數裡面三個元素的連接那裡犯錯了,改了幾次才成功,注意不要用中文的逗號

·容器——存放多個數據

分類

1)列表List

2)元組Tuple

3)集合Sets(自動刪除多個重複元素)

4)字典Dictionary(映射關係)

定義

操作:增加,刪除,查詢,修改

列表

元祖

集合

字典

之前預習時對容器的總結

之前總結的不夠完善,並沒有意識到容器、數字、列表之間的差異,另外集合也沒有單列出來,但是數據是否可以更改我是注意到了。字元串、數字、元祖都是不可更改的,另外字典中的鍵也是不可更改的,這個需要特別注意

·布爾

分為True和False

·None(空值)

4條件判斷

條件判斷會用到if/elif/else這個語句,判斷依據通常是值比較或者邏輯比較。

5循環

容器中的每一個數據都按照特定的規則進行重複處理。

For i in 容器:

要做的事情

Continue是跳出當前循環,Break是退出整個循環。

6函數

1)什麼是函數?

三個功能

·功能

·輸入

·輸出

2)如何自定義函數

形式

Def 函數名稱(參數1,參數2):

函數體

return輸出

名稱最好和函數內容有關,如體現函數數據類型aStr,中Str表示字元串。

3)不可變數據類型函數如何傳遞?

參數是不可變數據類型:字元串、元組、數值,此時傳遞的只是該數據類型的值,相當於複製

案例傳遞不可變數據類型:數值-整形(Int)

傳遞可變數據類型:列表(List)

4)了解變數的作用域

作用域分為 全局作用域 和 局部作用域 。

定義在函數內部的變數擁有一個局部作用域,定義在函數外的擁有全局作用域。 局部變數只能在其被聲明的函數內部訪問,而全局變數可以在整個程序範圍內訪問。

7模塊

如何使用Python內置模塊?

模塊.屬性

代碼自動補全功能:.+TAB

包(文件夾):按目錄組織模塊方法,將多種模塊用文件組織在一起。

常用包了解

Pandas、Djange、Numpy、Matplotlib、Flask

Djange&Flask是web開發框架

Pandas、Numpy&Matplotlib豐富數據分析功能,在數據科學和人工智慧中被廣泛使用。

Pandas是基於Numpy的數據分析工具;Matplotlib是圖形繪製包。

以下為路徑和模塊使用實例

包安裝:通過activate py3 --> conda install 包名稱

模塊使用總結:

·import 包名稱

·import 包名稱 as 別名

·from 包名稱 import 函數名

注意:

·如果顯示xlrd未被定義的錯誤,需要安裝xlrd,步驟:activate py3>conda install xlrd>y

·python只能導入.py文件,解決辦法就是把notebook另存為.py文件,然後再用import導入

8數據結構

包collections

·雙向鏈表queue:隊列、棧

類似領號排隊系統,領號排在隊為,叫號排在隊頭

·排序字典:OrderedDict

按輸入順序排列

這裡注意函數和可以通過「run cell」直接運行的。

·計數器:Counter

可對數據重複性進行統計


詳細課程可以收聽猴子聊人物知乎Live零基礎掌握人工智慧(AI)核心語言Python


推薦閱讀:

TAG:大數據分析 | Python入門 | 人工智慧AI醬 |