數據分析核心語言Python
1為什麼學習Python?
簡單的說就是無論大數據分析還是人工智慧,學會Python都是必要的,因為它是目前最流行的數據分析和人工智慧語言。
2安裝環境
Anaconda是包管理器和環境管理器
Jupyter notebook可以將數據分析的代碼、圖像和文檔全部組合到一個web
在安裝這兩個程序的過程中還是比較順利的,除了改變notebook存儲路徑時對應文件夾建錯位置,沒有直接建在c盤下,別的問題都靠自己研究處理好了。
3數據
·數據、變數、注釋
注釋就是解釋說明,增強代碼的可讀性;
變數就像我們學數學的a,b代表長方形的長和寬、單位是長度一樣,變數也可以反映出數據的類型和數值兩個信息;
數據就是各種類型信息的匯總,比如淘寶購物數據就包括購買頻次、種類、價格、地址、偏愛顏色等各個方面的信息。
練習:
在定義數據類型以及print()函數裡面三個元素的連接那裡犯錯了,改了幾次才成功,注意不要用中文的逗號。
·容器——存放多個數據
分類
1)列表List
2)元組Tuple
3)集合Sets(自動刪除多個重複元素)
4)字典Dictionary(映射關係)
定義
操作:增加,刪除,查詢,修改
列表
元祖
集合
字典
之前預習時對容器的總結
之前總結的不夠完善,並沒有意識到容器、數字、列表之間的差異,另外集合也沒有單列出來,但是數據是否可以更改我是注意到了。字元串、數字、元祖都是不可更改的,另外字典中的鍵也是不可更改的,這個需要特別注意。
·布爾
分為True和False
·None(空值)
4條件判斷
條件判斷會用到if/elif/else這個語句,判斷依據通常是值比較或者邏輯比較。
5循環
把容器中的每一個數據都按照特定的規則進行重複處理。
For i in 容器:
要做的事情
Continue是跳出當前循環,Break是退出整個循環。
6函數
1)什麼是函數?
三個功能
·功能
·輸入
·輸出
2)如何自定義函數
形式
Def 函數名稱(參數1,參數2):
函數體
return輸出
名稱最好和函數內容有關,如體現函數數據類型aStr,中Str表示字元串。
3)不可變數據類型函數如何傳遞?
參數是不可變數據類型:字元串、元組、數值,此時傳遞的只是該數據類型的值,相當於複製。
案例傳遞不可變數據類型:數值-整形(Int)
傳遞可變數據類型:列表(List)
4)了解變數的作用域
作用域分為 全局作用域 和 局部作用域 。
定義在函數內部的變數擁有一個局部作用域,定義在函數外的擁有全局作用域。 局部變數只能在其被聲明的函數內部訪問,而全局變數可以在整個程序範圍內訪問。
7模塊
如何使用Python內置模塊?
模塊.屬性
代碼自動補全功能:.+TAB
包(文件夾):按目錄組織模塊方法,將多種模塊用文件組織在一起。
常用包了解
Pandas、Djange、Numpy、Matplotlib、Flask
Djange&Flask是web開發框架
Pandas、Numpy&Matplotlib豐富數據分析功能,在數據科學和人工智慧中被廣泛使用。
Pandas是基於Numpy的數據分析工具;Matplotlib是圖形繪製包。
以下為路徑和模塊使用實例
包安裝:通過activate py3 --> conda install 包名稱
模塊使用總結:
·import 包名稱
·import 包名稱 as 別名
·from 包名稱 import 函數名
注意:
·如果顯示xlrd未被定義的錯誤,需要安裝xlrd,步驟:activate py3>conda install xlrd>y
·python只能導入.py文件,解決辦法就是把notebook另存為.py文件,然後再用import導入
8數據結構
包collections
·雙向鏈表queue:隊列、棧
類似領號排隊系統,領號排在隊為,叫號排在隊頭
·排序字典:OrderedDict
按輸入順序排列
這裡注意函數和可以通過「run cell」直接運行的。
·計數器:Counter
可對數據重複性進行統計
詳細課程可以收聽猴子聊人物知乎Live零基礎掌握人工智慧(AI)核心語言Python
推薦閱讀: