python 基礎
python的基礎語法有很多,學起來不但多,而且不容易被記住,這篇文章主要講述在數據分析中常用的python基礎語法。
本文所用環境是anaconda和jupyter notebook,具體的安裝方法詳見初學python者自學anaconda的正確姿勢是什麼??和
jupyter notebook 可以做哪些事情?。更多的基礎語法詳見菜鳥python3教程和python教程
知乎Live零基礎掌握人工智慧(AI)核心語言:Python,參考資料《笨方法學python》
1.基礎數據類型
Python3中有六個標準的數據類型(最後4個分到容器里講述更為合適):
- Number(數字)
- String(字元串)
- List(列表)
- Tuple(元組)
- Sets(集合)
- Dictionary(字典)
1)Number(數字)
python3中常見的數字類型為int(整數),float(浮點數),bool(布爾值),complex(複數)。
2)String(字元串)
python中字元串一般用單引號或者雙引號括起來,索引值以0為開始值,-1為從末尾的開始值(即Hello中H為0,e為1,以此類推)常用方法如下:
有意思的是字元串是可以相加的,這個在以後寫代碼的時候非常方便,比如:
2.容器
這裡的容器主要包括4中類型(主要是列表和字典):
- List(列表)
- Tuple(元組)
- Sets(集合)
- Dictionary(字典)
先說一下,這四個的主要區別,並針對其優勢選用容器:
1)List(列表)
List的優勢在於有序且可以修改,這就方便我們查詢數據,以及增加和刪減數據。
其中最為常用的就是切片,查詢,修改數據,增加數據和刪減數據的功能
首先我們創建並查詢一個列表,並且特別關注下我們感興趣的兩家公司:
結果發現多了元素京東,少了元素apple,我們可以通過增加的方式把apple加進去
或者通過修改的方式
不難發現List中的元素是可以重複的,但現在我們要把最有一個刪掉
而且List是可以疊加的,這個非常實用,具體操作如下
2)Tuple(元組)
Python 的元組與列表類似,不同之處在於元組的元素不能修改。
首先創建一個元祖
雖然元祖內的元素無法更改,但元祖之間可以迭代(注意T2中單個元素如果不加「,」是無法疊加的)
最後我們可以查詢我們所感興趣的公司
3)Sets(集合)
Set是一個無序不重複元素的序列,而常用方法是set(value),雖然也可以用{},但難和字典區分開來。在創建一個空的集合時必須用set(),不能用{},下面我們舉例說明一下:
首先創建並查看一個集合
我們可以通過增加apple和刪除京東的方式修改數據
我們查詢一下我們感興趣的公司是否在內(數據比較多的時候有用)
因為數據之間可能要合併,同時剔除掉重複數據可以用Set來合併
4)Dictionary(字典)
字典的每個鍵值(key=>value)對用冒號(:)分割,每個對之間用逗號(,)分割,整個字典包括在花括弧({})中。字典的好處就是它的每一個關鍵字都對應一個值,就像我們查英語字典一樣。舉例說明一下基礎操作
首先創建並查看一個字典
我們可以直接修改或者增加apple和刪除京東的方式修改數據
3.條件控制(if)
條件控制中主要就是通過判斷條件為True和False來執行代碼,其主要應用就是篩選出我們要的東西,其執行過程如圖所示:
舉個例子如下:
先引入一個隨機模塊(import random),並且讓x和y隨機選取100中的數字(x=random.choice(range(100),y=random.choice(range(100)),如果x>y(if x>y)則輸出x值,若兩者相等(x==y)則輸出兩者之和,若x<y(else,即除了前面兩者以外的結果)則輸出y值。
從結果來看,y的值為95,而x要比95小
4.循環語句(for)
在python中循環語句有兩個,即for和while,而其中最常用的就是for語句,流程圖如下:
其主要作用就是將元素提取出來,進行篩選,將我們所需要的東西留下來以及整理數據
舉個例子(如果是列表就更加簡單了)
還可以用python中內置的enumerate函數,因為index是從0開始計數的,為了方便我將其設為1(即(S1,1)中的1)
1)continue語句
continue 語句是如果滿足條件就跳過這個循環,其實就是一個刪除的效果,主要是為了刪除滿足循環條件下的某些不需要的成分,流程圖如下:
舉個例子,我們不想要京東這個數據了,我們就可以通過continue剔除該數據。
2)break語句
break語句用來終止循環語句,即循環條件沒有False條件或者序列還沒被完全遞歸完,也會停止執行循環語句,流程圖如下:
舉個例子,如果我只想看到排名前3個公司,對後邊的公司不感興趣的話,就可以用到該語句(在執行第四名公司時,終止程序):
5.總結
這些其實都是python中的基礎語法,當然也是使用比較頻繁的語法。在數據中其實我少了一個空值,因為空值往往伴隨高階語法一起出現,所以在這裡沒有介紹。在基礎語法中還有定義函數和導入模塊,因為這倆個操作很簡單,但實用方法多樣且意義重大,所以不在這裡闡述,我將會在數據分析核心模塊(pandas,numpy,re等)中一起介紹。
推薦閱讀:
※python文本分析實例:螞蜂窩上的驢友們在聊些什麼?
※數據分析第一關,改變的開始
※惠眾在線行業情報|互聯網改變下的傳統節日
※使用藥店數據分析
※R語言第三、四章學習心得