python 基礎

python的基礎語法有很多,學起來不但多,而且不容易被記住,這篇文章主要講述在數據分析中常用的python基礎語法。

本文所用環境是anaconda和jupyter notebook,具體的安裝方法詳見初學python者自學anaconda的正確姿勢是什麼??和

jupyter notebook 可以做哪些事情?。更多的基礎語法詳見菜鳥python3教程和python教程

知乎Live零基礎掌握人工智慧(AI)核心語言:Python,參考資料《笨方法學python》

1.基礎數據類型

Python3中有六個標準的數據類型(最後4個分到容器里講述更為合適):

  • Number(數字)
  • String(字元串)
  • List(列表)
  • Tuple(元組)
  • Sets(集合)
  • Dictionary(字典)

1)Number(數字)

python3中常見的數字類型為int(整數),float(浮點數),bool(布爾值),complex(複數)。

2)String(字元串)

python中字元串一般用單引號或者雙引號括起來,索引值以0為開始值,-1為從末尾的開始值(即Hello中H為0,e為1,以此類推)常用方法如下:

有意思的是字元串是可以相加的,這個在以後寫代碼的時候非常方便,比如:

2.容器

這裡的容器主要包括4中類型(主要是列表和字典):

  • List(列表)
  • Tuple(元組)
  • Sets(集合)
  • Dictionary(字典)

先說一下,這四個的主要區別,並針對其優勢選用容器:

1)List(列表)

List的優勢在於有序且可以修改,這就方便我們查詢數據,以及增加和刪減數據。

其中最為常用的就是切片,查詢,修改數據,增加數據和刪減數據的功能

首先我們創建並查詢一個列表,並且特別關注下我們感興趣的兩家公司:

結果發現多了元素京東,少了元素apple,我們可以通過增加的方式把apple加進去

或者通過修改的方式

不難發現List中的元素是可以重複的,但現在我們要把最有一個刪掉

而且List是可以疊加的,這個非常實用,具體操作如下

2)Tuple(元組)

Python 的元組與列表類似,不同之處在於元組的元素不能修改

首先創建一個元祖

雖然元祖內的元素無法更改,但元祖之間可以迭代(注意T2中單個元素如果不加「,」是無法疊加的)

最後我們可以查詢我們所感興趣的公司

3)Sets(集合)

Set是一個無序不重複元素的序列,而常用方法是set(value),雖然也可以用{},但難和字典區分開來。在創建一個空的集合時必須用set(),不能用{},下面我們舉例說明一下:

首先創建並查看一個集合

我們可以通過增加apple和刪除京東的方式修改數據

我們查詢一下我們感興趣的公司是否在內(數據比較多的時候有用)

因為數據之間可能要合併,同時剔除掉重複數據可以用Set來合併

4)Dictionary(字典)

字典的每個鍵值(key=>value)對用冒號(:)分割,每個對之間用逗號(,)分割,整個字典包括在花括弧({})中。字典的好處就是它的每一個關鍵字都對應一個值,就像我們查英語字典一樣。舉例說明一下基礎操作

首先創建並查看一個字典

我們可以直接修改或者增加apple和刪除京東的方式修改數據

3.條件控制(if)

條件控制中主要就是通過判斷條件為True和False來執行代碼,其主要應用就是篩選出我們要的東西,其執行過程如圖所示:

舉個例子如下:

先引入一個隨機模塊(import random),並且讓x和y隨機選取100中的數字(x=random.choice(range(100),y=random.choice(range(100)),如果x>y(if x>y)則輸出x值,若兩者相等(x==y)則輸出兩者之和,若x<y(else,即除了前面兩者以外的結果)則輸出y值。

從結果來看,y的值為95,而x要比95小

4.循環語句(for)

在python中循環語句有兩個,即for和while,而其中最常用的就是for語句,流程圖如下:

其主要作用就是將元素提取出來,進行篩選,將我們所需要的東西留下來以及整理數據

舉個例子(如果是列表就更加簡單了)

還可以用python中內置的enumerate函數,因為index是從0開始計數的,為了方便我將其設為1(即(S1,1)中的1)

1)continue語句

continue 語句是如果滿足條件就跳過這個循環,其實就是一個刪除的效果,主要是為了刪除滿足循環條件下的某些不需要的成分,流程圖如下:

舉個例子,我們不想要京東這個數據了,我們就可以通過continue剔除該數據。

2)break語句

break語句用來終止循環語句,即循環條件沒有False條件或者序列還沒被完全遞歸完,也會停止執行循環語句,流程圖如下:

舉個例子,如果我只想看到排名前3個公司,對後邊的公司不感興趣的話,就可以用到該語句(在執行第四名公司時,終止程序):

5.總結

這些其實都是python中的基礎語法,當然也是使用比較頻繁的語法。在數據中其實我少了一個空值,因為空值往往伴隨高階語法一起出現,所以在這裡沒有介紹。在基礎語法中還有定義函數導入模塊,因為這倆個操作很簡單,但實用方法多樣且意義重大,所以不在這裡闡述,我將會在數據分析核心模塊(pandas,numpy,re等)中一起介紹。

推薦閱讀:

python文本分析實例:螞蜂窩上的驢友們在聊些什麼?
數據分析第一關,改變的開始
惠眾在線行業情報|互聯網改變下的傳統節日
使用藥店數據分析
R語言第三、四章學習心得

TAG:數據分析 | Python入門 |