人生苦短,我用python(基礎篇)
1、python數據分析環境的搭建
Anaconda 和 Jupyter Notebook 已經成為數據分析的標準環境
- Anaconda : 包管理器和環境管理器
- Jupyter Notebook : 可以將數據分析需要的代碼、圖表、文字組合到一個web文檔中,形成數據分析報告
具體的操作可以參考猴子的兩篇文章,在此就不贅述了。
在環境搭建中可能遇到的問題:
1、jupyter notebook 沒有 conda 和 nbextensions 兩個標籤的重裝軟體。
先安裝nb_conda命令:
conda install nb_conda
再安裝nbextensions命令:
conda install -c conda-forge jupyter_contrib_nbextensions
2、快速學會 Python 的4個關鍵點
- 數據
- 條件判斷
- 循環
- 函數
2-1 數據
Q:什麼是變數?
A:在代碼中,我們用變數來存放數據,並用等號為變數賦值,變數可以存放任意數據類型的數據。為了方便使用變數,我們需要為變數取名。優秀的編程人員在給變數取名時,前半部分名稱要能代表數據的意義,後半部分名稱要能代表數據的類型。這樣當我們使用變數的時候,可以很方便地通過變數名知道這個變數中存放了什麼數據,而且還能根據這個變數名稱知道這個變數存放的數據是什麼類型。數字不能作為變數名稱的開頭,而且python是大小寫敏感的
Q:注釋怎麼表示?
A:
法1:#
# 中國首富馬雲namestr = 馬雲
法2: 或 """ """
中國首富馬雲,你咋這麼有錢namestr = 馬雲
1) 字元串(String)
2)數字(Number)
3)容器(存放多個數據)
① 列表(List) ② 元組(Tuple) ③ 集合(Sets) ④ 字典(Dictionary)
掌握容器的捷徑:1、如何定義容器? 2、容器的4個操作:增加,刪除,查詢,修改
① 列表
Q1:如何定義列表?
Q2:如何對列表進行增刪查改?
② 元組
元組的元素不能修改(增、刪、改),所以元組只能查詢
③ 集合
集合(Sets)是一個沒有重複元素的容器(無序)
在數據分析中,集合可以用來去除重複的數據,這一點很有用
Q1:如何定義集合?
Q2:如何對集合進行增刪查改?
④ 字典
鍵必須是唯一的,這樣是為了讓每一個鍵值對映射都唯一;鍵也必須是不可變的,所以可以用數字、字元串和元組來充當
Q1:如何定義字典?
Q2:如何對字典進行增刪查改?
4)布爾型(Bool)
Bool:True False 多用於條件判斷
5)空值型(None)
數據類型總結:字元串、數字、容器(列表、元組、集合、字典)、布爾、None
其中不可修改的數據類型為字元串、數字和元組
2-2 條件判斷
2-3 循環
2-4 函數
Q1:如何自定義函數?
Q2:如何使用函數?
函數參數:不可變數據類型
函數參數:可變數據類型
變數作用域:Python 變數的作用域一共有2種:全局作用域,局部作用域
定義在函數內部的變數擁有一個局部作用域,定義在函數外的變數擁有全局作用域。局部變數只能在其被聲明的函數內部訪問,而全局變數可以在整個程序範圍內訪問。
3、模塊
3-1 什麼是模塊
模塊即分類,每個模塊都有特定的功能,使用模塊就不需要從零開始造輪子了,最終都是為了提高寫代碼和維護代碼的效率
Python 中有內置的模塊,也有許多第三方的庫,引入模塊就可以使用模塊中的函數和屬性
3-2 如何使用 Python 內置模塊
3-3 如何使用第三方的包
3-4 包的組織結構
為了避免模塊名的衝突,Python 又引入了按目錄來組織模塊的方法,稱為包
3-5 模塊使用總結
4、數據結構
4-1 隊列(queue)
隊列就像你去餐廳外婆家吃飯排隊,新來的人在隊列尾部加入,叫做入隊;取完票的人從隊列首部離開隊列,叫做出隊
1)定義隊列
2)入隊
3)出隊
4-2 棧(stack)
棧這種數據結構有點像生活中的木桶。你往棧中加入新的元素,就是入棧,新的元素總是放在木桶的最上面。
1)定義棧
2)入棧
3)出棧
4-3 排序字典(OrderedDict)
1)定義排序字典
4-4 計數器(Counter)
5、總結:一句話記住知識點
推薦閱讀:
※一個不尷尬的茶會?或許可以用數據開啟
※如何快速入門數據分析
※數據之美
※關於Alternative Data的一些想法(1)
TAG:數據分析 |