標籤:

數據分析基礎之Anaconda和Python

1、使用conda命令出現下面的錯誤提示:

首先找到打開Anoconda Prompt時候的硬碟地址下的.condarc文件,在該文件中寫入:

channels:

- mirrors.tuna.tsinghua.edu.cn

- defaults

show_channel_urls: yes

2、使用命令 conda install package_name 來在該環境下安裝包(install後接多個包名,中間用空格隔開可以實現一次安裝多個包,同時conda還會安裝依賴項,比如安裝scipy包,會自動的安裝scipy所依賴的numpy包)

3、卸載該環境下的包 conda remove package_name (同樣,可以同時卸載多個包)

4、更新該環境下的某一個包 conda update package_name

更新該環境下的所有包 conda update --all

5、列出該環境下已經安裝的所有包 conda list

創建新環境

首先執行命令 conda install nb_conda

(1)創建環境

conda create -n env_name package_name 創建環境並且安裝包

conda create -n env_name python=3 創建環境並且安裝指定的python版本

(2)進入環境

activate env_name

(3)離開環境

deactivate

(4)將該環境下的python環境和所有安裝的包進行共享

conda env export > xxx.yaml

這個.yaml文件保存在此時的控制平台的路徑下!

7、列出當前系統中的所有環境

conda env list

8、刪除環境

conda env remove -n env_name (不能在當前環境下刪除當前目環境)

9、安裝Jupyter notebook

conda install jupyter notebook (可以用pip命令來安裝)

10、啟動notebook

直接在Anoconda Prompt命令窗口中執行 jupyter notebook

11、修改notebook的工作空間(也就是以後再jupyter notebook中創建的項目都會保存在這個工作空間中)

(1)查看配置文件在哪裡

jupyter notebook --generate-config

(2)修改配置文件

找到配置文件後,打開,定位到 c.NotebookApp.notebook_dir,將後面的路徑添加上,並且將這一行的注釋格式清除,保存

(3)重新啟動notebook伺服器

退出網頁上的jupyter notebook後,再重新進入,生效

12、在環境中安裝代碼自動補全包

conda install pyreadline

13、jupyter中運行單個cell中的代碼,用ctrl+enter來完成,『+』來創建新的單元格

13、windows中的『』是表示本地的路徑,『/』是表示網路上的路徑,非本地

14、python的標識符首字母必須是字母或者下劃線,對大小寫敏感

15、python中的keyword模塊下的kwlist方法可顯示當前python環境下有哪些關鍵字

16、python代碼塊縮進的空格數是可變的,但是同一個代碼塊縮進的空格數需要一致

17、python通常是一行寫一條語句,但是如果語句很長,可以用()來連接多行語句組成一條語句,元組、字典、列表中可以不用反斜杠,直接換行就可

18、python中數有四種類型:整數、長整數、浮點數和複數。

  • int (整數), 如 1
  • long (長整數) , 比較大的整數
  • float (浮點數), 如 1.23、3E-2
  • complex (複數), 如 1 + 2j、 1.1 + 2.2j

19、字元串前面加r或R,字元串中的轉義字元失去了轉義的含義,被當做平常的字母了

20、input函數,輸入函數

21、一行可以放多條語句,中間用分號隔開就好。

22、print函數默認的狀態下是輸出內容後會將游標移到下一行,如果在print函數的參數列表中將end參數的值設置為一個空格,就不會換行了

23、在 python 用 import 或者 from...import 來導入相應的模塊。

將整個模塊(somemodule)導入,格式為: import somemodule

從某個模塊中導入某個函數,格式為: from somemodule import somefunction

從某個模塊中導入多個函數,格式為: from somemodule import firstfunc, secondfunc, thirdfunc

將某個模塊中的全部函數導入,格式為: from somemodule import *

24、sys.path 可以顯示目前電腦版本的python中的模塊存在的路徑,結果是一個列表

25、sys.argv 是在我們用控制窗口去執行.py文件的時候,會將命令中後面的參數傳進去

上面兩種情況是不相同的,上面的使用sys.argv 生成的是列表[we.py,aa,bb,cc],下面的使用sys.argv生成的是[we.py,aa,bb,cc]

26、

這種情況下,將出錯的那一行的代碼的縮進換成四個空格可解決

27、python允許同時給多個變數賦值:

a, b, c = 1, 2, "runoob"

28、

這裡存在了一個類類型和實例變數的區別,isinstance函數的第二個參數必須是一個類型參數(int,bool,類類型等)!同時對於type函數,它不認為子類的實例變數是父類的類型。

29、

在 Python2 中是沒有布爾型的,它用數字 0 表示 False,用 1 表示 True。到 Python3 中,把 True 和 False 定義成關鍵字了,但它們的值還是 1 和 0,它們可以和數字相加。

30、

del 可以用來刪除一個或多個對象。

31、python中數字相除的結果總是浮點數

32、

字元串切片,包含頭下標,不包含尾下標。

33、

列表同樣支持切片操作,列表是可變的!!!

34、元組和列表的不同在於元組中的元素是不可以被改變的

35、集合中是不存在重複元素的,集合中的元素是無序的

用set()創建集合的時候,括弧中需要是一個可迭代對象(字元串、列表、元組、字典等),想要創建一個空集合,就需要用set(),而不能直接用{},因為這是創建一個空字典。

集合可以進行成員測試,也就是可以判斷集合中是否存在某個元素:

集合之間可以進行差、並、交、以及不同時存在於兩個集合之間的集合的運算:

36、字典是無序的,字典中的鍵必須使用不可變類型,在同一個字典中,鍵必須是唯一的

字典的其他生成方式

字典的其他生成方式

37、Python中對象包含的三個基本要素,分別是:id(身份標識)、type(數據類型)和value(值)。

==和!=是判斷兩個對象的值是否相同,is和is not 是判斷兩個對象的地址(身份標識是否相同),賦值相當於在數據空間中貼標籤!!!

38、不同類型的數混合運算時,會將整數轉換成浮點數

39、round()函數將輸入數值進行四捨五入操作:

40、在python調用其中的已經寫好的函數的時候,如果傳入參數感覺與我們學習的python參數的傳入方法不對(我們學會的python函數的參數類型有: 位置參數、默認參數、可變參數、關鍵字參數、命名關鍵字參數),不要驚慌,因為我們學習的參數類型是python語言的參數類型,但是python是用C語言編寫的。因此,如果是我們自己用python語言定義的函數參數,那麼就可以按照我們學會的函數調用以及參數傳遞法則來進行操作。

41、

42、

43、

44、

45、

46、

47、

48、

49、

50、元組的地址問題:

51、

52、

53、

54、

55、

56、

57、

58、

59、python中的函數定義語法:

函數的參數列表類型:(1)位置參數

(2)默認參數

(3)可變參數

(4)關鍵字參數

(5)命名關鍵字參數

60、

61、

62、

63、

64、

65、數據類型一般是在內存中才討論的!!!!!(在文本中就沒有什麼字元串和bytes類型的討論)

66、

67、

68、


推薦閱讀:

數據分析實戰-數據分析職位分析
實現數據驅動的三道鴻溝
大數據之數據分析精進之路:起跑
2017上半年數據分析學習計劃
初識Python

TAG:數據分析 |