草根學Python(八) 模塊與包
前言
之前的文章都是使用Sublime Text來編寫 Python 的,主要是為了更好的熟悉和了解 Python ,可是開發效率不高,也不方便,從這章開始,改為使用 Pycharm 了,在之前的篇節集成開發環境(IDE): PyCharm中介紹了 PyCharm ,如果如要激活軟體可以通過授權伺服器來激活,具體看這個網址。JetBrains激活(http://www.imsxm.com/jetbrains-license-server.html)當然你也可以嘗試破解, Pycharm2017.1.1破解方式,不過對於軟體的升級不方便。
目錄
一、Python 模塊簡介
在開發過程中,隨著程序代碼越寫越多,在一個文件里代碼就會越來越長,越來越不容易維護。
為了編寫可維護的代碼,我們把很多函數分組,分別放到不同的文件里,這樣,每個文件包含的代碼就相對較少,很多編程語言都採用這種組織代碼的方式。在 Python 中,一個 .py 文件就稱之為一個模塊(Module)。
之前我們學習過函數,知道函數是實現一項或多項功能的一段程序 。其實模塊就是函數功能的擴展。為什麼這麼說呢?那是因為模塊其實就是實現一項或多項功能的程序塊。
通過上面的定義,不難發現,函數和模塊都是用來實現功能的,只是模塊的範圍比函數廣,在模塊中,可以有多個函數。
竟然了解了什麼是模塊了,那麼為什麼需要模塊呢?竟然有了函數,那為啥那需要模塊?
最大的好處是大大提高了代碼的可維護性。其次,編寫代碼不必從零開始。當一個模塊編寫完畢,就可以被其他地方引用。我們在編寫程序的時候,也經常引用其他模塊,包括 Python 內置的模塊和來自第三方的模塊。
使用模塊還可以避免函數名和變數名衝突。相同名字的函數和變數完全可以分別存在不同的模塊中,因此,我們自己在編寫模塊時,不必考慮名字會與其他模塊衝突。但是也要注意,盡量不要與內置函數名字衝突。
Python 本身就內置了很多非常有用的模塊,只要安裝完畢,這些模塊就可以立刻使用。我們可以嘗試找下這些模塊,比如我的 Python 安裝目錄是默認的安裝目錄,在 C:UsersAdministratorAppDataLocalProgramsPythonPython36 ,然後找到 Lib 目錄,就可以發現裡面全部都是模塊,沒錯,這些 .py 文件就是模塊了。
其實模塊可以分為標準庫模塊和自定義模塊,而剛剛我們看到的 Lib 目錄下的都是標準庫模塊。
二、模塊的使用
1、import
Python 模塊的使用跟其他編程語言也是類似的。你要使用某個模塊,在使用之前,必須要導入這個模塊。導入模塊我們使用關鍵字 import。
import 的語法基本如下:
import module1[, module2[,... moduleN]n
比如我們使用標準庫模塊中的 math 模塊。當解釋器遇到 import 語句,如果模塊在當前的搜索路徑就會被導入。
#!/usr/bin/env python3n# -*- coding: UTF-8 -*-nnimport mathnn_author_ = 兩點水nnprint(math.pi)n
輸出的結果:
3.141592653589793n
一個模塊只會被導入一次,不管你執行了多少次 import。這樣可以防止導入模塊被一遍又一遍地執行。
當我們使用 import 語句的時候,Python 解釋器是怎樣找到對應的文件的呢?
這就涉及到 Python 的搜索路徑,搜索路徑是由一系列目錄名組成的,Python 解釋器就依次從這些目錄中去尋找所引入的模塊。這看起來很像環境變數,事實上,也可以通過定義環境變數的方式來確定搜索路徑。搜索路徑是在 Python 編譯或安裝的時候確定的,安裝新的庫應該也會修改。搜索路徑被存儲在sys 模塊中的 path 變數 。
因此,我們可以查一下路徑:
#!/usr/bin/env pythonn# -*- coding: UTF-8 -*-nnimport sysnnprint(sys.path)n
輸出結果:
[C:UsersAdministratorDesktopPythonPython8Code, G:PyCharm 2017.1.4helperspycharm, C:UsersAdministratorAppDataLocalProgramsPythonPython36python36.zip, C:UsersAdministratorAppDataLocalProgramsPythonPython36DLLs, C:UsersAdministratorAppDataLocalProgramsPythonPython36lib, C:UsersAdministratorAppDataLocalProgramsPythonPython36, C:UsersAdministratorAppDataLocalProgramsPythonPython36libsite-packages, C:UsersAdministratorDesktopPythonPython8CodecomLearnmodulesys]n
2、from···import
有沒有想過,怎麼直接導入某個模塊中的屬性和方法呢?
Python 中,導入一個模塊的方法我們使用的是 import 關鍵字,這樣做是導入了這個模塊,這裡需要注意了,這樣做只是導入了模塊,並沒有導入模塊中具體的某個屬性或方法的。而我們想直接導入某個模塊中的某一個功能,也就是屬性和方法的話,我們可以使用 from···import 語句。
語法如下:
from modname import name1[, name2[, ... nameN]]n
看完簡介後可能會想, from···import 和 import 方法有啥區別呢?
想知道區別是什麼,觀察下面兩個例子:
import 導入 sys 模塊,然後使用 version 屬性
from···import 直接導入 version 屬性
3、from ··· import *
通過上面的學習,我們知道了 from sys import version 可以直接導入 version 屬性。但是如果我們想使用其他的屬性呢?比如使用 sys 模塊中的 executable ,難道又要寫多一句 from sys import executable ,兩個還好,如果三個,四個呢?難道要一直這樣寫下去?
這時候就需要 from ··· import * 語句了,這個語句可以把某個模塊中的所有方法屬性都導入。比如:
#!/usr/bin/env python3n# -*- coding: UTF-8 -*-nnfrom sys import *nnprint(version)nprint(executable)n
輸出的結果為:
3.6.1 (v3.6.1:69c0db5, Mar 21 2017, 18:41:36) [MSC v.1900 64 bit (AMD64)]nC:UsersAdministratorAppDataLocalProgramsPythonPython36python.exen
注意:這提供了一個簡單的方法來導入一個模塊中的所有方法屬性。然而這種聲明不該被過多地使用。
三、主模塊和非主模塊
1、主模塊和非主模塊的定義
在 Python 函數中,如果一個函數調用了其他函數完成一項功能,我們稱這個函數為主函數,如果一個函數沒有調用其他函數,我們稱這種函數為非主函數。主模塊和非主模塊的定義也類似,如果一個模塊被直接使用,而沒有被別人調用,我們稱這個模塊為主模塊,如果一個模塊被別人調用,我們稱這個模塊為非主模塊。
2、name 屬性
在 Python 中,有主模塊和非主模塊之分,當然,我們也得區分他們啊。那麼怎麼區分主模塊和非主模塊呢?
這就需要用到 __name__ 屬性了,這個 ——name—— 屬性值是一個變數,且這個變數是系統給出的。利用這個變數可以判斷一個模塊是否是主模塊。如果一個屬性的值是 __main__ ,那麼就說明這個模塊是主模塊,反之亦然。但是要注意了: 這個 __main__ 屬性只是幫助我們判斷是否是主模塊,並不是說這個屬性決定他們是否是主模塊,決定是否是主模塊的條件只是這個模塊有沒有被人調用
具體看示例:
首先創建了模塊 lname ,然後判斷一下是否是主模塊,如果是主模塊就輸出 main 不是,就輸出 not main ,首先直接運行該模塊,由於該模塊是直接使用,而沒有被人調用,所以是主模塊,因此輸出了 main ,具體看下圖:
然後又創建一個 user_lname 模塊,裡面只是簡單的導入了 lname 模塊,然後執行,輸出的結果是 not main ,因為 lname 模塊被該模塊調用了,所以不是主模塊,輸出結果如圖:
四、包
包,其實在上面的一些例子中,都創建了不同的包名了,具體可以仔細觀察。在一開始模塊的簡介中提到,使用模塊可以避免函數名和變數名衝突。相同名字的函數和變數完全可以分別存在不同的模塊中,因此,我們自己在編寫模塊時,不必考慮名字會與其他模塊衝突。但是也要注意,盡量不要與內置函數名字衝突。但是這裡也有個問題,如果不同的人編寫的模塊名相同怎麼辦?為了避免模塊名衝突,Python 又引入了按目錄來組織模塊的方法,稱為包(Package)。
比如最開始的例子,就引入了包,這樣子做就算有相同的模塊名,也不會造成重複,因為包名不同,其實也就是路徑不同。如下圖,引入了包名後, lname.py 其實變成了 com.Learn.module.nameattributes.lname
仔細觀察的人,基本會發現,每一個包目錄下面都會有一個 __init__.py 的文件,為什麼呢?
因為這個文件是必須的,否則,Python 就把這個目錄當成普通目錄,而不是一個包 。 __init__.py 可以是空文件,也可以有Python代碼,因為 __init__.py 本身就是一個模塊,而它對應的模塊名就是它的包名。
五、作用域
學習過 Java 的同學都知道,Java 的類裡面可以給方法和屬性定義公共的( public )或者是私有的 ( private ),這樣做主要是為了我們希望有些函數和屬性能給別人使用或者只能內部使用。 通過學習 Python 中的模塊,其實和 Java 中的類相似,那麼我們怎麼實現在一個模塊中,有的函數和變數給別人使用,有的函數和變數僅僅在模塊內部使用呢?
在 Python 中,是通過 _ 前綴來實現的。正常的函數和變數名是公開的(public),可以被直接引用,比如:abc,ni12,PI等;類似__xxx__這樣的變數是特殊變數,可以被直接引用,但是有特殊用途,比如上面的 __name__ 就是特殊變數,還有 __author__ 也是特殊變數,用來標明作者。注意,我們自己的變數一般不要用這種變數名;類似 _xxx 和 __xxx 這樣的函數或變數就是非公開的(private),不應該被直接引用,比如 _abc ,__abc 等;
注意,這裡是說不應該,而不是不能。因為 Python 種並沒有一種方法可以完全限制訪問 private 函數或變數,但是,從編程習慣上不應該引用 private 函數或變數。
比如:
#!/usr/bin/env python3n# -*- coding: UTF-8 -*-nndef _diamond_vip(lv):n print(尊敬的鑽石會員用戶,您好)n vip_name = DiamondVIP + str(lv)n return vip_namennndef _gold_vip(lv):n print(尊敬的黃金會員用戶,您好)n vip_name = GoldVIP + str(lv)n return vip_namennndef vip_lv_name(lv):n if lv == 1:n print(_gold_vip(lv))n elif lv == 2:n print(_diamond_vip(lv))nnnvip_lv_name(2)n
輸出的結果:
尊敬的鑽石會員用戶,您好nDiamondVIP2n
在這個模塊中,我們公開 vip_lv_name 方法函數,而其他內部的邏輯分別在 vip_lv_name 和 vip_lv_name private 函數中實現,因為是內部實現邏輯,調用者根本不需要關心這個函數方法,它只需關心調用 vip_lv_name 的方法函數,所以用 private 是非常有用的代碼封裝和抽象的方法
一般情況下,外部不需要引用的函數全部定義成 private,只有外部需要引用的函數才定義為 public。
最後扯淡,歡迎加我微信:androidwed,進入微信Python討論群,一起學習討論。現在微信群只有50幾個人.
推薦閱讀:
※python爬蟲之微博評論爬取
※草根學Python(九) 面向對象
※對Github上Python開源項目進行分析時遇到的一個AttributeError的解釋及其解決方法。
※基於pytesseract的簡單驗證碼識別