Python實現守護進程

考慮如下場景:你編寫了一個python服務程序,並且在命令行下啟動,而你的命令行會話又被終端所控制,python服務成了終端程序的一個子進程。因此如果你關閉了終端,這個命令行程序也會隨之關閉。

要使你的python服務不受終端影響而常駐系統,就需要將它變成守護進程。

守護進程就是Daemon程序,是一種在系統後台執行的程序,它獨立於控制終端並且執行一些周期任務或觸發事件,通常被命名為"d"字母結尾,如常見的httpd、syslogd、systemd和dockerd等。

代碼實現

python可以很簡潔地實現守護進程,下面先給出代碼和相應注釋:

# coding=utf8nimport osnimport sysnimport atexitnnndef daemonize(pid_file=None):n """n 創建守護進程n :param pid_file: 保存進程id的文件n :return:n """n # 從父進程fork一個子進程出來n pid = os.fork()n # 子進程的pid一定為0,父進程大於0n if pid:n # 退出父進程,sys.exit()方法比os._exit()方法會多執行一些刷新緩衝工作n sys.exit(0)nn # 子進程默認繼承父進程的工作目錄,最好是變更到根目錄,否則回影響文件系統的卸載n os.chdir(/)n # 子進程默認繼承父進程的umask(文件許可權掩碼),重設為0(完全控制),以免影響程序讀寫文件n os.umask(0)n # 讓子進程成為新的會話組長和進程組長n os.setsid()nn # 注意了,這裡是第2次fork,也就是子進程的子進程,我們把它叫為孫子進程n _pid = os.fork()n if _pid:n # 退出子進程n sys.exit(0)nn # 此時,孫子進程已經是守護進程了,接下來重定向標準輸入、輸出、錯誤的描述符(是重定向而不是關閉, 這樣可以避免程序在 print 的時候出錯)nn # 刷新緩衝區先,小心使得萬年船n sys.stdout.flush()n sys.stderr.flush()nn # dup2函數原子化地關閉和複製文件描述符,重定向到/dev/nul,即丟棄所有輸入輸出n with open(/dev/null) as read_null, open(/dev/null, w) as write_null:n os.dup2(read_null.fileno(), sys.stdin.fileno())n os.dup2(write_null.fileno(), sys.stdout.fileno())n os.dup2(write_null.fileno(), sys.stderr.fileno())nn # 寫入pid文件n if pid_file:n with open(pid_file, w+) as f:n f.write(str(os.getpid()))n # 註冊退出函數,進程異常退出時移除pid文件n atexit.register(os.remove, pid_file)n

概括一下守護進程的編寫步驟:

  1. fork出子進程,退出父進程
  2. 子進程變更工作目錄(chdir)、文件許可權掩碼(umask)、進程組和會話組(setsid)
  3. 子進程fork孫子進程,退出子進程
  4. 孫子進程刷新緩衝,重定向標準輸入/輸出/錯誤(一般到/dev/null,意即丟棄)
  5. (可選)pid寫入文件

理解幾個要點

為什麼要fork兩次

第一次fork,是為了脫離終端控制的魔爪。父進程之所以退出,是因為終端敲擊鍵盤、或者關閉時給它發送了信號;而fork出來的子進程,在父進程自殺後成為孤兒進程,進而被操作系統的init進程接管,因此脫離終端控制。

所以其實,第二次fork並不是必須的(很多開源項目里的代碼就沒有fork兩次)。只不過出於謹慎考慮,防止進程再次打開一個控制終端。因為子進程現在是會話組長了(對話期的首次進程),有能力打開控制終端,再fork一次,孫子進程就不能打開控制終端了。

文件描述符

Linux是「一切皆文件」,文件描述符是內核為已打開的文件所創建的索引,通常是非負整數。進程通過文件描述符執行IO操作。

默認情況下,0代表標準輸入,1代表標準輸出,2代表標準錯誤。

umask許可權掩碼

我們知道,在Linux中,任何一個文件都有讀(read)、寫(write)和執行(execute)的三種使用許可權。其中,讀的許可權用數字4代表,寫許可權是2,執行許可權是1。命令ls -l可以查看文件許可權,r/w/x分別表示具有讀/寫/執行許可權。

任何文件,也都有用戶(User),用戶組(Group),其他組(Others)三種身份許可權。一般用3個數字表示文件許可權,例如754:

  • 7,是User許可權,即文件擁有者許可權
  • 5,是Group許可權,擁有者所在用戶組的組員所具有的許可權
  • 4,是Others許可權,即其他組用戶的許可權啦

而umask是為了控制默認許可權,防止新建文件或文件夾具有全權。

系統一般默認為022(使用命令umask查看),表示默認創建文件的許可權是644,文件夾是755。你應該可以看出它們的規律,就是文件許可權和umask的相加結果為666(笑),文件夾許可權和umask的相加結果為777。

進程組

每個進程都屬於一個進程組(PG,Process Group),進程組可以包含多個進程。

進程組有一個進程組長(Leader),進程組長的ID(PID, Process ID)就作為整個進程組的ID(PGID,Process Groupd ID)。

會話組

登陸終端時,就會創造一個會話,多個進程組可以包含在一個會話中。而創建會話的進程,就是會話組長。

已經是會話組長的進程,不可以再調用setsid()方法創建會話。因此,上面代碼中,子進程可以調用setsid(),而父進程不能,因為它本身就是會話組長。

另外,sh(Bourne Shell)不支持會話機制,因為會話機制需要shell支持工作控制(Job Control)。

守護進程與後台進程

通過&符號,可以把命令放到後台執行。它與守護進程是不同的:

  1. 守護進程與終端無關,是被init進程收養的孤兒進程;而後台進程的父進程是終端,仍然可以在終端列印
  2. 守護進程在關閉終端時依然堅挺;而後台進程會隨用戶退出而停止,除非加上nohup
  3. 守護進程改變了會話、進程組、工作目錄和文件描述符,後台進程直接繼承父進程(shell)的

換句話說:守護進程就是默默地奮鬥打拚的有為青年,而後台進程是默默繼承老爸資產的富二代。

----

博文原址:《Python實現守護進程》

推薦閱讀:

阿里巴巴正式開源其自研容器技術Pouch
為什麼所有鍵盤上都有微軟的LOGO?
Wine 3.0 發布,支持 Android 圖形驅動、Direct3D 11
最小化安裝OS

TAG:Python | Linux | systemd |