Deep Learning書評

Ian Goodfellow, Yoshua Bengio, Aaron Courville, 當看到這三個名字整齊排印在封面上,除了令人肅然起敬,更令人對本書中的內容多了些期許。此書甫一問世便迅速佔據了學界產業界研究人員的書架案頭,除卻領袖光環的加持,書籍本身的內容、質量是它廣受歡迎的決定性因素,每個章節每一處引注無不是先驅者們探索的足跡。對於學術研究人員來說,說它是百科全書未免誇張——畢竟深度學習領域的進展日新月異,一日千里,但也稱得上是一部足夠「自包含」的深度學習知識庫,作為一本字典式的手頭工具書再合適不過了;而對於產業界工程人員來說,調參調到山窮水盡百無聊賴之際亦不妨捧起本書,或許會有柳暗花明之得。

在此之前多是傳統的機器學習、統計學習方面的教材,一方面深度神經網路的再度崛起算起來也不過區區數年的時間,新的理論新的工具正在孕育發展之中,另一方面,深度學習在各個領域的巨大成功對領域本身形成了更大的需求和希冀。在此情形下,人才的培養和高質量的理論學習資料就成了深度學習領域發展亟需解決的問題。俗話說「上帝說要有光,於是便有了光」,《Deep Learning》似乎就是這麼一部應時之作。

全書分為三部分:相關數學和機器學習基礎知識,深層網路的實踐以及深度學習研究。在此,對應於這三部分的內容,姑且稱之為深度學習的「基礎入門」,「術」,與「道」。這本書的主要目標受眾是兩大群體,一是學習機器學習的大學生(本科或研究生),以及那些已經開始職業生涯的深度學習和人工智慧研究者。另一個目標群體是沒有機器學習或統計背景但要迅速在他們的產品或平台中使用深度學習的軟體工程師。因此一開始就介紹了學習深度學習所需的基本數學知識,以免讀者在遇到不熟悉的數學名詞時不知所措,所以說作者對於需要講什麼是有著自己的考量的,這也是人們更容易認可領域專家的作品的原因:術業有專長方能高屋建瓴,否則只能是泛泛而談,或者如大雜燴般和盤托出,沒有重點。後面章節的內容更是體現了這一點,目前多數出版的深度學習相關書籍大都是集中於講解具體的神經網路:前饋神經網路,卷積神經網路,循環神經網路……常常難以觸及到深度學習背後的諸多理論、思想。

本書的第二部分詳細講述了目前常用的各類神經網路,是為所謂「術」的部分。這部分是近些年研究成果的集大成,除了各類網路的介紹,還相應的穿插介紹了各種實用的優化、調試策略、正則化技術,作者都是深度學習一線研究人員,更是其中一些網路模型的提出者,因此對這部分自然是駕輕就熟,頗具發言權解釋權。這部分內容更偏向於工程實踐,是從業者最常接觸的部分,在深度學習中屬於比較具體的技術內容,因此稱之為「術」。作為相關從業人員以及研究人員的必備技能,這部分的內容在整部書中佔有相當大的分量,囊括了模型結構、訓練優化、調試策略以及視覺、語音、自然語言處理等具體應用,相信各個子領域研究者都能從中獲益。

技術時有更迭,會推陳出新,會被淘汰,最終成為人類科技樹的一枝一葉被塵封在歷史裡。這是技術的使命,也是技術的命運,它將我們帶入一個時代,而它本身也許終將長眠在這個時代,畢竟在科技發展史中不破則不立。當然,一本好書絕不會滿足於技術層面的灌輸,作者們在第三部分開始引領我們探訪深度學習之「道」。這部分內容理論性較強,內容相較於第二部分也比較「陳舊」,而這恰恰說明了這些內容超脫於「術」的頑強生命力。所謂「天不變,道亦不變」,作為深度學習背後的思想原理,這部分內容擁有更為持久的生命力。這部分旨在幫助讀者理解深度學習背後的要素,這些內容是現有技術得以誕生、發展的原點,也是未來探索新技術新方法的基石,如果不能了解作者的這份用心,只因枯燥無味便對這部分內容意興索然,那頗有買櫝還珠之憾了。比如概率圖模型的章節,相對於深度學習目前的黑盒性質,概率圖模型的理論準備則更充分、成熟,可解釋性也更強。作為一種結構化概率模型,它能夠為深度學習研究者提供指導性的建模和設計演算法的思路。

然而所謂「完美」大都只是一個概念,本書也或多或少存在一些有待改進的地方。這本書的內容多是深度學習領域知識點整合,囿於時代的局限性,在深度學習理論解釋層面的內容略顯單薄。當然,這些不足和當前深度學習領域的發展水平有關,我們也不能用超脫歷史階段的眼光對它過分苛求,希望未來深度學習能在理論層面取得突破,也期待本書未來能在這方面進行展開。

此外,該書的中譯本已在國內上市,由人民郵電出版社出版,並提供電子版免費下載。這為國內廣大關注該書的讀者提供了接觸深度學習的快捷通道。

總的來說,該書有足夠的廣度與深度,是一部不可多得的優秀作品,無論是有志於涉足深度學習領域的初學者,還是本領域的專業研究人員、工程師,都能從中受益。


推薦閱讀:

機器學習入門之邏輯回歸分類
數據集列歸一化與聚類示例
2-2 Cost Function
全面梳理:準確率,精確率,召回率,查准率,查全率,假陽性,真陽性,PRC,ROC,AUC,F1

TAG:深度學習書籍 | 機器學習 |