[深度學習之美】深度學習的淺度夢想(自序)

[深度學習之美】深度學習的淺度夢想(自序)

3 人贊了文章

這是一本有關「深度學習」的圖書!

這是一本有關「深度學習」通俗易懂的圖書!

這是一本有關「深度學習」的有點人文情懷的圖書!

我希望,我的讀者在讀這本書時,能給它這三種不同境界的漸進式的評價。第一個評價,說明它「有料」。第二個評價,說明它「有用」。第三個評價,說明它「有趣」。「有料、有用且有趣」是我對本書的定位,也是本書寫作的淺度夢想,不是有大咖說過嗎?「夢想還是要有的,萬一實現了呢?」

寫一本好書,真的很難!

但並非不能達成。竊以為,寫成一本好書,通常有兩條途徑達成。第一條我稱之為「自上而下大家傳道法」。也就是說,有些學術大家已在領域內功成名就,名聲斐然,他(她)們俯下身段,抽出時間,高屋建瓴,精耕細作,必出精品。比如,卡耐基梅隆大學的Tom Mitchell教授編寫的《機器學習》、國內南京大學周志華老師編寫的《機器學習》,都是業內口碑極好的暢銷常青樹,實為我輩楷模。

但「大家寫好書」並不是充分條件,因為大家們通常都非常忙,他們可能非常「有料、有錢(有經費)」,但卻未必「有閑」。要知道,寫作不僅僅是個腦力活,它還是極花費時間的體力活。

好在還有寫成好書的途第二條徑,我且稱之為「自下而上小兵探道法」。也就是說,寫書的作者本身並非領域專家,而是來自科研實戰一線,他們的眼前也時常迷茫一片,不得不肉搏每一個理論困惑,手刃每一個技術難題,一路走來,且泣且歌,終於爬上一個小山丘。鬆了口氣,渴了口水,嗯,我要把自己趟過的路,踩過的坑,寫出來總結一下,除了自勉一下,也讓尋路而來的同門或同道中人,不再這麼辛苦。

很顯然,我把自己的書定位為第二類(至少夢想是)。

我是一個科技寫作愛好者。我在網路上寫過很多大數據、深度學校的文章。有關於大數據主題的(主要發表在CSDN),也有關於深度學習的(主要發表於阿里雲-雲棲社區)。出於愛好寫作的原因,有時我也關注寫作的技巧。直到有一天,有個知名人士的一席話,一下子「電著」我了。他說,「寫作的終極技巧,就是看你寫的東西對讀者有沒有用?」

拿這個標準來度量一下,什麼辭藻華麗、什麼文筆優美,都可能是綠葉與浮雲。在這一瞬間,我也明白了,為什麼我所在的城市,地鐵時刻表的變更通知,寥寥幾百字,短短沒幾天,閱讀量也可以輕易10萬+。嗯,這樣的寫作,有乾貨,對讀者有用。好作品的要素,它都有!

於是,「對讀者有用」,就成為指導我寫作這本書的基準。以用戶的思維度量,就可以比較清晰地知道,什麼對讀者有用。

當前,人工智慧非常火爆。自從AlphaGo點燃世人對人工智慧的極大熱情,學術界或產業界都積極投身於此,試圖分得一杯羹。而當前(至少是當前)人工智慧的當紅主角就是「深度學習」。它不僅僅表現在AlphaGo一戰成名的技術上,還表現在圖像識別、語音識別、自然語言處理性能提升上,總總而生,林林而群。

當然,想「投身於此」並非易事。因為深度學習的門檻比較高。為了學習深度學,我把國內市面上大部分深度學習相關的書籍都來買來拜讀了(在後記中,我會感謝支持的各種基金),受益匪淺,但至少於我而言,它們大部分的學習曲線都是陡峭的,或者說他們大多高估了初學者的接受程度,為了懂它們,讀者真得需要「深度學習」。

在深度學習領域,的確也有一批高水平的讀者,但他/她們可能並不需要靠通過相對滯後的書籍來提高自己的知水平,新鮮出爐的arXiv論文,才是他/她們的菜。但高手畢竟有限,懵懵懂懂的初學者,數量還是相對龐大的。

於是,我想,寫一本零基礎入門的、通俗易懂的、圖文並茂的、理論結合實戰的深度學習書籍,對廣大的深度學習初學者來說,應該有用的。

本書的寫作風格,也緊扣前面的四個修飾詞的。章節的安排也是按照循序漸進的節奏鋪呈展開的。為了降低門檻和強調實踐性,本書採用了雙主線寫作,一條主線是理論脈絡,從基礎的機器學習概念,到感知機、MP模型、全連接網路、再到深度學習網路,由深入淺出地講解相關的理論。另外一條主線是實戰沒落,從Python 零基礎入門說起,直到TensorFlow的高級應用。

全書共分16章,具體說來,第1章給出深度學習的大圖(Big Picture),讓讀者有個宏觀認知。第2章至第3章,我們給出了機器學習的相關基礎理論。僅僅懂點理論不夠啊,我們需要動手實踐,用什麼實踐呢?最熱門的機器學習語言非Python莫屬了。於是我們在第4章添加了Python基礎,以邊學邊用邊提高為基調,我們在5章用講解基於Python的機器學習實戰。

有了部分Python基礎,也有了部分機器學習基礎,接下來,我們該學習部分神經網路的相關理論了。於是在第6章至第10章,我們先後後講解了M-P模型、感知機、多層神經網路、BP神經網路等領域知識。其間大部分的理論都配有Python實戰講解,就是讓讀者「頂天(上接理論)立地(下接實戰)」的質感。接下來的問題就是,如果所有神經網路學習的項目都是Python手工編寫,是不是效率太低了呢?

是的,是該考慮用高效率框架的時候了,於是在第十一章,我們講解了被廣泛認可的深度學習框架TensorFlow。有了這個基礎,後面的深度學習理論就以此做實戰基礎。在第12章,詳細講解了卷積神經網路。隨後,在第13章,我們站在實戰的基礎中,我們對卷積神經網路的TensorFlow實踐,做了詳細介紹。

任何一項技術都有其不足。在第14章,我們講解了循環遞歸網路(RNN)。在第15章,我們講解了長短期記憶(LSTM)網路,以上兩章的內容,並非都是高冷的理論,除了給出理論背後有意思的小故事,我們還結合了TensorFlow進行了實戰演練。在第16章,我們還順便「驚鴻一瞥」解讀了Hinton教授的新作「神經網路膠囊(CapsNet)」,點出卷積神經網路的不足,並給出了神經膠囊的詳細論述和實踐案例分析。

本書的部分章節的部分內容(共計14篇),先後發表在技術達人云集的雲棲社區(yq.aliyun.com/topic/111),然後被很多熱心的網友轉載到CSDN、知乎、微信公眾號、百度百家等自媒體中,受到了很多讀者的認可。於吾心,有樂陶然。

當然,從我對自己的定位——「小兵探道」可知,我對深度學習的認知,仍處於一種探索階段,我仍是一個深度學習的學習者。在圖書中、在網路里,我學習了、參考了很多有價值的資料。這裡,對這些有價值的資料的提供者、生產者,我表示深深的敬意和謝意。

有時候,我甚至把自己定位一個「知識的搬運工」、深度學習知識的梳理者。即使如此,由於學術水平尚淺,我對一些理論或技術的理解,可能是膚淺的,甚至是錯誤的,所以,如果本書「有誤」,且如果讀者「有閑」,不妨給出你的寶貴建議和意見,在此表示感謝。同時,由於時間和精力有限,很多有用的深度學習理論和技術還沒有涉及到,只待日後補上。

作者的聯繫信箱為:zhangyuhong001@gmail.com。

張玉宏

2018年3月

本文部分節選自《深度學習之美:AI時代的數據處理與最佳實踐》(張玉宏著,電子工業出版社,2018年7月出版)。

(連載待續)


推薦閱讀:

乾貨:德國計算機雙學位(英語授課)盤點
用AI找棋盤上的真相:古力還是「絕藝」?
《智能時代》讀書筆記&心得
專訪機器人Alpha Go :我不是種豬,讓我對戰柯潔毫無意義
【原創機器人教學案例】雙向棘輪扳手

TAG:深度學習DeepLearning | 人工智慧 | 機器學習 |