如何有系統地學習Python爬蟲?

近年來,大數據成為業界與學術界最火熱的話題之一,數據已經成為每個公司極為重要的資產。互聯網大量的公開數據為個人和公司提供了以往想像不到的可以獲取的數據量。而掌握網路爬蟲技術可以幫助你獲取這些有用的公開數據集。

我是從商科自學轉到數據科學的,因此編程和數據挖掘能力都是上網自學的。在這個過程中,我深刻地體會到,與不知所云的教學相比,深入淺出的教學對學習效率有很大提升。因此,學習知識最重要的兩點是,通過富有邏輯的框架解構學習和通過實戰解決實際問題,從而增強學習效果。

因此,我將自己學習網路爬蟲的心得寫下了《Python 網路爬蟲:從入門到實踐》。本書的內容側重於將網路爬蟲技術進行框架性的解構,並使用代碼將爬蟲技術應用於抓取真實的網站。

下面貼上本書的目錄,不管你有沒有基礎,感興趣的朋友可以買來看看。

執筆此書的起因是我打算在知乎上寫博客向香港中文大學市場營銷學的研究生講解 Python 網路爬蟲技術,讓這些商科學生掌握一些大數據時代重要的技術能力。

因此,本書除了面向技術人員外,還面向不懂編程的小白。本書盡量做到淺顯易懂,希望能夠將網路爬蟲學習的門檻降低,讓大家都能享受到使用網路爬蟲編程的樂趣。

有興趣的朋友可以去網上購買:

京東鏈接:《Python網路爬蟲從入門到實踐》(唐松,陳智銓)【摘要 書評 試讀】- 京東圖書

噹噹鏈接:《Python網路爬蟲從入門到實踐》(唐松 陳智銓)【簡介_書評_在線閱讀】 - 噹噹圖書

推薦閱讀:

左手用R右手Python系列17——CSS表達式與網頁解析
C# 都有哪些爬蟲框架?
Python 網路爬蟲——如何在登陸情況下下載文檔
目前做爬蟲,往後的職業發展方向是什麼?
python2.7爬蟲中decode("utf-8")出錯該如何解決?

TAG:爬虫计算机网络 | 网页爬虫 | 爬虫 |