求大神們推薦python入門書籍(爬蟲方面)?

python爬蟲


學爬蟲,需要理論與實踐相結合,Python生態中的爬蟲庫多如牛毛,urllib、urllib2、requests、beautifulsoup、scrapy、pyspider都是爬蟲相關的庫,但是如果沒有理論知識,純粹地學習如何使用這些API如何調用是不會有提升的。所以,在學習這些庫的同時,需要去系統的學習爬蟲的相關原理。

你需要懂的技術包括但不限於Python編程語言、HTTP協議(TCP/IP協議棧)、資料庫、Linux等知識

Python入門:《A Byte of Python》

HTTP入門:《圖解HTTP》

資料庫入門:《MySQL必知必會》

Linux入門:《快樂的 Linux 命令行》

正則入門:《精通正則表達式 》

還有一本專門講爬蟲的書:《用Python寫網路爬蟲》


題主的要求是Python入門,而且是和爬蟲相關的書籍,那麼有一本書簡直太適合了,那就是《 Python for Informatics 》(中文翻譯叫《信息管理專業Python教程》),這本書不僅是一本很好的Python爬蟲方面的入門書,而且還有以這本書為教材的配套的Coursera課程。
這本書是美國密西根大學信息學院教授為他的課程編寫的,是一本開源書,有人將他翻譯成了中文版,書上有配套的習題和代碼,而且這些習題代碼都可以在網上獲取到,書本身並不厚,前面十章將的都是Python的基礎用法,後面幾張就是講解和Python爬蟲有關的,像正則表達式,網路編程(HTTP 協議), Web Service,資料庫與SQL語句,數據可視化,書中還仔細講解了用Python爬取Twiter上的用戶信息,和各種解析html會用到的工具,如BeautifulSoup等,學完本書,爬取個知乎什麼的都是小意思!本書中文版下載地址地址。
說完了書在來說說配套的Coursera課程,是Coursera上很火的零基礎 Python 入門 專項課程,內容大致和書上的內容差不多,分成了6門課程,前三門課程講解Python語法,後面講Python爬蟲的數據採集數據處理等,並且有不少的習題,老師也非常非常有趣,,知乎上很早之前就有人介紹這門課程coursera上有哪些值得學習的Python,數據分析的課程? - 程剛的回答,本課的課程地址,並且這門課恰好就是明天開課(7月25號),學習課程如果不要證書的話也不用花錢,貌似大部分配有中文字幕。


有一本英文方面的書
《Web Scraping with Python- Collecting Data from the Modern Web》


推薦我自己寫的一本書《python爬蟲開發與項目實戰》,由淺入深,體系完善,希望對你有幫助。


推薦機械工業出版社出版的《精通Python網路爬蟲》這本書。

感覺不錯,體系比較全面。


無需書籍,requests,beautifulsoup,玩的七七八八了,再看看pyspider,scrapy,至此,你出關了


art of python


推薦閱讀:

python動態的網頁數據json里沒有中文字元怎麼辦?
有沒有python爬蟲視頻教程推薦啊?
通俗的講,網路爬蟲到底是什麼?
python模擬登陸的時候,別人用的是js生成的驗證碼(純字元)如何獲得生成的動態頁面?
為什麼使用BeautifulSoup時,把解析器換成lxml就出錯?

TAG:Python | Python入門 | Python開發 |