關於python中beautifulsoup的問題?

我從網站(浦發銀行(600000)個股資訊)弄下來的網頁代碼,用find_all("a") 返回的列表為空。而用beautifulsoup文檔中(Beautiful Soup 4.2.0 文檔)的代碼返回的代碼卻不是空的,這是為什麼?求解?


我猜題主是看了我之前的回答以後自己去嘗試那個網頁的……嚇得我趕緊去看了一眼自己之前貼的代碼確保沒有寫錯……

beautifulsoup要先soup = BeautifulSoup(page) 你最好先print page 檢查一下頁面里有沒有內容,不然你在空里找到的自然是空。
或許你應該看看自己是不是在返回頁面的時候少了h.content (requests)或者h.read() (urllib)

示例代碼里是直接賦值了html_doc,而你在請求頁面的時候如果不使用.content或者.read()的話得到的其實不是html文檔,至於是什麼,你可以自己試一下。

另外,以後提問記得寫清楚問題,並且貼上代碼。


不貼代碼?你也太流氓了吧


推薦閱讀:

能否用爬蟲抓取論文參考文獻?
關於python模擬登錄知乎驗證碼的問題?
如何爬取摩拜單車位置信息?
爬蟲怎麼解決封IP的問題?
爬蟲用哪個好?

TAG:Python | 編程 | 爬蟲計算機網路 | beautifulsoup | Python入門 |