關於python中beautifulsoup的問題?
12-28
我從網站(浦發銀行(600000)個股資訊)弄下來的網頁代碼,用find_all("a") 返回的列表為空。而用beautifulsoup文檔中(Beautiful Soup 4.2.0 文檔)的代碼返回的代碼卻不是空的,這是為什麼?求解?
我猜題主是看了我之前的回答以後自己去嘗試那個網頁的……嚇得我趕緊去看了一眼自己之前貼的代碼確保沒有寫錯……
beautifulsoup要先soup = BeautifulSoup(page) 你最好先print page 檢查一下頁面里有沒有內容,不然你在空里找到的自然是空。
或許你應該看看自己是不是在返回頁面的時候少了h.content (requests)或者h.read() (urllib)
示例代碼里是直接賦值了html_doc,而你在請求頁面的時候如果不使用.content或者.read()的話得到的其實不是html文檔,至於是什麼,你可以自己試一下。
另外,以後提問記得寫清楚問題,並且貼上代碼。不貼代碼?你也太流氓了吧
推薦閱讀:
※能否用爬蟲抓取論文參考文獻?
※關於python模擬登錄知乎驗證碼的問題?
※如何爬取摩拜單車位置信息?
※爬蟲怎麼解決封IP的問題?
※爬蟲用哪個好?
TAG:Python | 編程 | 爬蟲計算機網路 | beautifulsoup | Python入門 |