Python中用BeautifulSoup解析中文網頁里的中文都是亂碼，怎麼回事？

12-28

我想用BeautifulSoup抓取一個網頁裡面的表格數據，但是抓下來的中文全是類似「
????????????????????¨?????????????¨??????????é??é??????」的亂碼。我的代碼如下：
#!/usr/bin/env python # -*- coding: utf-8 -*- import urllib2 from bs4 import BeautifulSoup html=urllib2.urlopen("http://www.515fa.com/che_1978.html").read() soup=BeautifulSoup(html,from_encoding="utf-8") print soup.prettify()
運行出來

嘗試了sys.setdefaultencoding("utf-8")或者把from_encoding改成「gb18030」都沒有用，請問大神這要如何是好？

應該是這個網頁head文件裡面沒有編碼，
需要自己指定『UTF-8』才行。
我只會requests這個庫自己指定編碼的方法。

大概你想這麼做？

網頁源碼里查看下網頁的編譯方式，再直接指定相應的編譯方式