【Python3網路爬蟲開發實戰】 1.3.1-lxml的安裝
lxml是Python的一個解析庫,支持HTML和XML的解析,支持XPath解析方式,而且解析效率非常高。本節中,我們了解一下lxml的安裝方式,這主要從Windows、Linux和Mac三大平台來介紹。
1. 相關鏈接
- 官方網站:http://lxml.de
- GitHub:https://github.com/lxml/lxml
- PyPI:https://pypi.python.org/pypi/lxml
2. Windows下的安裝
在Windows下,可以先嘗試利用pip安裝,此時直接執行如下命令即可:
pip3 install lxml
如果沒有任何報錯,則證明安裝成功。
如果出現報錯,比如提示缺少libxml2庫等信息,可以採用wheel方式安裝。
推薦直接到這裡(鏈接為:http://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml)下載對應的wheel文件,找到本地安裝Python版本和系統對應的lxml版本,例如Windows 64位、Python 3.6,就選擇lxml?3.8.0?cp36?cp36m?win_amd64.whl,將其下載到本地。
然後利用pip安裝即可,命令如下:
pip3 install lxml?3.8.0?cp36?cp36m?win_amd64.whl
這樣我們就可以成功安裝lxml了。
3. Linux下的安裝
在Linux平台下安裝問題不大,同樣可以先嘗試pip安裝,命令如下:
pip3 install lxml
如果報錯,可以嘗試下面的解決方案。
CentOS、Red Hat
對於此類系統,報錯主要是因為缺少必要的庫。
執行如下命令安裝所需的庫即可:
sudo yum groupinstall -y development toolssudo yum install -y epel-release libxslt-devel libxml2-devel openssl-devel
主要是libxslt-devel和libxml2-devel這兩個庫,lxml依賴它們。安裝好之後,重新嘗試pip安裝即可。
Ubuntu、Debian和Deepin
在這些系統下,報錯的原因同樣可能是缺少了必要的類庫,執行如下命令安裝:
sudo apt-get install -y python3-dev build-essential libssl-dev libffi-dev libxml2 libxml2-dev libxslt1-dev zlib1g-dev
安裝好之後,重新嘗試pip安裝即可。
4. Mac下的安裝
在Mac平台下,仍然可以首先嘗試pip安裝,命令如下:
pip3 install lxml
如果產生錯誤,可以執行如下命令將必要的類庫安裝:
xcode-select --install
之後再重新嘗試pip安裝,就沒有問題了。
lxml是一個非常重要的庫,後面的Beautiful Soup、Scrapy框架都需要用到此庫,所以請一定安裝成功。
5. 驗證安裝
安裝完成之後,可以在Python命令行下測試:
$ python3>>> import lxml
如果沒有錯誤報出,則證明庫已經安裝好了。
本資源首發於崔慶才的個人博客靜覓: Python3網路爬蟲開發實戰教程 | 靜覓
如想了解更多爬蟲資訊,請關注我的個人微信公眾號:進擊的Coder
http://weixin.qq.com/r/5zsjOyvEZXYarW9Y9271 (二維碼自動識別)
推薦閱讀:
※日語中平假名與片假名互相轉換的程序
※python Web 運維 爬蟲.....一條龍學習視頻教程
※Python編程(bbb四):兩個實用的Python的裝飾器
※[3] Python數值