標籤:

C# 都有哪些爬蟲框架?

C# 都有哪些開源的爬蟲框架?
爬到的網頁該如何做保存?是存資料庫還是存文檔?如何解決大數據的url是否已經抓取或是避免重複


我只會用正則匹配,沒深研究過o(╯□╰)o


  • Html Agility Pack:感覺比較好的東東。
  • http://htmlagilitypack.codeplex.com/
  • Arachnode:暫無說明
  • http://arachnode.net/
  • NCrawler:暫無說明
  • http://ncrawler.codeplex.com/
  • HttpHelper:國人的,貌似是個小團隊,專門寫寫幫助類框架,有開源的,也有功能更加強大的收費版。
  • http://httphelper.sufeinet.com/

【補充】【2017年1月4日12:41:00】

  • CSQuery:不錯
  • http://www.nuget.org/packages/CsQuery/

  • AngleSharp:強烈推薦
  • https://anglesharp.github.io/

HtmlAgilityPack


推薦閱讀:

怎樣用Python設計一個爬蟲模擬登陸知乎?

TAG:C# | 網頁爬蟲 |