啟信寶的查詢功能是如何實現的?

啟信寶這個公眾號(微信號:iqixin007)裡面的點擊「進入查詢」以後進入的網頁,能查詢到各種企業的信息,請問這個是如何做到的?我看了一下,好像工商的網站上只能查詢某一個省的企業信息(每個省都有自己的網站),並沒有能查詢到全國所有省的企業信息的網站。全國企業信用信息公示系統


工商信息主要來源爬蟲抓取與即時更新

  • 爬的:
    • 工商局不提供任何數據介面,第三方資料庫信息為爬取所得
    • 爬取信息屬合規性質,工商局有義務公開企業信用信息
  • 目前各第三方資料庫信息抓取方式如下:
    • 通過爬取全國各省市企業信用信息公示系統獲得部分公司的工商數據
    • 用戶查詢某公司信息時,第三方資料庫將判斷其是否存在資料庫(不存在將重新抓取,數秒時間)以及是否長時間未更新(重新定向抓取,數秒時間),如不需更新則直接從資料庫中提取(毫秒時間)

怎麼查詢工商企業信息


官方的服務協議第七條寫的很明確,應該是爬蟲技術。

七、 來源聲明

啟信寶所開發、運營的大數據軟體啟信寶網頁版(以下簡稱「啟信寶」)是一款企業工商數據等公開信息查詢系統。根據用戶指令,啟信寶的搜索引擎系統會以非人工檢索方式自動生成用戶檢索的已經依法公開的企業信息,以便用戶能夠找到和使用該已被公開信息。

啟信寶目前網站公示數據來源為如下網站,現就數據來源及其合規性簡述如下:

1、全國企業信用信息公示系統(http://gsxt.saic.gov.cn)

?全國企業信用信息公示系統簡介如下:

1.1公示依據

本系統信息公示依據《中華人民共和國政府信息公開條例》、《企業信息公示暫行條例》等法律法規、規章的有關規定。

1.2系統功能

本系統提供全國企業、農民專業合作社、個體工商戶等市場主體信用信息的填報、公示和查詢服務。1、查詢市場主體信用信息,輸入名稱或註冊號進行查詢。系統支持按名稱的關鍵詞模糊查詢,一次最多顯示5條記錄。對於無效的查詢條件,將不會顯示查詢結果。2、市場主體填報年度報告和其他信息,通過本系統選擇登記機關所在地區,點擊「企業公示信息填報」進行填報。

.

.

.

......


看了36KR的報道,答案是這樣的


企業信用信息的數據源從哪裡來?

此前中國徵信體系的資源一直集中在央行的徵信中心,2014年以來,國家開放第三方企業徵信牌照。啟信寶已拿到相關牌照。

並且,啟信寶通過多個伺服器建立相互連接的大資料庫,連接全網可查詢範圍內的100家企業徵信官?網站的數據介面,其中包括了全國企業信?用信息公?系統、中國法院裁判?文書?、中國執行信息公開網等多家具有絕對權威性的官方?站


推薦閱讀:

怎樣利用數據爬取和分析工具寫出《黃燜雞米飯是怎麼火起來的》這樣的文章?

TAG:爬蟲計算機網路 | 工商註冊信息 |