微博搜索關鍵詞,你知道什麼相關話題最火?
當微博搜索關鍵詞「楊冪」、「鄭爽」、「趙麗穎」,你知道出現的什麼相關話題最火?
試試就知道了。
本文介紹使用八爪魚採集微博關鍵詞的方法
採集網站:
https://weibo.com/?sudaref=www.sogou.com&display=0&retcode=6102
使用功能點:
文本循環
Ajax點擊
Cookie登陸方法(7.0版本)
註:第一次用八爪魚採集微博的童鞋,可以先製作一個簡單的預登陸規則
步驟1:創建採集任務
1)進入主界面,選擇「自定義模式」
2)將要採集的網址複製粘貼到網站輸入框中,點擊「保存網址」
步驟2:登錄微博
1)系統自動打開網頁,進入微博首頁。在頁面右上角,打開「流程」,以展現出「流程設計器」和「定製當前操作」兩個版塊。點擊「登錄」按鈕,選擇「點擊該鏈接」,進入微博登錄頁面
2)點擊賬號輸入框,選擇「輸入文字」,輸入賬號,點擊「確定」
3)點擊密碼輸入框,選擇「輸入文字」輸入密碼,點擊「確定」
4)點擊「登錄」按鈕,選擇「點擊該鏈接」
5)系統會自動登錄微博
6)再次選中「打開網頁」步驟,打開「高級選項」,打開「緩存設置」,勾選「打開網頁時使用指定Cookie」
7)八爪魚會記住這個Cookie狀態。下圖中新建了一個任務,打開微博首頁。可以看見,八爪魚中以登陸之後的狀態打開,之後就可以正式進入採集了
步驟3:創建文本循環
1)同上操作選擇自定義採集複製網址打開網頁之後,打開右上角的流程按鈕,從左邊的流程展示界面拖入一個循環的步驟,如下圖
然後打開高級選項,在循環方式中選擇文本列表,在列表下拉框中輸入「楊冪」、「鄭爽」、「趙麗穎」並用回車鍵隔開。最後選擇「確定」
注意:這裡的關鍵詞可以根據自己的需求進行更改
2)接著滑鼠選中輸入框,在右面的提示框中選擇「輸入文字」
3)接著在彈出的輸入框中選擇「確定」,不用輸入文本
然後在左邊的流程中把「輸入文本」拖到循環框中
之後,在右邊的高級選相中勾選使用當前循環里的文本填充輸入框,選擇「確定。」
步驟4:提取關鍵詞
1)滑鼠選中輸入框中的詞,然後在右面的提示框中選擇「滑鼠移動到該元素上」
2)此步驟涉及Ajax技術。打開「高級選項」,勾選「Ajax載入數據」,設置時間為「5秒」。完成後,點擊「確定」
再次選中關鍵詞,然後選擇「選中全部」
3)最後選擇「採集以下鏈接文本」
4)選完需要的數據以後,可以打開右上角的流程按鈕,對欄位進行修改
步驟5:數據採集及導出
1)點擊左上角的「保存」,然後點擊「開始採集」
選擇「啟動本地採集」
2)採集完成後,會跳出提示,選擇「導出數據」,選擇「合適的導出方式」,將採集好的數據導出, 這裡我們選擇excel作為導出為格式,數據導出後如下圖
推薦閱讀:
※北京沙龍 | 數據採集前端埋點與 SDK 全解析
※虛擬串口技術在工廠設備PLC數據遠程採集中的應用
※如何快速掌握Python數據採集與網路爬蟲技術
※移動採集技術的演變
※一口氣做了218個採集模板,從此我們將是爬蟲採集界的美圖秀秀