微博搜索關鍵詞,你知道什麼相關話題最火?

微博搜索關鍵詞,你知道什麼相關話題最火?

當微博搜索關鍵詞「楊冪」、「鄭爽」、「趙麗穎」,你知道出現的什麼相關話題最火?

試試就知道了。


本文介紹使用八爪魚採集微博關鍵詞的方法

採集網站:

weibo.com/?

使用功能點:

文本循環

Ajax點擊

Cookie登陸方法(7.0版本)

註:第一次用八爪魚採集微博的童鞋,可以先製作一個簡單的預登陸規則

步驟1:創建採集任務

1)進入主界面,選擇「自定義模式」

2)將要採集的網址複製粘貼到網站輸入框中,點擊「保存網址」

步驟2:登錄微博

1)系統自動打開網頁,進入微博首頁。在頁面右上角,打開「流程」,以展現出「流程設計器」「定製當前操作」兩個版塊。點擊「登錄」按鈕,選擇「點擊該鏈接」,進入微博登錄頁面

2)點擊賬號輸入框,選擇「輸入文字」,輸入賬號,點擊「確定

3)點擊密碼輸入框,選擇「輸入文字」輸入密碼,點擊「確定

4)點擊「登錄」按鈕,選擇「點擊該鏈接

5)系統會自動登錄微博

6)再次選中「打開網頁」步驟,打開「高級選項」,打開「緩存設置」,勾選「打開網頁時使用指定Cookie」

7)八爪魚會記住這個Cookie狀態。下圖中新建了一個任務,打開微博首頁。可以看見,八爪魚中以登陸之後的狀態打開,之後就可以正式進入採集了

步驟3:創建文本循環

1)同上操作選擇自定義採集複製網址打開網頁之後,打開右上角的流程按鈕,從左邊的流程展示界面拖入一個循環的步驟,如下圖

然後打開高級選項,在循環方式中選擇文本列表,在列表下拉框中輸入「楊冪」「鄭爽」「趙麗穎」並用回車鍵隔開。最後選擇「確定

注意:這裡的關鍵詞可以根據自己的需求進行更改

2)接著滑鼠選中輸入框,在右面的提示框中選擇「輸入文字」

3)接著在彈出的輸入框中選擇「確定」,不用輸入文本

然後在左邊的流程中把「輸入文本」拖到循環框中

之後,在右邊的高級選相中勾選使用當前循環里的文本填充輸入框,選擇「確定。」

步驟4:提取關鍵詞

1)滑鼠選中輸入框中的詞,然後在右面的提示框中選擇「滑鼠移動到該元素上

2)此步驟涉及Ajax技術。打開「高級選項」,勾選「Ajax載入數據」,設置時間為「5秒」。完成後,點擊「確定

再次選中關鍵詞,然後選擇「選中全部

3)最後選擇「採集以下鏈接文本

4)選完需要的數據以後,可以打開右上角的流程按鈕,對欄位進行修改

步驟5:數據採集及導出

1)點擊左上角的「保存」,然後點擊「開始採集」

選擇「啟動本地採集」

2)採集完成後,會跳出提示,選擇「導出數據」,選擇「合適的導出方式」,將採集好的數據導出, 這裡我們選擇excel作為導出為格式,數據導出後如下圖


推薦閱讀:

北京沙龍 | 數據採集前端埋點與 SDK 全解析
虛擬串口技術在工廠設備PLC數據遠程採集中的應用
如何快速掌握Python數據採集與網路爬蟲技術
移動採集技術的演變
一口氣做了218個採集模板,從此我們將是爬蟲採集界的美圖秀秀

TAG:新浪微博 | 數據採集 |