如何通過新浪微博API抓取大量用戶信息?

新浪微博開放平台提供的API基本都需要用戶的授權以得到access_token才能獲取用戶信息,那我得到一個用戶的follower之後再想得到那些follower的follower不是還需要每個用戶的access_token?還是說抓取大量的數據只能通過爬蟲來實現?


你可以反編譯官方的客戶端來獲取必要的介面。


現在API似乎不行了(需要高級介面),你最好直接parse網頁。


爬蟲妥妥的能用,api能不能用看新浪有沒有限制(功能或頻率)了


我認為不需要,因為你現在通過網頁,不登錄別人的賬號你也可以知道人家follow了誰


菜鳥一枚,答案如有不對,請斧正。

access_token是基於Oauth2.0的一種認證機制,簡單的說就是認證當前使用的用戶是擁有新浪微博API的使用許可權的。

但是現在微博的API進行升級,抓取粉絲只能抓取當前授權的用戶,所以現在API十分不靠譜。

如果題主需要獲取某一個用戶的粉絲信息,我建議使用模擬登錄的方式,也就是爬蟲,這種方式現在可以抓取粉絲信息。

現在微博的API是越來越嚴格的。我幾年前剛剛考上研究生時,導師分配的第一個項目就是用微博API寫一個小工具。工具寫好之後,過幾月就不行了,因為API的功能越來越少了。

現在實驗室里還有其他的同學研究新浪微博,用的就是模擬登錄,可以用。


不需要用新浪API,網頁版的介面更好用點。

通過抓取用戶的關注、粉絲,不斷循環抓取。


獲取賬號-模擬登陸-數據採集-清除操作記錄,不過驗證碼那塊得費點心,現在不同網站的驗證和反爬策略不一樣


爬蟲


樓主你好,請問我只能獲得創建薏米用的自己的帳號的那個taken,如何獲得其他人的,用的JAVA SDK,捉急,請指教


這種介面隨便一個用戶的認證都可以調用,不需要必須是本用戶。


推薦閱讀:

關於Python IDE如何選擇?
紅白機時代的fc遊戲卡帶是類似於u盤的存儲設備嗎?這種遊戲是用什麼語言寫的?
希望自己做個機器人出來,應該對哪些專業知識有所了解?
能否用函數與數組直接實現多個矩陣相乘?
作為一個程序猿,馬克思的歷史唯物主義,唯物辯證法等馬克思哲學思想怎麼和寫代碼結合起來……?

TAG:互聯網 | 編程 | 爬蟲計算機網路 | 新浪微博開放平台 | 網頁抓取 |