如何通過新浪微博API抓取大量用戶信息?
12-28
新浪微博開放平台提供的API基本都需要用戶的授權以得到access_token才能獲取用戶信息,那我得到一個用戶的follower之後再想得到那些follower的follower不是還需要每個用戶的access_token?還是說抓取大量的數據只能通過爬蟲來實現?
你可以反編譯官方的客戶端來獲取必要的介面。
現在API似乎不行了(需要高級介面),你最好直接parse網頁。
爬蟲妥妥的能用,api能不能用看新浪有沒有限制(功能或頻率)了
我認為不需要,因為你現在通過網頁,不登錄別人的賬號你也可以知道人家follow了誰
菜鳥一枚,答案如有不對,請斧正。
access_token是基於Oauth2.0的一種認證機制,簡單的說就是認證當前使用的用戶是擁有新浪微博API的使用許可權的。
但是現在微博的API進行升級,抓取粉絲只能抓取當前授權的用戶,所以現在API十分不靠譜。
如果題主需要獲取某一個用戶的粉絲信息,我建議使用模擬登錄的方式,也就是爬蟲,這種方式現在可以抓取粉絲信息。
現在微博的API是越來越嚴格的。我幾年前剛剛考上研究生時,導師分配的第一個項目就是用微博API寫一個小工具。工具寫好之後,過幾月就不行了,因為API的功能越來越少了。
現在實驗室里還有其他的同學研究新浪微博,用的就是模擬登錄,可以用。不需要用新浪API,網頁版的介面更好用點。
通過抓取用戶的關注、粉絲,不斷循環抓取。
獲取賬號-模擬登陸-數據採集-清除操作記錄,不過驗證碼那塊得費點心,現在不同網站的驗證和反爬策略不一樣
爬蟲
樓主你好,請問我只能獲得創建薏米用的自己的帳號的那個taken,如何獲得其他人的,用的JAVA SDK,捉急,請指教
這種介面隨便一個用戶的認證都可以調用,不需要必須是本用戶。
推薦閱讀:
※關於Python IDE如何選擇?
※紅白機時代的fc遊戲卡帶是類似於u盤的存儲設備嗎?這種遊戲是用什麼語言寫的?
※希望自己做個機器人出來,應該對哪些專業知識有所了解?
※能否用函數與數組直接實現多個矩陣相乘?
※作為一個程序猿,馬克思的歷史唯物主義,唯物辯證法等馬克思哲學思想怎麼和寫代碼結合起來……?