你眼中的我

這個東西本身並不難做,但每件事情的起頭總需要一個故事——

幾天前我在某群里問@OnlySwan:『四萬姐我想加入你的小黃群吼不吼吖?』

四萬姐義正詞嚴地拒絕了我:『小黃群只收非常非常牛逼的開發者』

作為一個小透明,我先去蹲牆角對了一會兒手指。不過對完之後,我開始思考一個問題:

如何衡量我在某人眼裡的認可程度?

這裡的某人可以換成任何你感興趣的人(請自由發揮)。然而,這個問題讓我想到了許多SNS上都有的一種信息,即『我關注的人中,有哪些人也關注他/她/(虵?)』。對於一個陌生的人,我們往往很難(也未必有這閑心)去仔細研究對方。但是如果通過原本我已經認可(關注)的人的信用背書,我就可以得到一個先驗——通過中間人的類型來估計對方的大致分類,通過中間人的牛逼度來估計對方的牛逼度。當然,這種估計一定是有偏差的,所以還需要後期接觸來負責校正。

那麼反過來同理:作為一個小透明,如果我知道『ta關注的人中,有哪些人也關注我』,那麼我大概也能估計出我在ta眼中的初步形象。至於知道這個信息之後要做什麼,這不是本文想討論的部分。問題是,大部分SNS(比如知乎)並不提供這個信息。怎麼辦?

老樣子,自己動手豐衣足食唄!跟上次一樣,我做了一個chrome擴展。安裝它之後,當你訪問他人知乎頁面時,將會多出一個按鈕,用來獲取你與這個用戶的『逆向交集』,例如:

如果你也有這個需要,歡迎訪問這個GitHub倉庫,或者直接按這裡下載。

=========以下是技術細節=========

為了提高抓取效率,在做這玩意兒的時候我自己寫了一個簡單的,帶並發上限控制的並行抓取類,有興趣的朋友可以看看代碼,請斧正。

感謝@grapeot鴨哥告訴我關於反爬蟲的信息!

20160421更新:改進了演算法,不需要抓取『我自己的關注者』了,性能大幅提升。感謝@Felix Qiu提供的思路!

(標題只是歌名啦)

推薦閱讀:

左手用R右手Pyhon系列——趣直播課程抓取實戰
當大家都在討論金剛狼3的時候,他們到底在說些什麼~
爬蟲之常用的chrome技巧?
拿諾貝爾獎可以長壽?——從爬蟲到簡單數據分析

TAG:知乎 | 网页爬虫 | 社交网络 |