你眼中的我
幾天前我在某群里問@OnlySwan:『四萬姐我想加入你的小黃群吼不吼吖?』
四萬姐義正詞嚴地拒絕了我:『小黃群只收非常非常牛逼的開發者』
作為一個小透明,我先去蹲牆角對了一會兒手指。不過對完之後,我開始思考一個問題:
如何衡量我在某人眼裡的認可程度?
這裡的某人可以換成任何你感興趣的人(請自由發揮)。然而,這個問題讓我想到了許多SNS上都有的一種信息,即『我關注的人中,有哪些人也關注他/她/(虵?)』。對於一個陌生的人,我們往往很難(也未必有這閑心)去仔細研究對方。但是如果通過原本我已經認可(關注)的人的信用背書,我就可以得到一個先驗——通過中間人的類型來估計對方的大致分類,通過中間人的牛逼度來估計對方的牛逼度。當然,這種估計一定是有偏差的,所以還需要後期接觸來負責校正。
那麼反過來同理:作為一個小透明,如果我知道『ta關注的人中,有哪些人也關注我』,那麼我大概也能估計出我在ta眼中的初步形象。至於知道這個信息之後要做什麼,這不是本文想討論的部分。問題是,大部分SNS(比如知乎)並不提供這個信息。怎麼辦?
老樣子,自己動手豐衣足食唄!跟上次一樣,我做了一個chrome擴展。安裝它之後,當你訪問他人知乎頁面時,將會多出一個按鈕,用來獲取你與這個用戶的『逆向交集』,例如:
如果你也有這個需要,歡迎訪問這個GitHub倉庫,或者直接按這裡下載。
=========以下是技術細節=========
為了提高抓取效率,在做這玩意兒的時候我自己寫了一個簡單的,帶並發上限控制的並行抓取類,有興趣的朋友可以看看代碼,請斧正。
感謝@grapeot鴨哥告訴我關於反爬蟲的信息!
20160421更新:改進了演算法,不需要抓取『我自己的關注者』了,性能大幅提升。感謝@Felix Qiu提供的思路!
(標題只是歌名啦)
推薦閱讀:
※左手用R右手Pyhon系列——趣直播課程抓取實戰
※當大家都在討論金剛狼3的時候,他們到底在說些什麼~
※爬蟲之常用的chrome技巧?
※拿諾貝爾獎可以長壽?——從爬蟲到簡單數據分析