新年伊始,關注滿萬

------------只想看圖表的可以直接拉到分割線以下^_^

在2016年知乎回顧這個小遊戲上,看到自己的註冊時間是2014年6月份,不由得感到有些驚訝,原來我註冊兩年多了?這樣看來,在知乎上的第一個回答是註冊的兩年之後,也就是今年的6月24日,英國脫歐的第二天,我也在搜索脫歐的影響,就被引導進了知乎的答案,有感而發也寫了一個,至今收穫了一個贊,還曾經一度被摺疊…… 而正經的在知乎上寫專欄,是從2016年10月底開始的。

當時知乎剛剛開放專欄寫作,我感覺可能和博客比較像,於是就申請了一下,準備慢慢的把平日散落在電腦里一些讀後感、心得和歷史雜文搬運過來。就寫博客的經驗而言,這些內容基本是寫給自己看的——我博客裡面每天幾十個人的訪問量全靠的是編程類、Linux安裝與管理、軟體技巧這一類博文在撐著,經濟和歷史類的雜文基本是在湊數。這倒不是說我計算機水平多麼好,而是因為程序員這個群體相對比較喜歡遇事直接問Google,而大家又總容易踩到同一些坑。

所以開始的時候,覺得知乎上的贊和關注可能也跟自己無關,不僅僅是第一次答題寫了一個長答案結果0贊還被摺疊,更因為根據十年來的經驗,我這種「去個人化」風格很強烈的寫作方式不太適應時代的發展。現在似乎擅長抒發自己感受和情緒,並且能夠成功引起「共情」的作品更受關注。之前無論是在人人網、微博還是朋友圈——總之凡是最初需要通過社交網路或者熟人互動產生蝴蝶效應的平台,基本上我寫的類似的文字都是寫了,放著,偶爾有個贊的節奏。

就這麼在知乎專欄發了四五篇,到第五篇經濟解釋:LGBT的平權運動和女權運動 突然間這篇文章開始有人點贊了,知乎的小鈴鐺不停的彈出紅點,最終這篇文章收穫了1500+個贊,數百個關注,算是在知乎的「第一桶金」吧,因為這篇文章,連帶著之前寫張天師和禰衡的文章也收穫了幾百個贊。還要感謝@石狩川風的私信提醒,說在知乎的遊戲規則一般是先回答問題,等有了一定關注數之後開專欄深入討論,而不是上來裸發專欄,然後每篇文章貼幾個標籤不管了。

於是我開始試著在知乎上回答問題,其中經濟學的比重最大。回答和專欄的也漸漸分了側重點:對於回答,一般就是要直接回復題主的問題,用題主所要求的框架/理論來解釋現象,或者直接就是通過某個社會熱點問題來簡單的說說學界的相關模型;而對於專欄文章而言,則是儘可能的把頂級雜誌上的論文模型,用簡單明確的文字描述出來,並最好給出一兩個應用的例子。在這個問題上,我和@Manolo 的觀點比較接近——經濟學很讓人遺憾的地方就在於,很多有趣的論點甚至腦洞往往就隱藏在了複雜的數學這個核桃殼裡面,無法被更廣泛的人群所接觸和認識,所以如果多砸開幾個核桃殼,總是會有一些正面效果的。

後來了解了知乎的機制,被關注者點贊是會出現在關注者的時間線上的,並且贊的多少類似於Page Rank:在一個領域下答題的贊越多,自己的贊的權重越大。之後對點贊這個事情也多了一份慎重,因為我認為關注首先是一種信任,給了被關注者在關注者的時間線上發布信息的機會,我不想辜負這個信任,讓無意義的信息去佔據關注者的時間線。在知乎的體制下,只給自己認為好的,有價值的答案點贊,給不好的或者惡意的答案點反對和沒有幫助本身就是一種引導輿論的方式。我曾經看到不少人說「知乎不是以前的知乎了」,我不知道「以前的知乎」是什麼樣子的,所以自己也無法比較。但是我想如果社區的成員能夠在點贊之前,在自己點贊的愉悅感之外,也想想自己這個贊按下之後所產生的外部性,社區的總福利會提高的^_^

在贊數和關注提高的同時,也很高興得認識了這三個區一些挺聊得來的知友,有些知友一度刷新了我對學習的某個特定階段的刻板印象,委實讓人讚歎。到現在為止,共回答了106個問題,約六萬多字。六十五天,一萬個關注,一萬七千贊,比不上情感區和生活區的速度,但是作為一個十數年來習慣於自寫自讀的人,我感覺到了知乎社區滿滿的善意和熱情,非常感謝社區平台和關注者們的支持,我會繼續堅持寫有意義的回答和專欄來回饋社區的。

我在自己的伺服器上寫了幾個腳本,定時抓數據存進MySQL,沒有蘇莉安那樣做成一個izhihu伺服器的野望,純粹是好奇。下面是我自己的關注和贊數的趨勢圖:

中間有一個有意思的瞬間:謎之躍遷。

12月23日,中國時間上午11點半。不知道發生了什麼事情,但是在關注曲線圖和贊數曲線圖上,很明顯的看到在短短2個小時的樣子,兩者均增加了1000左右,贊數主要集中在紙幣有沒有可能完全消失? - 司馬懿的回答 - 知乎這個回答上面。看到這個圖,我開始的反應是以為有超級大V來點贊了,但是後來調用zhihu的API把所有一萬關注者以上的點贊人的時間都列了出來,發現都對不上號,依然沒有頭緒。到如今,我還是不能找到一個可以信服的解釋,為什麼會出現這種躍遷,只能說是信息通過時間線傳遞到一定時候出現的一次偶然的指數性爆發。

可惜因為在起初寫腳本的時候考慮不周,沒有分開搜集單個答案和文章的數據,所以很多變數不好控制。準備不久之後增加數據的細分程度,然後過段時間就可以進行回歸分析或者統計檢驗來驗證一些猜想了——目前只能根據描述性統計來推測,所以只是猜想:

H1a:知乎日報對贊數的增加沒有顯著效果,而知乎精選對贊數增加的調節作用顯著的。

H1b:知乎精選對關注者的增加沒有顯著效果,而知乎日報對關注者增加的調節作用顯著。

圖片是同一篇文章先後加入日報和精選當天的截圖,日報在11點處,精選在13點處:

可能很大程度上是因為日報自成體系,有自己的APP,贊和評論區的緣故,而知乎精選則是相當於短時間內增加了暴光率。在我的圖表數據里,入選日報前後,贊數的斜率保持穩定,但是精選則明顯發生了斜率上的變化。但是日報對於關注者的增加可能是有顯著作用的,因為有好幾天,我都出現了新增關注者>新增贊數的情況,除了日報這個變數之外,我想不到任何其他的解釋了。

H2:中國上下班的時間對贊數和關注數並沒有顯著的影響。

這個從圖上也很容易看出來,因為全圖不容易觀察,我隨機截取了三天的數據,只有睡覺時間1:00AM to 7:00 AM期間的斜率明顯放緩:

PS: 按照@霧雨魔理沙的建議,具體某個帖子的點贊可以抽象為一個多次的二項分布實驗,所以在一個較短的時間內,可以看作一個sigmod函數,那麼聯繫到social network的一些理論,我覺得甚至可以建立一個模型來進行structural estimation了,然後還能做counterfactual analysis分析一些有趣的情況,比如跨界答題的期望贊數等等……


推薦閱讀:

你估計秦始皇陵中有可能最驚人的秘密是什麼?
活到現在,你覺得腦洞最大的是什麼東西?

TAG:关注量 | 猜想 | 数据 |