也談知乎數據

也許是受了《知乎半年雜記:答疑以及思考》這篇文章的影響,

有小迷弟一直想做知乎「高級用戶」,

(那都是自定義的啊喂...)

他問我被關注1000的,在知乎是個什麼水平,

我保守的說,Top10%吧...

其實何止Top10%,

在2016年12月的時候,知乎上超過212個關注者的,只有五萬人,

大家也知道,2017年知乎用戶數就突破1億了,

五萬之於1億,其實是小於1‰的存在,

(當然了,2017年有極大的增長)

為了讓更多人了解一個概況,我做了一個統計,

這一切的前提都是因為知乎這方面的數據是真實的,

如果是別的網站機器人瞎搞瞎編數字,我統計它個鎚子...

(截至2016年12月,感謝 @路人甲 的數據,Neo4j是不可能去看的,一輩子都不會的 吧)

我首先按關注數統計了一下所有3萬以上的人,

當然我標註了一下年代,根據來知乎的早晚標記的,顏色越暖來的越早,

(當然了,這個首答時間也可能不準,有的人刪了,有的人匿了,大概看看好了)

第二個統計,是女號;只要性別自己寫的是女的,都算,

(我不保真,這個還需自己判定)

為啥統計女號呢,因為很多人想關注女神,

(其實是因為女號少點,好統計,男號太多了,一個屏幕放不下)

第三個統計,我按六類分別排序,它們是:

被贊同數、被收藏數、被感謝數、回答數、文章數、提問數,

這個數據也比較有意義。

以上就是全部數據了,至於如今的數據,我還沒看誰拿全過,

大概是數據量變大了?

以下是一些個人觀點。

  • 限流的問題。

從整體上來說,我認為在短時間尺度上,知乎的瀏覽量是一定的,分給這些人多,分給那些人的就少;但是本質而言,站內的瀏覽對個人比較重要,對官方並不重要;官方怎麼分配,那是運營的事情,他們需要做的是,從站外拉來瀏覽,從站外拉來用戶,那才是根本。

簡單說,蹭站內瀏覽數曝光數,那是在用在享受知乎的資源;能從站外拉來瀏覽拉來新用戶,那是對知乎的貢獻。

再簡單點說,有本事自己架網站去,怎麼曝光怎麼推全是自己的。

  • 內容的問題。

雖然知乎說是分享新的知識,很多人的情懷也是希望有高端高逼格,但是知乎做到極限也不可能有知網內容更全更專業,可是知網才幾個用戶幾個瀏覽數...

雖然我也寫過,

如何看待知乎中一些用戶靠爆照大量漲粉的現象?www.zhihu.com圖標

但其實我並不是反對用照片那些,賣肉賣字都是賣,

我真的真的是不覺得賣字的比賣肉的逼格更高,

我反對的只是「假」而已,

只要是真的照片真的人,我都滋磁,何樂不為呢,

別人怎麼做是別人的自由,想看就看不看就屏蔽,選擇權始終是在自己手上的,

限制別人有點太刻意了...

能做到一個全「真」的社區,不管是照片、文字、還是人,都是真的,那簡直太美好了...

現在的情況就是假貨太多,不管字還是圖,

這麼說吧,一碗粥里要是掉進幾顆老鼠屎,大家都還可以咬咬牙皺著眉頭喝下去,但是要是掉一坨牛糞下去,那必須沒得玩了...

我實在是不想看到別人這樣說:

哈?知乎啊?就是那個隨便幾個摳腳大漢*寶買幾個圖一貼、或者2分女濾鏡PS一上立馬就被tian成女神大V的地方啊?

我甚至做過精神股東,想知乎小管家在後台拿著身份證一個一個圖看,看到一個假照片假簡歷的就直接封永久...

可能還在成長階段,現階段可能還是做大?這些會降低社區質量的問題優先順序還沒到吧...

小館家已分類收藏:

硬貨······軟貨······飈車······觀點······其他


推薦閱讀:

百家號改版,還記得你的初心嗎?
Final cut很難嗎?1招教你快速剪出優秀短視頻,超簡單!
DeepMind 的新型神經網路DNC論文
互聯網心理學
為什麼互聯網行業的產品經理被黑的這麼慘?

TAG:知乎 | 互聯網 | 數據 |