尊重原作者的知識版權,才能讓大家更有動力繼續工作
08-22
尊重原作者的知識版權,才能讓大家更有動力繼續工作
來自專欄 G-python數據分析7 人贊了文章
我很少關注男gay類的微信公眾號,這兩天突然有北京的朋友轉發給我看,說有些微信公眾號的blued用戶數據分析類的文章是我寫的嗎?比如淡藍的這篇文章。
我說,沒有,最近忙死啦。哪有時間啊!
我仔細看了這篇文章的數據,來源於我之前的文章
ShiningStar:中國主要城市的同志生存狀況分析4-屬性篇但是根本沒有標註任何數據來源於參考。具體點說:這篇文章的數據來源於我之前分析的這張圖表:
某同志社交app爬取分析得到的原始屬性分布情況。某同志app的北京、上海、廣州、深圳、成都、重慶、杭州等29個中國主要省會城市的總用戶數約為813349人。使用python爬蟲技術,總共爬取獲得29個中國主要省會城市的813349用戶信息。圖中,-1表示屬性未明的用戶。
知乎朋友(平均水平的gay)專門正對社交軟體上400個屬性為0.5和-1的用戶做了相關的問卷調查,結果如下圖所示,其中10%和30%的用戶人為自己偏1和0。
根據問卷調查結果,對數據中屬性為0.5和-1的用戶作二次處理分配,得到的用戶屬性分布情況如下:確實是0多1少,但是兩者比例幾乎一致,0:1的比例為1:0.97,這意味這1個屬性為"0"的用戶對應0.97個 屬性為"1"的用戶。下圖是二次修正後的用戶統計頻數情況:
我做這些數據分析本來就是希望我們自己能更好地了解我們自己這個群體,我也歡迎各個微信公眾號轉載與分享我的數據分析結果。但是希望這些微信公眾號做到兩點:
- 請認真閱讀我的文章,不要斷章取義,不要誤讀數據;
- 希望你們也不要只關注01屬性的分布情況,比起這些,我們更應該關注我們這個群體的數目與分布情況,這些才是我們gay以後發展所應該擔憂的:這麼大的群體以後這些人究竟會怎樣走過下半生,我們應該如何走過下半生?
- 麻煩你們尊重我的勞動成果。我花了大量的時間爬取數據,分析與可視化數據。希望你們再轉載的時候標註轉載來源!
我最近會分析兩個數據:1. 北上廣深的alo用戶數據,2.知乎上關於gay某些話題的文本。
謝謝!
推薦閱讀:
TAG:男同性戀 | 男男關係 | 同志雷達Gaydar |