怎麼藉助公開的互聯網數據分析一個綜藝節目的觀眾構成?

之前好像看到過有人比較《我是歌手》和《中國好聲音》的觀眾構成,如果作為一個普通人,沒有互聯網後台數據和一些付費資料庫,改怎樣通過公開數據來分析一個(綜藝)節目的觀眾構成?


自己挖的坑,自己填一下,感謝 @圖靈Don, @藿香正氣哥 的回答。

其實我也第一時間想到百度指數,但其實最好的數據還是微博和視頻網站的吧,太可惜,他們對數據用的還很不夠。

其實 @圖靈Don 已經給出我能回答的,只是我覺得單個看一個數據是不行的,只有在一個基準下橫向比較才比較有意義,所以我做了這個圖發上來:

數據來源就是百度指數里的受眾構成,周期是2014年。

年齡是加權的年齡,性別都是偏男性的,也許是因為男性使用搜索引擎多於女性,如果數據來源是視頻網站或者微博,也許就會好很多,性別和年齡差異對搜索行為的影響應該比較大。

所以橫向一比較就很明顯:《快本》偏少女,《爸爸去哪兒》比較性別比較中性,《我是歌手》和《中國好聲音》年齡層次接近,但是《好聲音》更偏男性(女學員更多的緣故?[思考狀])

這個數據源不是太好,我下禮拜有空去跑一下CSM的數據吧,看來說到底還是要靠專業的資料庫了。


這個是快樂大本營:

這個是中國好聲音:

這個是非誠勿擾:

這個是奔跑吧兄弟:

這個是爸爸去哪兒:

1)快本低齡化觀眾多;

2)都是男人看中國好聲音?

3)怎麼都是男人在看娛樂節目?


顯然百度指數不能代表真實觀眾結構。


據我所知,這些數據好像還沒有在互聯網上完全公開吧,即便是標註的公開大數據,也是媒體根據某些report改寫而來的。

有專門的數據調查公司做這個業務,你可以嘗試聯繫這些公司去購買,當然價格真的是不菲。

對你的評論的補充:

在定量研究中,如何獲取樣本是一門很大的學問。目前在國內比較常用的獲取樣本的方法無外乎:

電話採訪,發放紙質問卷,網路問卷,具體到每一種方式,聊起來都能寫一本書了。

你要想了解觀眾構成,這個命題實在是有點大。分析之前,你要考慮地域,觀看時間,觀看途徑等等等等各種變數對樣本採集的影響。

還有,你提到了想用公開的數據來做分析,我有點搞不懂您的研究目的是啥,基於他人的樣本(還不一定滿足你的研究條件)做分析。。。。。

老師說過,this is forbidden and you can"t do that.


推薦閱讀:

運營人必備的7大技能——數據分析能力是未來運營的分水嶺
哪些人能做好數據分析?
《精益數據分析》讀書筆記(中) | 商業模式+發展階段,決定你應跟蹤的指標
20170328《Python基礎教程》 第1章基礎知識學習總結

TAG:互聯網 | 數據分析 | 綜藝節目 | 互聯網數據分析 |