造假泛濫的時代里 數據還有什麼意義?

最近開了公眾號 也在b站直播捏陶人 發現在閱讀量觀眾量的數據上水分特別大 幾乎比真實數據大出了幾倍 後來又看到了相關的報道 不論是視屏網站的瀏覽量還是報刊雜誌的發行量 都有很多造假的成分 既然數據的真實性被抹去了 數據本身已經沒有了參考價值 還有數據存在什麼意義呢 這種造假泛濫的源頭究竟是什麼 我們為什麼沒有勇氣面對真實的數據 讓數據發揮真正的作用


  • 對於追求效率的公民來說,統計思維總有一天會和讀寫能力一樣重要(Statistical thinking will one day be as necessary for efficient citizenship as the ability to read and write ) -- H.G. Wells (1866-1946)
  • 要用統計騙人很容易。但是不用統計,騙人更容易。-- Frederick Mosteller

--------引經據典與兜售私貨的分割線-----------

謝邀。造假的數據當然沒有意義,但這世界上還有真實的數據,不是嗎?

真實的數據仍然可以提供信息,幫助決策。這就要求人們具備一定的收集、整理、分析數據的能力,培養統計思維。這可以幫助你在數據(包括造假數據)泛濫的時代識別數據的價值,去偽存真,沙裡淘金。

另外,題主既然已經知道數據造假,為什麼不直接找數據提供方要求他們提供真實數據、改善數據質量呢?還有,二手數據如果有問題,自己能否動手去收集一手數據?或者找一個專業的、負責任的第三方提供數據?

至於數據造假的目的,閱讀量被摻了水分,以我小人之心度之,應當是與數據統計方利益相關——他們可以從中獲得更多好處(收更多的費用、凸顯自己的推廣努力或誇耀市場份額),這與財務上做假賬虛增利潤的動機差不多。

學一點統計學,不僅識字而且識數(據),成為一位有效率的公民,H.G. Wells所預言的那一天已經來到。

-----------------------

p.s. 關於識別數據質量的相關回答請參見:「數據會說謊」的真實例子有哪些? - niaocu 的回答


當然是用來騙人了,建議LZ搜索下《數據造假理論》

不光要像LS說的那樣「學一點統計學」,還要學學怎麼依照統計學的理論去包裝數據。


統計學就是不用管你說啥都能得出近似真相。只能直觀地照讀原始數據那是統計方法沒設計好。


衹要信息轉化成數字 就不可避免地有了顯性的數理邏輯 要不然你怎麼知道數據是假的呢 統計不僅能提供信息 還能幫助人辨別信息


(為了匿名)作為某壟,我單位底層數據都是編的,反正全計劃。 @昔風KDCL


因為造假往往是對外的。內部自家人還是用真數據在分析,只要數據分析關乎自身利益,內部自己造假就很少會發生。


推薦閱讀:

地圖炮是否有其合理之處?
SDN越來越成熟,會不會導致網路工程師不吃香?
常用存儲介質(硬碟、光碟、NAND Flash 等)在家用環境下數據能保存多長時間?
如何評價勒布朗詹姆斯季後賽Win Share超越邁克爾喬丹升至歷史第一位?
知道單精度和雙精度,有沒有3精度4精度5精度………………無限精度?

TAG:數據 | 社會 | 統計 |