李彥宏的洗腳店大數據論斷是否有問題?
01-23
前幾天,百度的李彥宏先生在一次發布會上提及他對「大數據」的理解。
李彥宏以「足療」舉例:做足療是否真的對健康有幫助,這個問題可以用大數據來解決,百度每天有 110 億次的定位請求,可以算出那些經常去足療店的人是不是更少去醫院。然後他得到的結論呢?李彥宏說:事實上,大數據得出的結論和我想像的差不多,喜歡去低端足療店的人是最健康的。如果你常去足療店可以讓你少去醫院,那麼是不是你的健康保險也更低一點?
得頸椎病比較快並且在情人節沒什麼消費的人群,通常都喜歡買衝鋒衣和機械鍵盤?
李彥宏對大數據的理解完全正確:只看相關,編一個推理,不管經不經得起推敲,就先公布。
相關不代表因果
這是大數據的魔咒,有興趣可以看一下周濤老師在大數據時代里的前言,我覺得說得很好,大概意思是追求因果性大於追求相關性不僅是為了防止倖存者偏差,更是人類智慧高於計算機的終極體現。是啊,只有人會問為什麼。
而且作為科研狗簡直被這條定律虐哭,每次解釋結果都會被說你過度解釋啦……啊啊啊這充分說明低端洗腳店和高端洗腳店提供的內容和服務不同。
去低端足療店的相比較去高端足療店的人數本來就多,大部分人也不是天天往醫院跑,感覺舉這個例子就像是我的侄子對我說:我是個位數加減法數學家。
因為去低端足療的基本是年輕人啊!
沒錢去高端足療啊!
多數人是中年才有錢去高檔的啊!
年輕人比中年人毛病少很正常啊!
所以這就是所謂的大數據?
有關聯但不能說明因果關係。這是數據處理的最大問題。就如同我與樹苗一同長大,能說明我長大了是因為樹苗長大了嗎?
另一種答案是,很可能相反,去低端足療店的人 對於疾病的態度,可能是得過且過,因而得大病的概率更高;
去高端足療店的人,更注意自己的身體,所以有病就去醫院檢查,得大病的概率更低。
推論的缺陷在於 去醫院次數 以及身體健康程度 非 完全負相關;保險費用 和去醫院次數 非完全正相關去醫院次數 正相關於 對疾病的重視程度 / 身體健康程度。保險 正相關於 去醫院次數 * 單次消費所以去低端的足療去醫院少,不保證更健康,更不能保證保險費低其實只能證明去洗腳店100次的比50次的去的次數多別的結論都是假的
去低端足療一般不去高端醫院;而是找個老軍醫或者低端醫院如甫田系。
監視用戶這種事,就不要自己報出來了…
實驗用具:蜘蛛一隻,剪刀一把 實驗步驟:一、把蜘蛛放在桌子上喊:「爬」 蜘蛛開始爬 實驗步驟:二、把蜘蛛的腿剪掉再喊:「爬」 蜘蛛不爬 實驗證明:蜘蛛的耳朵長在腿上。
去得動足療店的,一般身體還行。
低端足療店肯定是做足療,去高端足療店難道僅僅是做個足療? 逃...
很可能只是去找低端足療店的時候更有可能使用百度的位置服務,而去醫院的時候不會用,比如團購,地圖。
總去同一家足療總會膩味的,所以經常得換。而且去一個新城市就得馬上試一試。然而醫院當然是挑最好的去,去過一次就知道在哪了,而且醫院也不像足療一樣總搬家啊。
分頁阅读: 1 2