李彥宏的洗腳店大數據論斷是否有問題?

前幾天,百度的李彥宏先生在一次發布會上提及他對「大數據」的理解。

李彥宏以「足療」舉例:做足療是否真的對健康有幫助,這個問題可以用大數據來解決,百度每天有 110 億次的定位請求,可以算出那些經常去足療店的人是不是更少去醫院。

然後他得到的結論呢?李彥宏說:

事實上,大數據得出的結論和我想像的差不多,喜歡去低端足療店的人是最健康的。如果你常去足療店可以讓你少去醫院,那麼是不是你的健康保險也更低一點?


得頸椎病比較快並且在情人節沒什麼消費的人群,通常都喜歡買衝鋒衣和機械鍵盤?


李彥宏對大數據的理解完全正確:只看相關,編一個推理,不管經不經得起推敲,就先公布。


相關不代表因果

這是大數據的魔咒,有興趣可以看一下周濤老師在大數據時代里的前言,我覺得說得很好,大概意思是追求因果性大於追求相關性不僅是為了防止倖存者偏差,更是人類智慧高於計算機的終極體現。是啊,只有人會問為什麼。

而且作為科研狗簡直被這條定律虐哭,每次解釋結果都會被說你過度解釋啦……啊啊啊


這充分說明低端洗腳店和高端洗腳店提供的內容和服務不同。


去低端足療店的相比較去高端足療店的人數本來就多,大部分人也不是天天往醫院跑,感覺舉這個例子就像是我的侄子對我說:我是個位數加減法數學家。


因為去低端足療的基本是年輕人啊!

沒錢去高端足療啊!

多數人是中年才有錢去高檔的啊!

年輕人比中年人毛病少很正常啊!

所以這就是所謂的大數據?


有關聯但不能說明因果關係。

這是數據處理的最大問題。

就如同我與樹苗一同長大,能說明我長大了是因為樹苗長大了嗎?


另一種答案是,很可能相反,去低端足療店的人 對於疾病的態度,可能是得過且過,因而得大病的概率更高;

去高端足療店的人,更注意自己的身體,所以有病就去醫院檢查,得大病的概率更低。

推論的缺陷在於 去醫院次數 以及身體健康程度 非 完全負相關;保險費用 和去醫院次數 非完全正相關

去醫院次數 正相關於 對疾病的重視程度 / 身體健康程度。

保險 正相關於 去醫院次數 * 單次消費

所以去低端的足療去醫院少,不保證更健康,更不能保證保險費低


其實只能證明去洗腳店100次的比50次的去的次數多

別的結論都是假的


去低端足療一般不去高端醫院;而是找個老軍醫或者低端醫院如甫田系。


監視用戶這種事,就不要自己報出來了…


實驗用具:蜘蛛一隻,剪刀一把

實驗步驟:一、把蜘蛛放在桌子上喊:「爬」  蜘蛛開始爬

實驗步驟:二、把蜘蛛的腿剪掉再喊:「爬」  蜘蛛不爬

實驗證明:蜘蛛的耳朵長在腿上。


去得動足療店的,一般身體還行。


低端足療店肯定是做足療,去高端足療店難道僅僅是做個足療? 逃...


很可能只是去找低端足療店的時候更有可能使用百度的位置服務,而去醫院的時候不會用,比如團購,地圖。


總去同一家足療總會膩味的,所以經常得換。而且去一個新城市就得馬上試一試。

然而醫院當然是挑最好的去,去過一次就知道在哪了,而且醫院也不像足療一樣總搬家啊。


分頁阅读: 1 2