信息瀑布:論如何造謠

在一個街的拐角,如果有個人仰著頭不知再看什麼,你可能覺得他鼻子流血了或者在冥想,於是你沒有多想,走了。但是,如果你發現有十個人同時看著上面,你就會覺得上面絕壁有什麼事情發生了,停止了腳步並且開始仰頭往上看。如此以來,街上的仰頭的人越來越多,直到有個人說:「那有兩個人鼻子破了,所以這些人都以為上面有什麼東西」。

在知乎上,如果兩個質量差不多的答案,但第一個的票數比第二個多,那麼我們更有可能給第一個答案點贊,並且第一個答案吸引到越來越多的贊讓他在某一些時間段的贊數遠遠超過第二個的。當然,這個局勢可能會被一個跳出來實名反對的人扼制。

在2005年,YouTube網做了一個大型實驗:14341名志願者給48首歌進行1~5分的打分,結果表明,社交影響力(social influence)增加了一首歌熱門程度的不確定性。這個實驗和上述兩個例子其實揭示了一個非常簡單的道理:我們判斷會受到別人的判斷影響,即使我們不知道他們判斷的原因。

特別是在一個網路時代中的我們,我們每天身邊都存在許多這樣的充斥無數不可信的信息,如謠言,如一個不知道為什麼就突然很火的視頻,如Oba Gana Style,或者不知道為什麼火起來的人,如葉良辰。雖然每個人都有判能力,但是不可避免的是,一個網路上的信息可能利用了網路的社交影響力而誤導了我們的判斷。

我們可以用一個叫做信息瀑布(Information Cascade)的模型來描述在網路中產生的這種順序決策的現象。

考慮下面這個情形,有一個要麼是0要麼是1的隱藏信息c,有一個很多人的隊列,每個人有二進位私密信息X_i={0,1},並且都是獨立分布的,如果這個私密信息X_i=c,我們就說它是正確的,否則是錯誤的。並且X_i正確的概率都為Pr{X_i=c}=p>0.5

得到了各自的私密信息之後,每個人按照隊列順序寫下他們的猜測公開信息Y_i={0,1}在黑板上,然後離開。每個人可以看到之前的人寫的Y_i,但是並不知道別人的X_i,並且每個人是根據自己的所掌握的信息最大化自己的猜測的正確性。

那麼問題來了:

  1. 如果前面兩個人的猜測相同,那麼第3,第4到第n個人會怎麼宣布自己猜測?

  2. 很多人做出自己的猜測之後,後面的人的決定會有什麼樣的規律。

答案是:

  1. 全部都會宣布與前面兩個人相同的猜測。
  2. 當n足夠大的時候,所有人一定會給出同樣的猜測!

這個問題答案非常聽起來非常符合常識,但是用數學的語言論證起來並不容易:

如果你是第一個人,你該怎麼做?很簡單,X_1是1就寫1,是0就寫0,即Y_1leftarrow X_1,因為猜中的概率p超過0.5。

如果你是第二個人,你所掌握的信息有X_2Y_1,注意到第二個人是知道第一個人是做決策的,即Y_1=X_1,這個時候你要稍微考慮一下了,有以下兩種情形:

  • 如果Y_1=X_1=X_2,那很好辦,由於X_1X_2都是獨立分布的,那麼你猜他們有1-(1-p)^2>0.5的可能是正確的,跟著這兩個信息照做就是了,即Y_2leftarrow X_1=X_2
  • 如果Y_1=X_1
eq X_2,這個時候,無論你是猜X_1還是X_2,你都有0.5的可能性正確,所以你可以隨便選擇:扔一個硬幣,如果正面朝上,則Y_2leftarrow X_1;如果朝下,則Y_2leftarrow X_2

如果你是第三個人,那麼情況開始就有點複雜了,有三種情況:

  • 如果Y_1=Y_2=X_3,那麼皆大歡喜,顯然Y_3leftarrow X_3的正確率會高。這裡注意到,Y_1=X_1Y_2不一定等於X_2,不過即便是最壞的情況,有兩個相同的私密信號所對應的可能性依然是更大的。

  • 如果Y_1
eq Y_2,注意到在這個情況下,我們有Y_1=X_1Y_2=X_2,因此對於第三個人來說X_3是什麼就選擇什麼,因為X_3無論等於X_1還是X_2,它正確的可能性都更大,因此Y_3leftarrow X_3

  • 好了,最複雜的情況來了,如果Y_1=Y_2
eq X_3。為了方便表示,我們不失一般性地假設,Y_1=Y_2=1,X_3=0。那麼,在這組序列(Y_1=1,Y_2=1,X_3=0)選擇Y_3=1正確的概率為

P[1|(1,1,0)]=frac{P[1]P[(1,1,0)|1]}{P[(1,1,0)]}=frac{P[1]P[(1,1,0)|1]}{P[1]P[(1,1,0)|1]+P[0]P[(1,1,0)|0]}

其中P[1]=P[0]=0.5,因此

P[1|(1,1,0)]=frac{0.5(p^2(1-p)+0.5p(1-p)^2)}{0.5(p^2(1-p)+0.5p(1-p)^2)+0.5((1-p)^2p+0.5p(1-p)p^2)}=frac{1+p}{3}

因為p>0.5,所以

P[1|(1,1,0)]>0.5.

因此在Y_1=Y_2這種情況下,第三個人要放棄自己的私密信息而選擇相信前面兩個人,即Y_3leftarrow Y_1=Y_2,而如果Y_1
eq Y_2,那麼第三個人選擇相信自己Y_3leftarrow X_3

注意到

  • Y_1=Y_2的情況下,第三個人釋放的信號Y_3是沒有任何信息量的,因為在任何條件下,Y_3都等於Y_1Y_2。因此後面第四個人開始,所以人面臨的選擇都跟第三個人一毛一樣,並且都會選擇Y_i=Y_2=Y_1,這樣以來,信息瀑布就開始了。信息瀑布的產生,只需要兩個人。

  • Y_1
eq Y_2的情況下,後面所以人會自動忽略掉這兩個信號,因此你考慮把隊列前面兩個人移除然後把第三個人看成是一個新的隊列的第一個人,因此如果Y_3=Y_4, 那麼依然可能產生信息串列。如果Y_3
eq Y_4,同理,移除他們,把後面的人當成新的隊列的第一個人。

  • 可以計算第二個人之後沒有信息瀑布的概率是

Pr_{no}=Pr{Y_1
eq Y_2}=Pr{Y_1=1,Y_2=0|c=1}+Pr{Y_1=0,Y_2=0|c=1}=p(1-p)

並且產生錯誤和正確的信息瀑布的概率相同,為

Pr_{err}=Pr_{cor}=frac{1-p(1-p)}{2}

同理,第2n個人之後沒有產生信息瀑布的概率是

Pr_{no}=Pr{Y_1
eq Y_2, Y_3
eq Y_4,...,Y_{2n-1}
eq Y_{2n}}=(p(1-p))^n

這個數越來越小,當n
ightarrow inftyPr_{no}
ightarrow 0,因此信息瀑布總會發生

總結

  • 當有隊列前面兩個人宣布相同的猜測時候,第三個人會放棄自己的信息而選擇相信他們兩個。注意到產生這個原因並不是因為第三個和後面的人盲目跟風,而是因為在這個機制下信息傳達效率低。因此,理論上,傳遞再假的謠言只需要兩個群眾演員
  • 信息瀑布可能是錯誤的,而且錯誤的可能性很高。假設第一和第二個人公布信息相同,那麼第三個人之後的公布的信息沒有信息量,無法消除更多的不確定性。

舉個例子,如果你要賣一件這樣的東西:

防引力波圍裙護胎寶。你要做的就是申請兩個小號,並且在以最快時間分別進行下面這樣的評論:

哈哈哈哈,笑死我了,我只是隨便搜了一下淘寶,沒想到真的有。

對了補充一下,僅僅是理論上可能成功,實際上效果如果請各位自行實驗,出了事不要找我。╮(╯▽╰)╭

  • 那錯誤信息瀑布或者謠言怎麼終止?其實很簡單,只要有一個人不守規矩公布了自己的私密信息,就可以停止了。還記得皇帝的新衣的故事嗎?它就是一個很好的信息瀑布的例子,最後這個信息瀑布是怎麼結束的?一個小女孩「不懂事」,大聲地說出:「他其實什麼也沒穿吧。」這個效應也叫皇帝的新衣效應(Emperors New Clothes Effect)。
  • 最重要的是注意到我們這裡有一個很強的假設,每個人私密信息正確的概率都為相同的p,當然對於謠言來說,往往不是這樣。對於一個專家,他當然有足夠高的把握判斷是不是謠言,因此他的做決策的時候可以忽略掉別人釋放的公共信息,那信息瀑布也就更有可能朝正確的方向流動。

更多有趣的知識,可關注我的專欄或下面這個答案。

有哪些違背直覺的數學問題? - 張萌的回答

現身說法鏈接:

防護服孕婦防輻射服肚兜孕婦裝引力波圍裙通用弔帶四季護胎寶正品-tmall.com天貓

參考文獻:

[1] Bikhchandani, S., Hirshleifer, D., and Welch, I. (1992), "A Theory of Fads, Fashion, Custom, and Cultural Change as Informational Cascades," Journal of Political Economy, Volume 100, Issue 5, pp. pp. 992-1026.

[2] Schiller, R.J. (1995). "Conversation, Information and Herd Behavior". Rhetoric and Economic Behavior

[3] Friedkin, N.E. and Johnsen, E.C. (2011). Social Influence Network Theory: A Sociological Examination of Small Group Dynamics. Cambridge University Press.

[4] Information cascade


推薦閱讀:

如何評價快手等直播軟體的興起?
我們是如何完成這場名叫「社交齋戒」的牛掰實驗的?
Arxiv網路科學論文摘要16篇(2018-04-10)
為什麼阿嬌光棍節發照秀恩愛,卻被網友吐槽「太傻太天真」?
歐陽澤林:這52個套路送給想開啟職場個人品牌的你

TAG:數學 | 社交網路 | 信息 |