論文解讀：從烏合之眾到群體智慧的一步之遙

06-07

來自專欄複雜性科學

導語

除了人工智慧，人類的群體智能也是一塊未充分挖掘的寶藏。特別是隨著互聯網的發展，每個人類個體的意見都更加容易收集。我們應如何聚合每個人類個體意見成為了一個極其重要的具有現實意義的問題。

群體與個體相比，是更聰明還是更愚蠢？古語中既有「三個臭皮匠，頂個諸葛亮」，也有「三人成虎」。發表於英國皇家學會 Journal of the Royal Society Interface 的最新文章顯示，要想避免集體愚蠢、提升群體智慧，需要掌握估計偏差和社會影響規律。本文是對這項研究的詳細解讀。

論文題目：
Counteracting estimation bias and social influence to improve the wisdom of crowds
論文原文：

http://rsif.royalsocietypublishing.org/content/15/141/20180130

將多個非專家意見整合為集體估值，在許多情況下可以提高預估的準確度。然而，個體估計偏差和個體間信息共享這兩種錯誤來源也可能會削弱群體的智慧。

首先，文章研究了現有的聚合方法（如算術平均值或中位數），平均數往往會高估真實值，而中位數往往會低估真實值。通過量化估計偏差，將個體偏差映射到集體偏差，幫助設計並且驗證三種新的聚合方法，有效地削弱集體估計的誤差。

此外，研究者進一步實驗，量化個人估計與社會信息結合時的社會影響規律。發現，修正的均值準確度較少受社會影響，無論存不存在社會影響，對不同數量任務和獲取平均社會信息的方法，它所提供的估值都高度準確。因此，掌握估計偏差和社會影響的規律是提高群體的智慧的途徑。

1.研究背景與目的

1.1 群體的智慧：匯總個體估計，提高集體估計的準確性

在線社交平台的流行使得民眾對政治選舉、政府決策或金融市場等多種主題的意見得以表達並迅速傳播。其中，非專業人士貢獻了大部分意見，因此可能普遍認為他們的估計可能預測準確度較低。然而，經驗表明，聚合這些非專業看法，通過取估計集合的算術平均值或中位數，所得到的「集體」估計通常是高度精確的。除人類外，動物實驗也得到了類似的結果。這表明，匯總不同個體的估計是提高估計準確性的良策，甚至在不同語境、對不同物種亦有效。

圖片來源：The economist

1.2 理論與方法的界限①: 個體估計偏差

大數定律為「群體的智慧」提供了理論支持：如果個人的估測誤差具有無偏性，且以真實值為中心，那麼平均多人的估計將越發接近真實值。然而，個體決策往往做不到理論假設中的無偏差。

為提高集體估計的準確性，已經提出了許多聚合方法，如幾何平均，算術平均值和中位數和修剪均值（修剪估計分布的尾部，然後算術平均值由截斷分布計算）。雖然這些方法在某些情況下能夠提高準確度，但未解決集體偏差的根本原因（即個體估計誤差）。因此，我們不能將其推廣到其他領域，也無法繼續優化它們以逼近真實值。

1.3 理論與方法的局限②：信息共享帶來的社會影響

許多群體的智慧的模型認為觀點獨立於環境，但現實中，個體間往往會分享信息從而互相影響，因此他們的估值一定程度上相關。由於個體對社會信息的反應規律不同，社會影響不僅會使得估計值的分布更加集中，還可能讓估計值的分布產生左偏或者右偏。例如，有著極端觀念的個體如果固執己見，集體估計則傾向於轉向這些意見。簡而言之，即使孤立的個體估計不存在誤差，社會影響也可能導致估計偏差的產生。

因此，量化個體估計和社會信息對集體估計的影響，對於優化群體的智慧、探索其邊界至關重要。這有助於發現現有的最準確的聚合方法，還可以幫助設計可以削弱誤差的新方法，最終能夠比已有的方法具有更高的準確性和穩健性。

信息共享&amp;amp;quot;摧毀&amp;amp;quot;群體智慧。圖片來源:The Euronext Amsterdam floor (Perpetualtourist2000).

2.實驗與發現

2.1 實驗(一)：量化估計偏差

2.1.1 實驗方案

在第一個實驗，研究者收集了5個新的數據集，並分析了文獻中的8個現有數據集。研究者採用了著名集體智慧任務，糖果罐數量估計問題，即孤立個體（不考慮社會影響）估算一個罐子中的物品數目（如圖1a所示），用以研究個體估計誤差。新的數據集中，估計對象數量J和參與者人數n分別為：54（n= 36），139（n = 51），659（n = 602），5897（n = 69）和27852（n = 54）。

如圖1b所示，圖1b的估計直方圖（灰色柱）非常接近對數正態分布（黑色實線）。μ（算術平均值）和σ（標準差）這兩個描述對數正態分布的參數，均與罐內物體數量的對數呈線性關係（圖1c和圖1d）。

圖1.數量對估計分布的影響。實線：最大似然估計；陰影區域：95％置信區間。

2.1.2 現有聚合方法的誤差：算術平均數，中位數

如圖2a所示，由於對數正態分布具有長尾效應（圖1b），誇大了平均值，算術平均值請相互高估實際數量；中位數傾向於低估真實值，表明大多數人低估了真實的數字，與其他研究的結論相符。平均值和中位數的高估和低估程度大致相同，未發現這兩種聚合方法的一致性差異（圖2b）。

此外，根據該模型的預測，如果物體數量過小（非實驗測試範圍），參與者會同時高估均值和中位數，有較大的相對誤差。因此，該模型僅適用於本實驗測試的範圍，應避免泛用結論。

圖2.（a）算術平均值和中位數與實際物體數量相比和（b）二者的相對誤差。實線表示最大似然值；陰影區域表示95％置信區間；實心圓圈表示來自五個數據集的經驗值。

2.1.3 設計並測試新的聚合方法：削弱估計偏差

修正的平均值與中位數：

對於對數正態分布，平均值的期望值是：?

?中位數的期望值是：?

如圖1c、d所示，我們從估計偏差的經驗測量得出了最佳擬合關係：?

?和?

作者將前兩個方程中的μ和σ替換為最佳擬合關係，然後求解J，這是對真實價值的「修正」估計。

由此，可以計算出「校正」的算術平均值：

和「更正」的中位數：

該方法同樣適用於其他的估計任務，估計分布和估計偏差。

最大似然:

不像修正的平均值或修正的中位數，最大似然方法將估計值的全集用於計算新的集體估計。再次調用圖1c、d得出的最佳擬合關係，這意味著，對於一個給定的物體實際數目J，預期它將服從對數正態分布並且參數分別為：

和

因此，根據J計算各關聯對數正態分布產生給定估計集合的可能性，使可能性最大的數就是真實值的集體估計值。

2.1.4 聚合方法的影響因素①：訓練樣本規模

如圖3a，新的聚合方法均優於舊有方法，減少了58-78％的錯誤。比較三種新方法，最大似然方法表現最佳，其次是修正的均值，而修正的中位數整體精度最低。

隨著訓練數據集大小的增加，準確度有了很大的提高（圖3b）。就實驗所得樣本而言，需達到200個樣本，新的聚合方法才能得到較高的準確度。

圖3.聚合方法的整體相對表現。圖3(a)中藍色代表大於50％，即表格行所示方法較優，紅色代表小於50％，即表格列所示方法較優。

2.1.5 聚合方法的影響因素②：測試數據集的規模，誤差容限

接下來研究了測試數據集的規模對準確性的影響。文中「誤差容限」定義為聚合方法的最大可接受誤差，並根據每種方法達到給定容限的概率（容忍概率）繪製圖表。如果測試數據集規模相對較大，則三個新的聚合方法優於五個標準方法（圖4b，c）。然而，當估計對象數量大且測試數據集樣本數量相對較小時，聚合方法的相對準確性取決於誤差容限，可能存在著標準方法優於新方法的情況。

圖4.測試數據集大小和容錯級別如何影響聚合方法的相對準確性。聚合方法表現出相對誤差（定義為|X - J|/ J，其中X是聚合方法值）的概率小於給定的容錯度。N為測試數據集規模，物體數量J = 22 026（ln（J）= 10）。

2.2 實驗(二)：量化社會影響的規律

2.2.1 實驗方案

然後，研究者選定物體數量為659的數據集，控制社會信息以探究個體在估算任務中遵循的社會影響規律。作者量化了各種聚合方法的準確性，並設計了新的聚合方法來削弱個體偏見和社會因素的影響，從而提高集體估計的準確性。

首先，參與者獨立做出初始估值G1。接下來，參與者收到與其估計存在一定差異的「社會」信息S，並得知他們這是前面N位參與者的平均估計值（N為社群規模）。其中，一半參與者會隨機收到G1 /2到G 1區間的社會信息（服從G1 /2到G 1區間的均勻分布），而另一半則會從G1至2G1中抽取（服從G1至2G1區間的均勻分布）。然後，參與者可以修改它們的初始猜測，做出第二次估計G 2。通過人工控制社會信息，探究社群規模、社會信息與初始估值的差率（簡稱社會差異）對個體估計的影響。

研究發現,部分參與者沒有受社會信息的影響。因此，首先，研究者使用貝葉斯統計方法邏輯回歸模型，擬合了參與者改變初始估值的概率。主要考察了社會差異（定義為（S

G1）/G1）、社會距離（社會差異的絕對值）和社群規模這三個因素。其次，對於那些改變估值的參與者，進一步分析改變估值的程度（第二次估計與第一次估計的差距）。社會影響強度定義為a，參與者再次估值的對數ln(G2)則為社會信息S的對數和初始估值的對數的加權平均（ln(G2) = a*ln(S) +(1 - a)ln(G1)）。其中a = 0時，說明個體完全沒有受到社會信息的影響；而當a = 1時，個體和社會信息完全一致。

2.2.2 社會影響規律：社會置換，社群規模

一方面，如圖5c，我們發現社會信息越小於初始估值，社會影響權重越小，即當社會差異為負時，社會影響權重與社會差異為正比。但當社會差異為正時，社會差異對社會影響權重影響不大。另一方面，如圖5d，社會影響權重隨著社群規模擴大而增加。

圖5.社會影響規則。實線：預測的平均值; 陰影面積：95％可信區間;圈：（a-b）的分組數據的均值和（c-d）的原始數據

2.2.3 社會影響與聚合方法：估值分布，聚合方法的準確度

分享信息會改變獨立估計的對數正態分布，特別是，由於新的聚合方法參數化是基於未受社會影響的個體獨立估計，當個體彼此共享信息時，準確度可能會降低。

儘管最大似然估計方法在沒有社會影響的情況下通常表現最好（圖3），然而這一指標極易受到社會影響，尤其在對象數量較大時（圖6）。相比之下，受社會影響時，與幾何平均數和算術平均數相比，修正的平均值在不同的物體數量任務中都非常穩健（圖6）；沒有社會影響時，修正的平均值與最大似然方法具有幾乎相同的準確度。

圖6.社會影響下聚合方法的穩健性。

（a-c）與幾何平均數對比；（d-f）與算術平均數對比。淺灰色圓圈：不受社會影響；深灰色圓圈：受社會影響。對於數量為ln（J）=
4（a，d），ln（J）= 7（b，e）和ln（J）= 10（c，f）。圓圈表示1000次重複中的平均相對誤差; 誤差條圖是標準錯誤的兩倍。

3.結論與推廣

3.1 文章要點：誤差來源、聚合方法與群體智慧

雖然群體的智慧已經在許多人類和非人類的情境中被證明，但其準確性的局限仍然沒有得到足夠的研究。本文中，通過分析兩個主要誤差來源，個人（估計偏差）和社會（信息共享），探究了群體的智慧如何、為什麼以及何時可能失效。文章揭示了一些常用平均估值指標的局限性，並介紹了三種新方法，通過更好地理解這些錯誤來源，提高群體的智慧。

3.2 結論推廣：從數量估計到一般的估計任務

除了從數量估計任務得到的結論和建議之外，這些方法也可以應用於各種其他估計任務。個體估計偏差和社會影響是無處不在的，估計任務可歸到容易受到類似偏差或社會規則影響的大類中。例如，許多估計任務可能呈對數正態分布，而其他可能呈正態分布。事實上，有證據表明，削弱估計偏差可能提高以下領域的估計準確度：概率，城市人口，電影的票房回報和工程失敗率。

3.3 社會影響規律與社會置換：與自身估值的差異，估計對象的數量級

此外，我們根據經驗歸納的社會影響規律與一般社會影響模型相似，但未考慮社會差異的影響。這種非對稱效應表明，相比低於自身估值的社會信息，個體會更受高於自身估值的社會信息影響。觀察到變化係數隨對象數量增加而增長，這可能表明一個人對自己估計的信心隨著對象數量增加而下降，也許導致了社會差異的不對稱效應。在其他估計領域，個體估計的置信水平與估計任務的數量級有類似的關係。結合社會距離的較弱負面影響，令人聯想到「有限信心」觀點的動態模型，個體傾向於重視與自身觀點相似的社會信息。

圖片來源:iStock

通過量化分析個體估計偏差和社會信息共享帶來的集體偏見，新的聚合方法可以削弱這種偏差，在匯總觀點時可能會產生顯著的改進。這也可以應用於其他領域。

3.4 其他方法：「隱藏的專家」

其他方法也已被用於提高群體智慧的準確性。一種策略是尋找「隱藏的專家」，提高他們意見的權重。雖然這種方法在某些情況下有效，但在實驗數據中沒有找到存在隱藏專家的證據。對比忽視和使用社會信息的兩類人群，他們估計值的分布沒有顯著差異（p = 0.938，用Welch的t-檢驗對數轉換後的估計值），而且算術平均值、中位數和三種新的聚合方法在這兩個群體當中都未顯示出更高的準確度。此外，搜索隱藏的專家需要關於個人的額外信息（例如使用社會信息的傾向，過去的表現或對於自己估值的置信水平）。文章中的方法不需要任何關於每個人的附加信息，只需要關於總體人口統計趨勢的信息（且可能只需較少的樣本就能充分參數化這些趨勢）。

3.5 聚合方法的改進與展望：模擬個體影響和社會網路，一般化計算置信區間

這三種新方法也存在進一步改進的可能。當潛在的社會網路已知，或個體的權力/影響力存在差異時，模擬這些網路的社會影響規則可能促進對個體估值與集體估值的關係的理解。另外，聚合方法可以直接一般化計算置信區間，生成的估計範圍以一定概率包括真實值。為了提高置信區間的準確性，我們在本文中也證明了樣本大小等其他特徵的重要性。

圖片來源:iStock

總之，削弱估計偏差和社會影響可能是提高群體智慧的簡單、普遍、高效的一種策略。

作者：楊清怡
審校：張洪、李周園

◆ ◆ ◆

搜索公眾號：集智俱樂部

加入「沒有圍牆的研究所」

http://weixin.qq.com/r/NDsxKXDEti3JrTRK924m (二維碼自動識別)

http://campus.swarma.org?src=2 (二維碼自動識別)

論文解讀：從烏合之眾到群體智慧的一步之遙

導語

1.研究背景與目的

2.實驗與發現

3.結論與推廣

推薦閱讀

◆ ◆ ◆