標籤:

如何對待民科和他們的觀點?

今天看到這樣一個問題:如何在知乎上擁有 1000 以上名關注者?如大家所想,這個問題里有一大堆段子性質的答案。高票答案里出現的內容和我們平常在微信、微博或者別的具有娛樂性質的社交平台上看到的關於各種問題的說法並無本質區別(如果你不信,請添加三個金融相關的500人微信群,翻兩天你就知道我在說什麼了)。正好又看到大家群毆物理民科電荷哥,於是想把自己的一點看法借這個問題串一下寫出來。當然,我與這個問題里的答主們並沒什麼私人恩怨,只是借這個問題做個引子和例子而已。

「如何擁有1000個關注者」其實是一個技術上有一定難度的學術問題。為了說明它,我首先截兩頁手邊的slides。它來自於康奈爾的Resnick教授,描述了一個典型的Preferential attachment機制。我們關注這樣一個機制:一個新節點加入一個已經存在的網路時,怎樣產生新的邊。下述的preferential attachment機制是對真實機制的一種假說。

這個模型中,delta_{in},delta_{out}這兩個參數影響新的(有向)邊形成的概率。其中delta_{in}影響入度(被關注),delta_{out}影響出度(關注別人)。在原本的設定中,不隨時間變化,不存在個體差異,不受別的因素影響。如果我們假定它們和個體在某一時間段內的行為或偏好有關,但參數值和這些行為之間的關係是不隨時間變化的,那麼我們有:

delta_{in}=sum_{ain Actions}{w_a^{in}int_{-infty}}^{+infty}{sigma^{t-tau }1(a,tau)dtau}delta_{out}=delta(preference)

由於我們關注的是如何獲得關注的問題,那麼事實上我們更關心delta_{in}的結構。如果我們可以對各類行為做一個良好的定義,那麼無論是行為對新增關注者人數的邊際影響w^{in}_a,還是一個行為影響力的衰減因子sigma,理論上都可以通過知乎某一段時間的用戶數據估計出來。如果有了邊際影響(在此為參數)和衰減因子(同前),那麼開頭說的那個問題里的所有答案其實都可以frame成假設,拿來做假設檢驗了。假設的形式可以是「我將行為a(也可以是向量)持續時間T,我的入度(關注者)增量的期望為1000」之類的。

問題在於,從問題到估計出參數的過程非常難。我們把這個過程分成幾步看。改已有的模型是很容易的。我特地看了一下,我截的這個slides是我今年2月下載的。直到現在可能也就看過最多三回,絕不能說熟。然後我把原問題frame到改這個模型大概只花了去一次洗手間的時間。 但是定義清楚行為(更具體地說,是把知乎的答案和專欄文章做一個合理的分類)是比較麻煩的,拿到數據,處理數據和寫個程序計算估計量(這個數據如果有,會非常大)也很難。事實上如果可以把這幾步做完,是足以寫出一篇博士論文的。但是在這樣一篇論文真的寫出來之前,我們沒法對原問題中的任何一個答案做假設檢驗。我們能做的事情頂多是根據自己的經驗在評論區打打嘴炮。

現在我想請大家想一想,提出這些待檢驗的命題很耗腦力和時間嗎?

對於姿勢水平一般的人來說可能確實要耗點腦力和時間。如果這個人因為種種原因沒有機會接受較充分的教育,那麼提出假說來要繞的彎路可能更多,耗費的腦力和時間可能更大。極端情況就是沒讀過兩年書的民科經過十幾二十年苦心研究,提出一個小學自然課知識就足以發現錯誤的假說。儘管它的提出確實耗費了不小的時間成本,但是——用民科們喜歡的某主義的說法——折算成「無差別的人類勞動」,其實成本非常低。

既然每一個這樣的假說,提出來的成本不高,但驗證的成本很高。我們就不難理解這樣一個現象:在「思想的市場里」,存在大量難辨真偽的,但聽起來似乎有些道理的命題,但只有少數命題得到了實驗(自然科學)或者實證研究(社會科學)的驗證。

理解了現象還不算完。根據對這個現象的理解,我們應該有自己的應對策略,同時對credit的分配機制形成自己的看法。我的策略是,對於暫時未驗證但也無法輕易證偽的命題保持開放態度,但不參與這類命題的傳播,更不為這類命題背書。我對提出這類命題,但自己沒有花任何努力去驗證,在命題某一天得到驗證後出來邀功的人的看法是:這類人幾乎不值得任何credit。例如引力波哥郭某,例如我們的朋友圈裡時不時火一把的各類「民間大師」。

推薦閱讀:

TAG:科学 |