嬰兒潮、棉花糖與ABM
嬰兒潮
現在國內正在經歷的是第四次嬰兒潮(第一次在建國後,第二次在三年自然災害後,第三次在86-91年),一個嬰兒潮肯定會導致下一個嬰兒潮,這個周期受目前在25-30年左右。同時,經濟水平的增長與女性教育水平的提高在一定程度上也稀釋了嬰兒潮,相信這個周期會不斷延長並最終消失。
我自己屬於第三次嬰兒潮,成長在一個不怎麼缺小夥伴的獨生子女政策下,過去的三十年一直都有一種感覺:人多。初中上一屆有8個班,到了我們這一屆成了12個班,隨之而來的是初中高中連續4-5年的瘋狂擴招,公立學校分裂出私立學校單獨運營,大學則從1999年就開啟了擴招的水龍頭。然而,當我上大學後就開始聽到小學校車頻繁出事的新聞,其實這也有嬰兒潮的影響。由於學生數量在我們那幾屆後銳減,很多小學直接開不下去了,特別在農村,原來每個村都有小學,人數減少後只能好幾個村合併辦學,但上學就成了問題,所以會出現裝很多人的不合規的校車,自然也就會有相關新聞。當我讀博士時,周邊聽到就是生孩子建檔麻煩,排不上隊,很正常,因為又到了我們這一代的生育年齡了。然後就是奶粉代購與母嬰用品的高峰期,到現在又鬧了一波學區房,想來也是這波人為人父母后懂得預先給孩子爭取資源了。如果我是個商人,只要關注我到這個年齡段自己缺什麼就去賣什麼就可以了,畢竟人多。
人口,從來都是一個了解世界最重要也最有預測能力的基數。1萬人的社區里是發展不出有規模的小眾興趣的,但1000萬人的城市你能看到各種規模化的活躍社團。地理上與出生時間上的聚集會衍生出各種前所未有的事件,也不能說前所未有,之前只有苗頭,聚集後才會湧現出新事物。而且你會發現在某樣興趣上同樣活躍的人年齡也差不多,不在嬰兒潮的想活躍起來的時代沒有提供足夠的人口基數讓他遇到有同樣興趣的人。最近幾年的用工荒、農村衰落與城市化進程背後也有人口因素,年輕人都進了城自然後代的生活環境更適應城市,而技術含量較低的工作所需要的青年勞動力卻在減少。而各種營銷概念忽悠的對象也是我這一代人為主,人多購買力大且現在也都有了一定的消費能力。這甚至都不僅僅是經濟現象,還造就了文化現象。就連文學影視作品炒的冷飯用的梗也是80、90年代回憶風格的,不是因為這代人的回憶更重要,而僅僅就是因為人多,不僅消費者多,生產者也多,新聞焦點跟著轉。很多不同年齡段的人則感受不到這種變化,由此產生的認知與行為偏差很難在代際間傳遞。
任何一個組織的年齡分布都隱含了大量的信息,特別是時代背景,正常人思維最容易忽略的就是時代背景。我們可以肆意點評大蕭條時代、民國與文革,但總是對自己時代背景隱含的偏見視而不見,這可能是很多悲劇的源泉。這個偏見通過地理位移也不能盡數發現,我也不知道答案,但看新消息時總會有個預設,那就是這背後一定有些偏見與其他的角度,這樣去想可以抵禦九成以上的概念忽悠。
棉花糖
斯坦福大學的棉花糖實驗常被用來作為說明自制力對成才的重要性,無數本暢銷書以此為案例大談特談成功經驗與育兒心法。因為我的同齡人大都處於這個階段,所以最近這個研究在我周圍的曝光度也很高,很多父母信誓旦旦說一定要提高自己孩子的自控力。這也是很多人對這類信息的處理方式,拋開論證過程,直擊結論並用這個結論指導生活。類似的結論有很多,例如相貌會給事業加分,經濟指標與口紅、裙擺的關係…這一類的研究結論其實也是一種棉花糖。
在看科學研究報道時要首先區別開兩種研究,一種是調查類研究,另一種是實驗類研究。從結論可信度來說後者比前者更可信,但前者是更準確的現狀描述。對於調查類研究,有意思的現象是亮點,但因為是調查類研究,通常研究人員並不干涉這個現象。但一定注意的是當結果被報道後,有些現象的根基會被報道所影響產生反饋。例如山東某地的胃癌發病率一直很高,研究人員調查後發現跟當地吃煎餅的習慣有關,因為當地人喜歡吃雜糧煎餅且一次烙好一大摞存放起來慢慢吃,此時在雜糧煎餅中某些雜糧成分並不適合長期保存,容易發酸而刺激胃,進而導致胃癌,經過報道後當地人改變飲食習慣發病率就降下來了。也就是說很多現象會隨著反饋消失或加劇,例如如果所有年輕女性都認為外貌會給事業加分,那麼美容業與化妝品廠商就會比較高興且樂於宣傳這些,反過來又加劇了這個現象。這個問題在各類暢銷書里尤其嚴重,很多觀察與調查類事實被當成不變的規律去論述,後果就是產生了一片佩戴「科學」有色眼鏡的求知者,心心念念的都是些社科結論。
實驗類研究通過良好的設計與數據分析而產生的結論可能更靠譜,但由於存在研究者偏見與p值歧視,這類結論要關注實驗過程與數據分析是否合理。我剛讀研的前半年每晚列印一篇論文帶回宿舍讀,初期關注的也是知識性的結論,畢竟我對學科領域不了解,到了後期就更關注結論得出的過程與論證方法了,也正是這個過程讓我意識到很多實驗性結論的得出是存在問題的,作者跟同行都能看出來,但外界就不一定看得出來了。而且新發表的結論相比學科教科書里的東西更不穩定,在關注時也是需要注意的。雖然我經常對不懂的新研究亂評論,但對於新發現結論本事更多的是觀望而不是馬上相信。例如關於癌症是壞運氣的研究當時感覺是作者玩了一個觀察性數據分析的花招,但這兩天作者最新的研究則提供了更多的證據,這個過程更符合科學對真相的探索,是持續性改進的。
很多科學報道或暢銷書都在越來越多的使用研究與數據來闡述道理,這點很好,但讀者應該也可以用一種科研的態度來對待結論並思考過程。不然這種結論棉花糖會讓很多人自認為已經掌握了真相與全貌,而事實上只是一個幻象。最好的方法就是在看到一個結論時去搜相反的意見與評論,這樣一個過程不能給你帶來確定性,但那又如何,世界本就不是確定的。
ABM
ABM,這個是Agent Based Model的簡稱,是一種研究工具,特別適合動態過程的模擬。現實社會存在一個問題,無論什麼樣的秘籍,大家都用的話也就不叫秘籍了。這就是反饋過程,做自然科學研究很少遇到這個問題,例如你發現某種魚的秘密洄遊路線也不能把論文給它的天敵看,看也看不懂。但跟人沾邊的社會科學研究就不一樣了,你哪怕瞎編一個結論都可能對特定人群的認知與行為產生影響,這個影響你用回歸分析就搞不定,因為這類行為不回歸,完全是反饋反饋再反饋,個體層次看不出規律。但ABM可以模擬這個過程,讓你在整體層面上去觀察一些現象。舉個例子,某城市出現了一個傳染病,因為剛出現,你知道的只有一個粗略的感染率與康復率及平均康復時間,此時你打算估算一個整體城市的康復時間(不考慮疫苗),此時就可以用ABM模擬這個動態過程。同理,也可以用在交通燈的設計上。
我一直認為在計算相對便宜的今天一味追求數據量來解決問題不如用這些計算資源去模擬複雜場景,你只要搞清楚你會怎麼選,然後設計一個空間用不斷反饋的動態過程來模擬一群人,最後關注整體指標就可以了。這個過程最需要的知識就是了解個體的行動決策的集合併建模,對於大多數個體行為給一個先驗或歷史概率賦值並不困難,這樣也就很容易對整體建模。模擬這一部分在國內大多數自然科學教材里基本都不怎麼講,但其實這是一個很好的啟發式學習方法。例如把污染物遷徙看成一個傳播過程,你可以很快用ABM估計出這類污染物在特定污染交互場景里能傳播多久,影響多大。現實問題的複雜性並不是幾個基本方程可以求解的,此時模擬一個非平衡群體過程可能讓你發現之前沒有注意到的東西。
結合年齡分布,理論傳播與ABM,你能否探索出一些新東西?又能否付諸實踐?應用中的知識才會發揮價值,要學會把實際問題抽象成同構模型。
君子不器。
推薦閱讀:
※為何有人認為技術能解決人口增長帶來的一切問題?
※開放二孩對工科院校屌絲男有多大影響?
※中國的人口增長與經濟發展之間存在什麼關係?
※相比於美法英,為什麼日本的生育率在二十世紀九十年代掉到 1.5 之後一直沒有回升?