你知道智商是什麼嗎？

02-02

如果說有哪個心理學術語是被最廣泛地誤解的，我會投票給「智商」。

智商這個概念，在中國幾乎已經成了普通辭彙，但大多數人都沒有正確地理解什麼是智商，只是把它當作「聰明程度」的近義詞來使用。

在這篇文章中，我會通過一系列問題，來科學地解釋一下，什麼是智商。

心理學家為什麼要發明智商測驗？

在心理學家們發明「智商」這個理論術語之前，人們也有描述類似現象的日常辭彙，在漢語里，有「聰明」，「靈敏」，「天賦異稟」，「愚蠢」，「呆板」，「笨拙」等辭彙。

這些日常用語很模糊，沒有精確含義，無法具體形容一個人的聰明程度或者愚蠢程度。由於沒有量化的表達方式，所以心理學家們對此表示很不滿意。

心理學家想要發明一套標準化的智商測驗，用具體的數字來丈量一個人的聰明程度或愚蠢程度。

之所以叫做智商（intelligence quotient），是因為它是被除數除以除數所得的商。以前用的是心理年齡除以生理年齡再乘100，一個孩子的心理年齡是7歲，生理年齡是6歲，那麼智商就是117。

現在已經不再用這麼粗陋的演算法了，而是用正態分布來計算離差智商。定義一群同齡人的平均智商是100，標準差是15。68%的人的智商在85到115之間，95%的人的智商在70到130之間。智商145的人幾乎比99.9%的同齡人要高，智商55的人比99.9%的同齡人要低。

這樣的標準化智商測驗，成功發明出來了嗎？

不完美的智商測驗，100多年前就已經發明出來了，隨著100多年來的改進，今天已經有很多種大規模應用的標準化智商測驗。比如，斯坦福—比奈量表、韋氏智力測驗、瑞文智力測驗，等等。

完美的智商測驗，還沒有發明成功，而且很可能永遠也發明不成功。因為智力和身高不同，它本身無法客觀衡量，只能通過發明心理量表來估測。既然說是估測，那就必然會有誤差。

但也不一定，也許再過幾十年或者幾百年，隨著科學和技術的發展，人類可以通過某種神經測量手段，客觀地測量一個人的智力程度。當然，這種說法偏科幻，大家不要有什麼期望。

這種標準化的智商測驗有什麼用處？

可以用在科研上，應用範圍非常廣，就不多介紹了。

可以用在教育上，將不同智力的學生區分為不同的小組，進行分組教學，實現因材施教。

可以用在醫療上，為一些智力缺陷者（唐氏綜合症、笨丙酮尿症等等）進行輔助診斷。

可以用在軍隊中，將已有的智力太低的士兵開除，或者拒絕智力太低的士兵入伍，以免在前線戰鬥上誤傷友軍。

可以用在社交上，一些高智商俱樂部（門薩俱樂部、三九俱樂部等等）使用智商測試作為入會門檻，方便俱樂部成員進行社交。

可以用在社會工程上，一個國家的獨裁者可以強制實施優生學政策，將智力低下者進行絕育手術，以提高一國之國民的平均智力。這種方式的缺陷就是見效很慢（需要一兩代人的時間），測驗誤差的後果也很嚴重，而且違背當今的人道主義精神，會面臨國際上的嚴重批評。

可以用在公司招聘中，公司可以依據應聘者的智商分數，決定錄用或者不錄用，或者錄用後的崗位安排。我曾幫朋友做過阿里巴巴公司的校招筆試（在計算機上在線做，擋住攝像頭就行了），其中有部分題目是邏輯推理題，是智商測驗中的常用題目。

總之，只要用得好，那標準化的智商測驗，用處就很大。但難點就在於，智商測驗很難用好。

為什麼說智商測驗很難用好？

小明出生於2010年，2017年時是7歲，他花了50分鐘，做了一套40道題目的智商測驗，答對了34道題目。現在問，小明的智商是多少？

小強出生於1980年，2017年是37歲，他花了200分鐘，做了一套120道題目的智商測試，答對了82道題目。現在問，小強的智商是多少？

正確答案是，不知道。因為我們不知道應該拿什麼樣的一群人和小明與小強做對比。

假設小明是中國人，那麼理論上，我們可以用同樣的這套40道題目的智商測試，去找10萬個同樣是2010年出生的中國孩子，給他們也測量一下。如果這10萬個人的平均分數是34分，那麼這就說明小明的智商是100，也就是平均值。

如果這10萬個人的平均分是20分，而標準差是5分，那麼就說明小明的智力比平均值高出大約3個標準差，大概比98%的同齡人要高。

如果這10萬個人的平均分是20分，而標準差是1分，那麼內行人一眼就能看出這套測試設計得很爛，需要重新設計。小明的分數沒有任何意義，需要另外找一套智商測驗，重新測試。

那10萬個人的分數，就叫做常模。現在的實際情況是，大多數時候，我們沒有足夠好的常模。當初建立常模時，數據量可能不夠多。哪怕數據量足夠多，也可能有些過時，沒有2010年版本的，只有1950年版本的。

之所以如此，是因為建立足夠好的常模並且不斷更新，需要很多錢。測試題本身的修訂和完善，也需要很多錢。一般的組織和機構，都沒有這麼多錢。

網路上流行的智商測試，靠譜嗎？

智商測試是否可靠，除了信度和效度這種最基本的要求之外，關鍵就是看常模了。只有具備很強經濟實力的組織，才能夠建立並維持一個足夠好的常模。比如，韋氏智商測試和瑞文智商測試的版權，現在就是培生集團所有。培生是一個很有錢的全球化教育集團。

由於智商測試的常模通常是不公開的內部機密數據。互聯網上流行的那些測試，是拿不到已有的常模數據的，所以它們大多是不靠譜的。或許有例外，比如2015年，瑞文智商測驗的標準答案就曾經泄露到互聯網上，如果常模也泄露了，那麼一些網站就可以對測試分數進行準確的解讀了。

就我所知，目前在網路上沒有靠譜的免費的智商測試，如果有人知道，可以告訴我。

要在中國進行靠譜的智商測試，並非沒有可能。那些擁有智商測試版權的機構，會授權一些醫院、學校等組織，允許它們進行智商測試，把原始分數結果發回給公司總部，然後總部再參照常模給出解釋。所以，在中國可以找到一些有授權的醫院或其他組織。比如，中南大學湘雅醫院可以為幼兒和兒童進行智商測試。

普通人有必要主動做智商測試嗎？

通常情況下，沒有任何必要。智商分數和學校里的考試成績的相關係數，在0.5到0.7之間。也就是說，學校里的那些不同科目的考試，可以部分替代智商測試的功能，而且還是免費的。

假設你去正規組織，花了一些錢，做了一套智商測試，假設就是韋氏成人智商測試，得出了一個分數結果，假設就是120，那又能怎樣呢？這個120分不能讓你去更好的學校讀書，也不能讓你去更好的公司工作。這個分數的唯一用處就是讓你自我感覺良好而已。

麻煩在於，假設你的韋氏成人智商測試的分數，只有85分，那這個分數的唯一用處就是讓你自我感覺很糟糕，如此而已。

所以，對於絕大多數沒有智力障礙的普通人來說，沒有必要去主動做智商測試。從小到大，大家經歷了這麼多考試，在和同齡人的比較當中，對自己的智力水平，心中多少是有數的。

有什麼學習或訓練的方法，可以提高一個人的智商嗎？

作為測試分數的智商，是可以提高的。只要拿到一套智商測試題，反覆做很多次，就可以很熟練這套題目了。或者，讓得分高的人拿到題目給你講解一番，讓你也明白題目背後的邏輯原理。那麼等你正式測試的時候，分數就提高了。

但這種提高是沒有意義的，只是讓表面的智商分數好看一些，智力實際上沒有提高。

從雙生子研究來看，智商的變異可以50%到80%由遺傳變異來解釋。這意味著，在給定一個人健康成長的情況下，比如母親懷孕時不酗酒，兒童成長過程中沒有營養不良，可以接觸到足夠豐富的心理刺激，沒有受到嚴重的腦部外傷，等等。我們不可控制的遺傳因素其實很大程度上決定了我們的智力。任何後天的培養，都很難提高一個人的智力。

這個說法可能導致一個誤解，那就是讀書無用論。很多低學歷農村家長會誤以為供孩子們讀書沒有用處，但實際上讀書非常有用。接受義務教育或更高級的高中教育以及高等教育，就是接觸更豐富的心理刺激，這些雖然不是提升智商的方式，但它們是防止智力不充分發育的方式。所以，某種意義上說，唯一可靠的提升智商的方式，就是不要讓孩子輟學。

有一個很反直覺的研究結論，很多人都會以為，隨著兒童長大成人，影響智商變異的環境因素應該越來越大，遺傳因素應該越來越小，但實際結果恰好相反。成年人的智力，比起兒童的智力，其遺傳影響更大。這是為什麼呢？

很可能是因為高智力者更可能去追求有著更豐富心理刺激的環境，從而鍛煉自己的智力。這意味著環境對於智力的提升，其實也有不小的作用。但人們很難利用起這個作用，因為一個人選擇什麼樣的環境，很大程度上也受到了智力的影響。

不同的人群，智商會有什麼差異嗎？

從地域來看，智商測試分數的結果，東亞人最高，歐美人居中，非洲人最低。不過原因倒不是東亞人智力最高，而可能是東亞人最熟悉紙筆考試，非洲人最不熟悉這種考試。

從社會經濟地位來看，有錢人比窮人的智商要高，背後的原因很複雜。可能是一個人智力更高，能完成更有難度的工作，所以有更高的收入，能給孩子提供更好的教育。而不是反過來，一個人只要更有錢，就可以有更高的智力。一個中了巨額彩票的人，會突然變得更有錢，但智力不會突然變高。

從學歷來看，高學歷者比低學歷者智商要高，不過這很符合常識，我也不多解釋了。不過，不要把統計意義上的相關理解錯，這句話不是說任意高學歷者的智商會比任意低學歷者的智商高，而是說隨機選取100位高學歷者的平均智商會比隨機選出的100位低學歷者的平均智商要高。

從性別來看，目前沒有發現男性和女性的顯著差異。通常也認為男性和女性之間沒有智力差異。如果得出有差異的結論，那就是政治不正確，也不大可能發表。

從族裔來看，美國的黑人會比美國的白人的智商要低一些，不過這不大可能是由遺傳因素導致，更可能是教育因素導致的。美國黑人往往社會經濟地位更低一些，對教育的投入也沒有白人那麼大。

從年齡上來看，由於現有的離差智商是以某一個體和他的同齡人進行對比，所以不同年齡人的智商分數的比較沒有意義。但從智力來看，一般認為成年人的智力比兒童高，而老年人比自己年輕時可能會有一定程度的認知能力的降低。這些結論都是常識。

如果從歷史發展的角度來看，還有一個很有趣的現象，叫做弗林效應。它描述的是人類的智商測試分數大概每10年就提高了3點。換句話說，讓100年前的人做今天的智商測試，他們的平均分數就只有70。而一般低於70，就會被認為是弱智患者了。

為什麼會出現弗林效應呢？

最可能的原因，不是人類的智力在這100年的時間裡提高了30點，而是用來測量智力的智商量表的設計問題。

實際上，已有的智商量表並不能直接測量g因素，它只能測量s因素。最常用的s因素，就是抽象邏輯推理能力。換句話說，我們實際上是在通過測量一個人的抽象邏輯推理能力，來推測一個人的一般認知能力。

所以，這100年來，人類的智力可能沒有多少提高，但抽象邏輯推理能力大大提高了。

為什麼人類的抽象邏輯推理能力大大提高了呢？

這主要是因為教育普及導致的。以前，接受教育是貴族的特權。而今天，義務教育強制所有孩子都要去上學，接受高等教育的人也越來越多。在這些教育中，無論是數學、語文、物理、化學、生物還是什麼科目，都在強調抽象的邏輯推理能力。

換句話說，是科學教育的普及，導致了弗林效應的出現。

哪些心理學家為智商測驗的發展做出了巨大的貢獻？

非常多，我只列舉最先出現在我腦海中的三位：

達爾文的表弟，高爾頓（Francis Galton，1822—1911）是我想到的第一個。他可以看作心理測量學之父。他曾試圖發明標準化的智商測驗，但沒有成功。失敗的原因之一，就是他想要通過測量顱骨大小來判斷智力高低，事後發現這種方式很不靠譜。但高爾頓對智力的定量測量的嘗試，是很有價值的。

第一套真正有用的智商測驗，法國心理學家比奈（Alfred Binet，1857—1911）發明的。法國1882年就在全國範圍推進了免費的義務教育制度，孩子們必須去學校上學。隨之而來出現了一個問題，有些孩子在學習上總是跟不上別的孩子，所以學校就想著把這群孩子們集中到一起，進行特殊的強化教育。1905年，比奈和他的同事們試圖通過測量孩子們的語言能力來判斷他們的智力高低，事後發現這種方式還算靠譜。在比奈發明這套智商測試之前，學校里判斷學生是否需要特殊強化教育，都是靠教師的主觀判斷，誤差很大。

英國心理學家斯皮爾曼（Charles Spearman，1863—1945）做出很多理論上和數學上的貢獻。他區分了g因素和s因素。s因素就是某種具體的能力，比如記憶能力、語言能力、空間想像能力、數學計算能力、邏輯推理能力、問題解決能力、學習能力等等。g因素現在又叫一般認知能力，是很多智商測驗試圖測量的因素。換句話說，g因素（g factor）、一般認知能力（general cognitive ability）、智商（IQ）這三個詞，幾乎是同義詞。

關於智商，還有什麼值得強調的信息嗎？

還有不少，但一篇文章的篇幅有限，我沒有辦法面面俱到。

我沒有詳細介紹不同的智力理論，而這其實很值得詳細介紹。

還有很多重要的問題也沒有提到。比如，智力和理性程度有什麼關係？智力和創造力有什麼關係？智力和體育運動能力有什麼關係？智力和工作績效有什麼關係？情商是什麼東西？等等。

以後有空，再補充這些內容

歡迎關注微信公眾號：認真想

致力於普及批判性思維與通識教育

認真想小助手微信號：Reason-A