心理學裡的智力和性格測量有得到普遍的認同嗎？它們是否科學？心理學方面有沒有其它得到較廣泛認同的測量方法？

11-26

心理學裡的智力和性格測量有得到普遍的認同嗎？
　　我將「普遍認同」理解成「學術和應用領域得到大多數人的接受」，而沒有將一般公眾的熟悉程度放進去；因為應用領域（即各種職業場所如商業公司招聘、教育、醫院）的專業人士了解，而公眾不了解的東西太多了
　　這樣的話這個問題我的答案是：智力測量有（起碼在美國、西歐），性格測量沒有

智力測量：韋氏智力測驗（Wechsler Intelligence Scale for Children和Wechsler Adult Intelligence Scale）
　　呃其實這個我沒什麼好說的，點進去上面的中英文鏈接看介紹就好，這是在學術和應用（主要是醫院）領域都得到廣泛應用的工具。應用領域主要是用於輔助診斷，例如對兒童發育遲滯的診斷

性格測量：學術——五大性格特質(Big Five)量表，應用——MBTI
　　街上隨便找10個人，9個不知道什麼是Big Five。找10個社會心理學教授，你要是和TA提人格測量用MBTI，9個會和你說別想跟著TA做研究
　　Big Five是維度型的人格理論，即認為人格可以由以下5個維度上的不同表現組合而成：經驗開放性、盡責性、外向性與內向性、親和性、神經質，每個人在每個維度上的得分是連續的。這個經由因素分析（Factor analysis）得出的理論模型在學術領域被認為是實證的，基本上大多數和人格相關的研究都會用這套理論下的量表作為工具
　　MBTI是類型型的人格理論，即認為人格可以由4個方面不同的兩極傾向而組成16種人格類型。「學術派的心理學家常批評MBTI理論缺乏可靠的數據支持……但它在教育培訓、企業員工招聘及領袖訓練及個人發展等領域均有廣泛的應用」。另外這個測驗公眾的熟悉程度也很高，而且很愛用，標籤比較好貼，容易找到共同話題

它們是否科學？
　　還是那句話，要看你覺得什麼是「科學」。如果你覺得遵循實證主義，經過實證研究檢驗的就是科學的，那韋氏智力測驗和Big Five是科學的，MBTI是不科學的。至於你問為什麼「不科學」的MBTI這麼多人用，我也不知道，不是還有很多其他東西是這樣嗎

心理學方面有沒有其它得到較廣泛認同的測量方法？——GRE
　　如果要說心理測量，那就不僅僅是量表那麼簡單了，量表只是心理測量的其中一種方式。廣義的心理測量不僅包括以心理測驗為工具的測量，也包括用觀察法、訪談法、問卷法、實驗法、心理物理法等方法進行的測量
　　如果從歷史的角度來看，投射測驗曾經在一段時期內是得到廣泛認同的，不過現在不是被唾棄就是只能作為標準化測試的補充。如果要說臨床上，明尼蘇達多項人格問卷（MMPI）也算是應用廣泛的量表，這份量表能比較好地區分正常群體和臨床群體，公眾不知道很正常，不過精神科醫生和臨床心理學工作者肯定知道。不過我想稍微詳細講的，是GRE (考試)
　　可能不少人會驚訝，GRE和心理測量有毛關係，這條毛其實挺大的；至少在兩個挺基礎的方面：計分方式和測驗中題目難度的變化
　　參加過GRE考試的人都知道，每個分數都會對應一個百分位數，例如verbal里160分對應84%，而quantative里160分對應78%。為什麼同一個分數對應的百分數不同，因為常模的不同。GRE分數之所以會被高校接受作為錄取的考慮因素之一，是因為它是一個標準化考試；標準化測試的其中一個特點是在正式應用之前，需要建立常模——即由一個能夠代表總體的樣本在這個測試上的得分的集合/分布。實際上你參加完一次GRE，得到一個分數，你就被放在常模之中和其他人比較，比較的結果就是百分位數，即你比常模中的多少人得分要高。GRE之所以被接受，是因為它被認為能夠對報名者進行直接的對比，即使兩個人參加的是不同時間、不同地點的GRE。這裡面提到的常模、標準化考試，都是心理測量理論下的產物
　　題目難度的變化。每次GRE除去一開始的writing，後面是5個部分，3 verbal+2 quantative或3 quantative +2 verbal，相互錯開。起碼在2011年改革之後的電腦測試中，後一個部分的難度是會依據測試參與者前一個相應部分的得分來進行調整的。例如你在第1個verbal得分很高，那麼第2個verbal的難度就會比前一個更高；如果第1個得分低，那麼第2個難度就會降低。這還牽涉到如何計分。這是心理測量當中的項目反應理論的應用。這個理論目前雖然不新，但是相對於經典測驗理論來說還有很多需要研究的地方；未來有可能可以做到根據前一題的結果來調整後一題難度的水準
　　至於GRE測量的是什麼，有人說測的是「GRE考試技巧」

迄今為止，心理學的智力和性格測驗類的發展已經到了比較成熟的階段，在西方世界能被學界以及業界的大部分人認可。有研究顯示，智力測驗的結果和後期事業成就正相關（這是我們普通心理學課上老師上課講的結論，PKU的課堂應該還算靠譜，沒有再去查文獻）。霍蘭德職業測試，MBTI這樣的東西，在正規公司HR，職業諮詢師，加深自我認知的培訓中都是比較重要的參考結果。從科學的角度說，這些測試（一些成熟且常用的測試）具有比較高的信度和效度。
需要注意的是，仍然存在一些公認的問題：

智力測驗：
1. 對於智力的定義不具有其他文化適用性。智力測驗來源於西方社會，對於智力的標準參考西方教育和社會的環境，例如數學，字詞記憶，圖形推理。這些也許在大部分國家是可以接受的，但是對於一些更加原始或者邊緣的社會，他們並不具備字詞或數學能力，其社會要求也不認為這些就代表高智力。因此，不管是智力測試內容，還是智力對於事業成功的預測性，都不再適用。
2. 智力常模各個國家並不相同。與上一點略有交叉。智力的計算是絕對需要給基於年齡的。而不同國家的年齡常模並不相同。一個中國7歲兒童的智力不能拿來和美國7歲兒童相比，因為兩者的教育系統很不一樣。中國兒童的數學能力可能遠遠高於美國兒童，但並不能說並智力就高。
3. 智力定義的局限性。從最早的圖形，字詞，記憶，數學等測驗，到後來的晶體和流體智力。心理測量專家一直致力於擴種智力測試的內容，因為我們的智力--代表我們的腦能力，難以用有限而具體的科目來計算。這也導致了智力測試並不具備100%的效度。
4. 智力測驗的預測性有限。小時了了，大未必佳。發展這種事情，單憑智力測試真的很難做到。尤其是在兒童期的時候。

性格測驗：
1. 社會讚許性。在自陳式的性格測試中，答題的人對於一些問題會偏向把自己往好的方面描述。在一些問卷中，為了避免這種現象，會正著反著問幾次，或者換一些其他的問法（比如第一人稱換成第三人稱），統計被試是否態度統一。
2. 內隱態度和外顯態度的差別。自陳式測試測量的都是外顯態度。因此，被試潛意識的信念，性格並不能被測試。而潛意識的作用在人的性格中並不容小覷。
3. 理想自我和實際自我的差別。被試會傾向於把自己填成自己想成為的樣子，而不是真正的樣子。
4. 重大事件的影響。可以讓人短時間內性格發生巨大變化。
基於以上特點，一些投射型測驗比較具有優勢。例如羅夏墨跡測驗，其效度在心理測量中和MMPI名列榜首。羅夏測試這種投射型測驗中，你根本不知道在測什麼，所以以上前三點被試無法有意識的去防備，只能給出比較真實的反應。

總的來說，其實一些成熟的測驗都比較科學，它們的效度和信度都經過了常年累月，以及大量數據的驗證，並且具有較高的預測性。可以放心使用。

至於其他的比較好的測量方法，不知道你指的是什麼。智力測驗比較常用的有斯坦福-比奈智力量表和韋克斯勒智力量表（智力測驗我不是特別懂）。性格測試比較好的，霍蘭德，MMPI，羅夏墨跡測驗，主題統覺測驗等。對於兒童的治療中，也常用沙盤遊戲來觀察兒童的心理狀態。智力測驗我不了解，性格測驗中，效度能達到70%以上，其實就非常不容易了。

在我上羅夏墨跡測驗課程時，老師提到過大公司里比較靠譜的測驗方法。需要羅夏墨跡測驗+數次心理諮詢+自陳式量表。三者結合起來，其中有諮詢師的親身觀察，交流，讓被試無法迴避的投射測驗和自陳式量表，加起來才能得一個非常靠譜的結果。

希望我的回答對你有所幫助！
人格測試中MBTI的效度並不突出，應該是明尼蘇達人格測試（MMPI），感謝知友 @Andy Lee 指正。
（沒有翻書，憑對以前學過的知識的回憶答的，如果不對的地方請大家指正！）

謝瑤
如果要問這類測量背後的理論作用是否站得住腳，參考個性心理對智力的發展作用
簡單回答一下表面的問題
1、普遍認同的差不多是進了圈內但還處於學習進修階段的學生和業內工作者為主，學界不是沒有對各種量表和測量方法的不同意見，這好像一個環形山，圈外人基本不接觸，聽說了也是一知半解只能用信和不信來形容，環形山上的更容易接納這些工具且更容易依賴這些工具，圈內谷底的又有一些專業性強的變革者不斷質疑和改進工具的性能，所以又不那麼當回事了
2、科學在這裡作形容詞，科學的說應該是有多科學，科學到什麼程度，我只能說，比康德寫的}高加索地區的人怎麼怎麼什麼個性，南方熱帶的人怎麼怎麼什麼個性「的言論要科學得多，要知道康德是個死宅沒出過遠門，道聽途說也能把人按地域說一通了，在當時可能是比另一些傢伙靠譜，相信以後會更科學
3、這我就舉不出例子了，畢竟以我所接觸到的各類心理類測試來說，作用面都很窄，不是不能說明問題，而是說明的問題基本沒啥大用，一旦要說大了就會給人以塔羅牌算命之感

如果我們要設計一個靠譜的測試來衡量人的一些類型和能力，勢必要具有預測性。比如開一個考試，根據考試得分，可以預測考生們在某方面一段時間內的行為模式。再具體些，弄個花心指數，可以確定測試者在三五年內的性伴侶數量範圍。謝天謝地，目前的科技水平還沒能開發出如此imba的測試，所以目前任何批量的讀心術都是胡扯（大多是群體暗示，讓你這麼想而非知道你這麼想，和心靈魔術同理）。也正因為此，以選拔人才作為一考定終身的理由是靠不住的，實際的理由首先是篩濾門檻
其實現代社會分工如此繁多，人力資源對這種測試的需求是非常迫切的，可沒有一個測試能穩定的被商業性選拔所接納，反而是選秀這種作秀式選拔越來越普遍，可見靜態測試心理或智能有多麼困難了。相比之下，互動性的開發似乎更實用和簡單，如今大量的動物行為學研究都不是建立在給動物做測試來衡量其靜態功能上，而是開發一些遊戲項目教動物去學習。過去是想知道動物有多聰明，現在更關注動物能不能更聰明點，以此來發掘動物行為的發展性可能。在這一背景下，越來越多的動物個體被訓練得可以聽懂人話，出現無法用6歲兒童這種模糊說法去鄙視的智能。而在這個過程中我們看到，個性發展模式和智能發展過程是同步一致的（心理其實是腦理啊），而要3歲看到老，勢必也是用一個動態發展過程去總結行為規律，進而預測日後的行為可能
按照這個發展趨勢，靜態測試的確是建設性先天不足啊，為了研究而分解量化智力性格的速度還跟不上智力性格發展的速度，而任何一個單一的量化數據即便是有效的，也很難決定綜合系統的狀態，就好像我們用四則運算100道題的結果很難確定一個人的高考數學成績有多少一樣。所以如今的統計報告表達起來更加保守了：某某人群在某某情況下表現出更多優勢，而非男生數學好這種一刀切
按照如此實用的標準，目前關係到腦部活動規律的測試都還處於實驗探索階段，要找個能讓需求方滿意的一錘定音的心理測試是不太可能的，遠不如了解你的人對你的主觀預測和評價

在教育學領域，美國三十年前非常熱門的智力測驗預測未來成就的做法，已經被拋棄。近年教育領域的評估越來越傾向於成就測試而非智力測試，方式更強調信息來源多渠道而非一考定音。智力測試的問題在於智力這個概念太抽象。雖然證明智力測驗與未來成就有關聯的研究很多，但也有研究揭示智力測驗不能預測任何未來發展。何況一個人的人生成就和幸福不是僅靠智力就能保障的。

個人愚見：
心理學中的智力、人格等測試都是經過嚴謹的設計和驗證，所以它是科學的產物。但有個問題，現在大部分的心理學都是從國外傳進來的，而使心理學中國化又需要走一條很長很長的路。看一個心理測試準不準確要考慮很多很多因素：信度、效度、常模、文化、種族等等等等。不要過分迷信心理測量的結果，它僅僅是拿來參考的，就好比高考的分數一樣，你能確定一次高考就把一個人的能力全部測試準確？人是活的，測試是死的，有可能你剛經歷一場大變故那麼結果可能就會偏向負向評價。現在很多曾經公認有效地測量量表都是上個世紀的產物，中國常模的編製又趨於滯後，題目和常模都急需更新換代。所以，以平常心對待心理測試，還是有一定的參考價值的，畢竟統計學是允許誤差存在的~

智商測量方法的演變

以前的測量方法

1912年，心理學家威廉·斯特恩（Willian Stern）寫了一本書，提出了一種測量智力的方法：假如一個10歲的孩子，能做出通常13歲孩子才能做出來的測試題，那麼這個孩子的智力水平可以用他的智力年齡和實際年齡的商來表示，也就是13/10 = 1.3。為了使用方便，再把這個數字乘上100以便去掉小數點兒，就變成了智商130。所以，在最早的時候，智商180的意思大概就是說：「這個孩子小學2年級（10歲）就會做高中1年級（18歲）的題了」。所以，智商180確實是個天才。

標準差法

上面這種測量方法的問題在於，它只能用在孩子身上。所以，現代的智商測量使用標準差法。具體來說，就是設定所有人的智商是一個以100為平均數、15為標準差的正態分布。如果你沒學過統計學，或不記得「正態分布」是什麼也沒關係。基本上這個計算方法的意思是，智商100是完完全全的普通智商，正好在平均線上，大約70%的人智商在85-115這個區間內。而智商130比平均值高出2個標準差，差不多就是「你的智商打敗了97%的其他人類」的意思了。你看，智商130已經相當高了哦。假如你所在的公司有100人，那麼理論上只有不到3個人智商可以達到130以上。所以，如果你在微博上看到一大堆同事或同學秀「我的智商133」「我的智商140」之類的，那麼他們用的測驗一定不準。當然，如果你在貝爾實驗室工作或者在MIT（麻省理工學院）上大學則另當別論啦。

雖然現在的智商不是一個「商」了，不過「智商」這個詞聽起來酷酷的有沒有？有一種特別數學化、特別精確的感覺，所以大家也就接著管它叫智商。同時也產生了「情商」「逆商」「財商」等一些與「商」沒什麼關係的跟風新詞。

其實智力這個概念本身我覺得就不合理，你所說的標準化測試只能作為一個參考，標準化測試會受到種族，社會文化背景，性別，年齡等等因素影像。對一個人的某一素質進行準確的評定不是一張表格就可以明了的，要花很多的時間，以及精力。

側面回答一下問題。使用心理學量表得到的數據或者結果很重要，但是更重要的是能否正確使用量表以及如何分析所得到的結果。
分析量表結果需要具備一定專業知識。懂得製作該量表的原理，知道該量表的優勢和劣勢，知道該量表的評估重點是什麼。
我想題主關心是否認同、是否科學是在關心心理測量的可靠程度。這些測量說到底是工具，製造工具的是人，使用工具的也是人。工具起的的是輔助作用，可以提高效率。有時候不藉助工具也可以達成目的，就像有人聲稱自己看人很准，也許這樣的人就不需要藉助量表這樣的工具去認識一個人。所以起關鍵作用的還是使用量表的人。

作為一點補充吧，沒有正面回答問題。

自從上了一節cognitive assessment的課，給同學administer過WAIS-IV，我就再也沒那麼相信了……然而智力測試的確受到普遍認同，據統計，美國的clinical psychologist平均每周都要花幾天來做cognitive assessment。只要因為很多病需要用這些測試作為參考，一些天才項目也需要這些數字進行收生參考。至於科不科學，這種說法本來就挺泛的……只能說最流行的那幾個測試，WAIS-IV, WISC-IV， STANFORD BINET-V, WIAT等，是有數據做支撐的。

心理學裡的智力和性格測量有得到普遍的認同嗎？
把這個問題拆成這樣的問題：心理學裡的智力與性格測量哪個階段哪個方法在什麼時候在什麼領域得到什麼樣的認同？
智力在遠古時代認為是一維的靜態的概念，所以才有比奈等各種智商量表。現代智力理論認為智力是分層的、多維的、流動的，因此遠古時代的什麼比奈什麼的測量方法，現在看來，是不科學的，是有很大局限的。現代的智力理論，認為智力分成很多維度，從不同的角度，包括歸納性思維、發散性思維、形象思維、形式思維、記憶力等等，但是一般認為歸納性思維與智商的相關性最高，所以目前較常用歸納性思維測試方法，包括形式邏輯、圖形推理等等。這些被廣泛認可和使用，用在各種考試中。
而性格則複雜得多。從最早的四種氣質理論，到MBTI等等，由於性格是隱形的，一般通過刺激-反應的形式表達，所以各種性格理論形形色色莫辯真偽。直到卡特爾和艾森克採用科學方法研究人格理論開始，性格測試才科學起來，在卡特爾和艾森克之前，性格測試和算命在信效度方面差不了多少，包括流行的MBTI等等。在此基礎上，16PF和艾森克的EPQ，以及採用類似方法的性格測量比如霍蘭德等是科學的，也是被廣泛認可是使用的。
還有一些測量方法被廣泛認可，但是是大眾認可，非學術界認可的。包括：
星象，被廣大女同胞認可，信效度基本為0。
MBTI，這個被廣泛使用的多項人格測試其實屬於偽科學。
九型人格，在某些圈子較為流行，但是屬於偽科學。
PDP、DISC和OPQ，在某些圈子較為流行，但是缺少公開研究資料，在學術界不被承認。

以上不被學術界承認但是卻被人民大眾廣泛認可的測量方法都有一個共同的特點：分型。
也就是把人分成不同的類型。這符合人類的貼標籤的嗜好。但是在學術上貼標籤是個非常危險的動作。貼標籤是忽略了人的性格的複雜性。所以，絕大多數分型測試，都是不科學的，但是悲哀的是，卻又廣受歡迎。

感覺情商測試/心理測試純扯淡。推理和計算能力（智商）測試對高中年齡以下人群純扯淡。最起碼公務員測試和職業傾向測試里都有大量的推理和計算題目已經說明這玩意的需求還是很明確的。

沒有想到，心理學專業的常識能成一個問題。咱們專業真的好不努力啊，這麼多年了還會有人問這種問題。。。。一朝回到中世紀（誇張）的感覺。

相對來說，比較客觀，還有不完善的地方。但把感性的人用理性的數據表述出來，已經是很多的進步了。我最近在考心理諮詢師，自己的一點感受。

我也是學心理的那些很經典的由於太多問題沒有什麼耐心做但是我有幾個很喜歡的心理小測驗為什麼呢因為我覺得很准。它問的是你本人很平常的一些方面但是每個人做任何事情都只有一套比較穩定的決策方式所以你的答案基本就反應出你在某些個人重大事情上的態度當然你要知道環境的複雜性內部外部主管客觀歷史現在心理測試只能反應你在這個緯度的比較準確的一個結果就比如你過去發生的問題涉及到心理它可以給你分析的比較完整但是未來的變數太多測一下現在是什麼樣以後可以更好的調整自己就夠了

首先，心理學是科學。所謂的性格測試，具有一定的依據。這種測試嚴格來說，屬於娛樂心理學。當然，某些企業招聘人才做的測試也沒想得到什麼準確答案。只是大概了解。沒有人聽說過做了一項測試而不關心任何其他問題就錄用的企業機構吧。就算有，這種企業可想而知。

請參閱2007年考研英語閱讀理解Text 2

智力測試是否必有呢？就好像一個遊戲的初始屬性，哪怕你知道了智力值，體力值，根骨悟性什麼的，也無法確定許多事。幸運值是隱藏的啊~嗯。。。還有魅力，雖然現在這是一眼就能看出來的。
只是覺得，最近上火了