思維的研究方法概論

09-15

思維的研究方法概論

思維。早在1911年，桑代克就研究了貓在問題解決過程中的嘗試錯誤學習，而後，格式塔學派的苛勒又研究了猩猩的思維頓悟現象。（桑代克的貓，苛勒的猩猩）

一、思維的研究方法。早期的嘗試錯誤說和頓悟說沿用的主要方法是行為測量，所遵循的事實上是行為主義的研究思路。此後，言語報告聯通行為測量儀器成為兩大主要的研究工具。隨著認知心理學研究模式的不斷深入，一種著力於整合實驗結果以探討思維的內部心理機制與表徵的研究方法——建構認知模型——也應運而生。

（一）行為測量。行為測量是指研究者通過對被試外顯行為的觀察或運用各種指標對被試的外顯行為的評估來獲得思維過程數據的方法。觀察數據和行為指標之間並沒有截然的分隔，兩者主要的區別在於：採用觀察數據的實驗，往往不對因變數作明確規定，而是籠統的對被試行為作觀察；而採用行為指標，則需要在實驗設計中規定某些因變數指標，並針對他們進行觀察記錄。

（1）觀察數據。桑代克的嘗試錯誤說：關在迷箱中的貓在嘗試錯誤後逃出，且之後犯的錯誤越來越少，即將問題解決的過程看成是一種聯想學習的過程，帶有漸進的性質。1913-1917苛勒以猩猩進行了一系列的頓悟實驗。

（2）行為指標。醞釀實驗和類比實驗為例。波斯納（1973）描述了一項醞釀實驗。實驗要求解決一個環鏈的問題。實驗操縱的一個自變數是醞釀期的長短，即解決問題的兩段時間中的延時，在這裡「醞釀」被理解為問題解決之前所從事的與問題無關的事，但卻對最終的問題解決產生影響的過程。實驗有兩個行為指標：一個是被試解決問題的百分率，另一個是解決問題所花費的時間。波斯納根據結果推測，醞釀期的長短直接影響了問題解決的效果。另一個例子是沃森和約翰遜-萊爾德（1972）所進行的選擇作業實驗，或稱四卡片問題。沃森和約翰遜-萊爾德認為被試擅長從正面驗證某一規則，而不習慣於從反面來證偽規則。（波斯納的醞釀實驗揭示了醞釀期的長短對最終的問題解決產生影響。沃森和約翰遜-萊爾德的思卡片問題揭示了人類不習慣從反面來證偽規則。）

（二）出聲思維。思維的另一個研究方法為內省式的言語報告，

（1）出聲思維的由來。東克爾（1945）首先提出了出聲思維法。直到1972年，紐厄爾和西蒙將此方法用在問題解決領域，獲得了可喜的成功。出聲思維一般按以下幾個步驟實施。

1、對被試進行預訓練，使他們能夠順利的進行出聲思維；

2、給被試一個思維作業，讓他們用出聲思維的方法來完成作業，同時用錄音機記錄他們的全部口述。

3、當被試在進行出聲思維的過程中發生停頓，實驗者應及時提醒或詢問他們在想什麼，不過，除非有特殊的研究目的，並事先做過準備，實驗者在出聲思維過程中不應提問，以免干擾被試的出聲思維；

4、將錄下的言語報告逐字逐句的整理成文字材料，並對記錄進行細緻的分析，提煉其中有價值的材料，以分析被試思維的過程及其特點。

所錄下的言語報告的分析是上述步驟中最困難的一步，有時被試的報告顯得過於雜亂，很難從眾找出規律。對此，紐厄爾和西蒙（1972）提出了一種分析被試出聲思維言語報告的有效方法——問題行為圖。

（1）出聲思維的分析——問題行為圖。問題行為圖可以使研究者直觀的看出被試在問題解決過程中所進行的各種操作序列。問題行為圖由兩個部分組成：（1）知識狀態，即被試在某一具體時刻所知的關於該思維作業的全部信息；（2）操作，即被試每次用來改變其知識狀態的手段。在製圖時，方框表示知識狀態，箭頭表示改變知識狀態的操作，箭頭的方向指出知識狀態變化的路線，畫時要依次排列，遵循從左到右、從上到下的原則。如果在問題解決過程中出現知識狀態的重複，則返回這一狀態的原始位置。當問題行為圖中出現了倒退的現象時，必須用向下的箭頭表示，並另起一行。問題行為圖表明：被試的過程並不是直線式的，而是以一種曲折、迂迴的方式前進。

（2）出聲思維的研究實例。傅小蘭（1995）以出聲思維研究了人們問題解決過程中所使用的策略。研究中使用的問題是獨粒鑽石棋遊戲。研究者對被試的口頭言語報告進行了分析，結果發現被試採用了三種不同策略：（1）「知覺指引策略」，即被試下棋毫無計劃；（2）「選擇性搜索策略」，這類被試的口語報告一般為「先把最角上的棋子吃掉」、「要往中間走」、「怎麼把邊緣的移到中間去」等；（3）「計劃簡化策略」，這類被試的口語報告一般為「怎樣使四個角一個一個空出來」、「上面一個一個角消滅掉，這麼消滅的話沒初一中間的」等。結果表明，隨著練習次數的增加，能使用有效策略的被試越來越多。（傅小蘭的獨粒鑽石棋實驗使用了出聲思維研究人的問題解決中使用的策略）

（3）對出聲思維的評價。通過問題行為圖對出聲思維進行分析，使得言語報告可以被量化了。比如，問題行為圖中向下箭頭的個數就是被試在思維過程中倒退的次數，倒退次數越多，可能說明被試在思維過程中使用策略的情況越不穩定；在問題行為圖中，所使用的而操作總數則可以作為其思維快慢程度的指標。出聲思維的另一個優點在於：掌握被試思維的全過程。出聲思維的缺陷：1、出聲思維反映的是僅能停留在被試意識層面的東西；2、在解決問題時讓被試進行言語報告是否會影響到被試的思維？3、言語報告的可信程度到底有多大？梅特卡夫要求被試邊解決問題，邊同時對他們接近問題解決的程度進行評價，結果顯示，被試的評價很不準確。

（三） 建構認知模型。隨著認知心理學研究的深入，思維的研究需要進行一次方法論和指導思想上的革命，從研究諸如頓悟、類推、醞釀等具體的思維現象到真正解釋思維的本質，即思維的心理機制和內部表徵形式。在這種背景下，建構認知模型的方法逐漸受到研究者的青睞。建構認知模型是一個方法論上的概念，它代表的是一種指導思想，而非專指某種具體的方法。研究者往往會嘗試各種方法，綜合系列實驗研究的結果，來建立模型以揭示思維的心理機制和內部表徵，並設計實驗來檢驗模型的解釋力。

（1）實施步驟。思維最基本的單位就是概念，或者說是命題或符號系統，思維也常常被認為是以某種演算法或規則對符號或概念進行一定操作的過程。人們掌握概念的過程，可謂是最基本的思維過程。（羅施的概念結構原型說就是通過建構認知模型這樣的理論來進行研究的，先提出先驗模型，然後進行實驗驗證，最後完善模型）

1、先驗模型階段。這裡說的先驗模型，就是指研究者頭腦中的理論模型，即還未得到實驗驗證的思想雛形。羅施（1975）提出一種有關概念表徵的認知模型，即概念結構的原型說。他認為概念主要是以原型，即它的最佳實例，來進行表徵的，原型是能夠用來最好說明概念的一個樣例。例如，當我們在思維活動中設計鳥的概念時，我們常會想到鴿子。概念表徵出了原型外，還有維量。維量是指範疇成員的代表性程度，即概念內的其他個體偏離原型的距離。原型和維量的緊密結合就形成了概念。

2、實驗驗證階段。實驗驗證，即要通過對各種變數的操縱來獲得有利的結果，提出支持或否定先驗模型的證據，為模型的進一步完善打好基礎。實驗中，他向被試呈現屬於不同語義概念的許多詞語實例，讓他們就其代表相應概念的程度，由高到低予以等級評定，以1為最高。羅施進行了匹配實驗，要求被試儘快說出這對名稱是否屬於相同範疇，研究者記錄被試的反應時間。相同範疇的情況有兩種，一種是兩個名稱完全相同的，另一種是兩個名稱屬於同一範疇但並非同一個名稱的。羅施認為，如果在呈現這些成對的名稱以前，將所涉及的範疇（如鳥）告訴被試，即應用啟動技術，我們就能弄清概念是怎樣表徵及其編碼情況。結果顯示：啟動詞能加速諸如「麻雀-麻雀」等代表性高的項目的反應，而不能影響諸如「知更鳥—知更鳥」等代表性中等的項目，但會延緩諸如「企鵝-企鵝」等代表性差的項目的反應。對於範疇相同的項目而言，啟動辭彙加速高（麻雀-麻雀）、中（麻雀-知更鳥）、低（麻雀-企鵝）三類代表性的項目對的反應。這一結果驗證了羅施最初的假設。

3、模型完善階段。起初，羅施認為不同地區、民族、歷史時期乃至文化背景和群體構成等方面的特點都會造成概念原型上的差別，但是後來，羅施在新幾內亞對土著居民進行了顏色識記實驗，結果發現，雖然那裡的土著居民沒有西方的顏色分類名稱，但是他們在識記西方的各顏色範疇的原型時，仍然要快於識記其他邊緣顏色，而且效果也比較好。因此羅施在新的實驗實施上對其原有的模型進行了修正，提出原型可能是由基本的神經生理過程決定的。

（2）評價。

優點：

1、符合如今科學發展的趨勢，即先依靠人的理性提出某個觀點，然後再以實踐加以驗證，而不是像原始的科學一樣，依靠對經驗的歸納來得出科學的理論。

2、有利於解釋思維的本質及其內在的心理機制，而不僅僅停留在現象層面上。比如，概念表徵的原型能揭示人們不同概念進行不同判斷的真正原因。

3、對人的思維過程進行某種模型上的猜測與擬合是十分有應用價值的。教育可以盡量做到原型化。

局限：

1、先驗模型有時可能不可靠。基於先驗模型進行實驗研究，並將實驗的結論解釋為先驗模型的預期有時是不正確的。因為，在擺脫先驗模型束縛的情況下，我們也許對實驗結論作出不同的解釋。

2、有時難以找到具體的實驗方法可以驗證先驗模型。

3、不是任何思維過程都能找到一個認知模型與之相匹配。

二、思維研究的領域

（一）概念的形成。1956年，布魯納、古德諾和奧斯丁提出了假設檢驗說，描述了概念形成的過程。

（1）假設檢驗說的主要觀點。布魯納、古德諾和奧斯丁的假設檢驗說的主要觀點是：人在概念形成過程中，需要利用現在獲得的和已存儲的信息來主動提出一些可能的假設，即設想所要掌握的概念可能是什麼，這些可能的假設組成一個假設庫，取出一個或幾個假設，並根據這一假設做出反應，即對這一假設進行檢驗。被試的假設檢驗過程被看成是運用有目的策略的過程。這些目的包括：1、從每一個決定中獲得最多信息；2、使任務的壓力保持在可處理的限度以內；3、調節在規定的時間或活動範圍內，未能掌握概念的風險以及做出一個決定所帶來的其他風險。有目的策略的運用是假設檢驗的核心，也是人在假設檢驗過程中主動性的表現。

（2）實驗驗證——人工概念實驗。人工概念是布魯納、古德諾和奧斯丁（1956）為了驗證假設檢驗說所闡述的概念形成過程而發明的。人工概念指人造出來的，並沒有實際內涵的某種概念。布魯納等根據人工概念實驗確定了被試在假設檢驗過程中使用的四中策略。1、同時性掃描，被試根據主試所給的第一個肯定實例的部分屬性來形成多個部分假設；2、繼時性掃描，這一策略也應用於部分假設，它與同時性掃描的區別在於一次只檢驗一個假設；3、保守性聚焦，這個策略應用於總體假設的檢驗；4、博弈性聚焦，這個策略也是用於總體假設檢驗。它的保守型聚焦的不同在於，它一次改變焦點卡片一個以上的屬性。

（3）實驗驗證——漸變-突變實驗。楊治良（1986）對概念形成的突變、漸進性進行了實驗探討。實驗結果推測：概念形成是先漸變後突變的過程。

（二）問題解決。問題解決是最普遍的一種思維形式，最早的嘗試錯誤說和頓悟理論的爭論就屬於問題解決的研究範疇，問題解決過程中，往往會出現功能固著現象。所謂功能固著就是指在問題解決過程中，只看到某種事物的典型功能，而看不到該事物其他方面作用的現象。

（1）典型問題。功能固著研究的問題情境的設計需要注意以下幾點。

1、問題的成功解決必須涉及某一事物的特殊性用途，而不是通常用途。

2、問題情境設計必須要誘發被試的習慣性思維。

3、在所有問題情境設計中都必須注意的，即問題的難度。問題情境設計不宜過難。過難會出現地板效應，過易會出現天花板效應。

梅爾的繩子問題（1931）：要求被試同時抓住兩根相隔很遠的繩子。

東克爾的盒子問題（1945）：

（2）實驗研究。東克爾的盒子問題設計了三種實驗處理條件：控制條件（盒子是空的）；功能固著條件（盒子里裝有相關東西）；中性物條件（盒子里裝有實驗無關的與問題解決無關的物品）。亞當森認為東克爾的實驗未將速度-準確性權衡考慮在內，在控制條件下，解決問題的人數多，可能並非因為功能固著的傾向較弱，而僅僅是由於他們解決問題花了更多的時間，而功能固著條件和中性條件下，解決問題的人數少，僅僅可能是由於被試沒有耐心解決問題，或者給予被試的時間過少。為了深入探討，亞當森在東克爾實驗的基礎，進一步實驗。實驗設計三個問題：盒子問題、回形針問題和螺絲刀問題。盒子問題與東克爾結果一致。回形針問題和螺絲刀問題幾乎所有被試都解決了這兩個問題，可能是存在天花板效應。以解決問題的時間作為因變數可以避免天花板效應的出現。可見，功能固著的程度的確會影響被試解決問題的速度和正確率。（亞當森認為東克爾的盒子實驗未將速度-準確性權衡考慮在內，從而設計了盒子問題、回形針問題和螺絲刀問題，以解決問題的時間為因變數。）

（三）推理。推理是從已知的或假設的事實中引出結論。推理其實是一種特殊的問題解決——邏輯問題的解決。推理的實驗研究發現，雖然正確完成推理任務需要依靠邏輯，但真實的推理過程卻往往存在非邏輯的部分。通過將人的推理過程與標準邏輯規範進行比較，研究者有望查明推理是否偏離邏輯規範及其原因，從而深入的了解人的推理過程。

（1）啟發式策略。啟發式策略是指人們在推理任務中，往往採用一些推理規則，這些規則不一定遵循標準邏輯規範，但在生活情景中也能幫助人們做出快速的、基本有效的推斷。卡內曼和特弗斯基（1972，1973）總結了三種重要的啟發式策略：代表性啟發法（工程師）、可得性啟發法（字母K）和調整啟發法（數字順序）。代表性啟發法是指人們傾向於根據樣本是否代表總體來判斷其出現的概率，越有代表性，被判斷為越常出現。給被試介紹某個人的特徵，並說明這人是從100人中隨機抽取出來的，告知第一組被試這100人中有70人是工程師，30人是律師，而告訴第二組被試這100人中70人是律師，30人是工程師。要求被試判定所介紹的那個人是工程師的概率有多大。結果發現：兩組被試都判定該人為工程師的概率約為0.9。顯然，被試只是依據介紹人物特徵的代表性來進行判斷的，而沒有考慮事件的基準率信息，也即工程師在兩組中所佔的不同比例。可得性啟發法是指人們傾向於根據一個客體或事件在知覺或記憶中的可得性程度來評估其相對頻率的，容易知覺到的或迴響起的常被判定為更可能出現。如：要求人們回答字母K在英文單詞里是常出現在第一個位置還是第三個字母的位置？絕大多數人認為字母K常出現於英文單詞的開頭。但是實際上，在英文里，第三個字母是K的單詞數量是以K字母起頭的單詞數量的3倍。調整啟發法是指以最初信息為參照來調整對事件的估計。在判斷過程中，人們最初得到的信息會產生「錨定效應」，制約對事件的估計，例如，8×7×。。。。。×1=？和1×2。。。。。×8=？要求被試在5秒內估計出乘積。結果被試在第一題的乘積估計遠遠大於第二題的乘積估計。有關啟發式策略的研究，解釋了人們在處理實驗問題時所遵循的並非一定是邏輯推理規則。

（2）推理模型。

1、國外研究者提出的模型。查普曼等（1959）曾提出三段論推理的換位模型，他們認為，人在三段論推理中所犯的錯誤是由於錯誤的解釋了前提。比如，人們往往將一個全稱肯定前提解釋為逆轉亦真，即認為「所有A是B」意味著「所有B是A」。約翰遜-萊爾德（1983）提出的心理模型更多的涉及推理的內部過程和心理機制。該模型認為，三段論推理的第一步是構成一個將兩個前提中的信息結合起來的心理模型，在這些前提的基礎上建構起來的心理模型通常提示某個結論，然後通過搜索與該結論不相容的其他替代的心理模型來評價該結論的真實性，如果搜索不到，即沒有足以破壞該結論的對前提的其他解釋，那麼這個結論就是真實的。

2、國內的研究。林崇德等也探討了人類推理中所使用的模型。他們曾研究了兒童在三項系列問題中所使用的額推理模型（李紅、林崇德，2001）。所謂三項系列問題就是一種傳遞推理，如：黑狗沒有白狗小，黃狗比白狗小，誰最大。他們假設被試在推理過程中，有四種推理模型：空間模型、語義空間模型、語義模型、樞紐項比較模型。實驗設置了兩個條件：自由推理和實質描述推理，前者是指在不告訴被試問題實質的情況下，讓被試進行推理，而後者是指在告訴被試問題實質的情況下，讓其進行推理，即告訴被試此類推理的實質是傳遞問題，找到中間項後，便能順利解題。

綜上所述，推理的實驗研究和此前介紹功能固著實驗一樣，都揭示出人類思維過程中的某些規律性方面。

（四）決策。決策是指在分析所獲得信息的基礎上做出決定的心理過程。傳統的決策研究者通常持有「完全理性」觀點，直到1974年，西蒙考慮到了人的心理因素在決策中的作用，提出了「有限理性」觀點。（西蒙首先提出了決策的有限理性觀點，打破了傳統關於完全理性的觀點）

（1） 期望效用理論。基於「完全理性」觀點的決策理論，往往用數學模型來模擬人的決策過程。諾伊曼和摩根斯頓（1947）的期望效用理論認為：決策者一般選擇期望效用值最大的那項備擇方案。期望效用值可以用備擇方案的結果發生概率與該備擇方案的效用值之間的函數來表示。後來受到「有限理性」觀點的影響，研究者們認為人們在決策過程中，並不是完全按照客觀存在的效用值和概率計算期望效用值，效用值和概率的估計的確會受到主觀因素的影響。

（2） 前景理論。「有限理性」觀點認為人不可能全面的考慮問題，並作出最為合理的決策，在現實生活中，人們決策的有效方法是靠以往的經驗。這一觀點最具代表性的理論是卡內曼和特弗斯基（1979）提出的前景理論。他們發現人的實際決策行為和期望效用理論的預期有所偏離，並且這些偏離都是系統的、有規律的。

1、 迴避損失。是指損失的效用要比等量收益的效用得到更大的權重。根據實驗結果，卡內曼和特弗斯基總結出了一條損失——收益函數曲線。當收益逐漸增加時，價值增加很少，當損失增加時，價值卻降得很快。

2、 參照效應。是指人們一般是依據某一參照點來定義價值，而不是依據純價值進行決策。例如，卡內曼和特弗斯讓兩組不同的被試回答一下問題：原有1000美元，到底是選確定的500美元還是0.5概率的1000美元，原有2000美元，到底是選確定的500美元還是0.5概率的1000美元。結果第一種大部分人選確定500美元，第二種大部分人選概率1000美元。

3、 捐贈效應。是指對於獲得本不屬於自己財產的東西，人們傾向於給予更高的評價。卡內曼將此解釋為：擁有杯子的被試獲得了本來不屬於自己的東西，由於不想放棄，所以對此物品估價很高。

三、思維中的無意識過程。1967年，認知心理學的創始人之一奈塞爾提出了思維的兩重性，即一種思維是有意的、有效的且有明確目的，而另一種思維是豐富的、雜亂的和無效率的，能在無意識或不自覺的情況下產生。在論證思維的無意識過程的研究中，研究者通產要觀察到被試行為表現和言語報告的分離，即被試的行為表示他們通過思考獲得了正確答案，比如能夠說出答案或進行有效的判別反應，但卻「聲稱」他們不知道思維的過程和正確答案，也就是說，其思維過程低於被試的主觀閥限。迪耶納和貝里指出，上述現象也可以描述為被試對自己的思維缺乏元認知。於是，迪耶納、奧爾特曼、誇恩和古德總結了兩種判定被試缺乏元認知的標準：零相關標準和猜測標準。這些標準分別被研究者用來證明在直覺現象和問題解決中，確實出現了無意識的思維。

（一）零相關標準與知覺研究。零相關標準是由陳（1992）提出，指被試的信心和他們的思維任務準確性沒有關係。而直覺是指人們在沒有意識到證據支持的情況下，依然感到自己的決定、判斷或問題解決辦法是正確的情況。如果人們的直覺確實有效，就應該說明這種直覺是有根據的，換言之，是個體思維過程無意識的處理了某些信息所致，即人們在任務準確率上反應出思維過程的存在，卻在主觀信心上意識不到思維過程，這樣就符合了證明思維中無意識過程存在零相關標準。

（1）「兩組三項組合」程序。「兩組三項組合」程序是在遠距離聯想測驗的基礎上設計的。遠距離聯想測驗是由麥德尼克（1962）設計的，設計之初的目的是希望能為評價創造力提供工具，而後來卻被由於直覺研究。

1、遠距離聯想測驗。麥德尼克認為創造性思維是將相互無關聯的觀點、想法進行結合的能力。並不是將兩個無關事物進行聯繫就被稱為創造性思維，為了將創造性思維與思維錯亂、妄想、臆想進行區分，麥德尼克進一步指出聯繫產生的新觀點必須是有用的，而不是僅僅具有新穎性。他設計了實驗是：向被試呈現三個相互無聯繫的單詞，然後要求被試根據三個單詞產生一個聯想詞，當被試反應多個聯想詞時，被判為錯誤反應。

2、「兩組三項組合」程序介紹。鮑爾斯（1990）對麥德尼克的遠距離聯想測驗調整後運用到直覺研究中。這一程序中，向被試呈現兩種遠距離聯想測量的測試項目，其中一組三個單詞確實有共同的遠距離聯想詞，而另一組遠距離聯想測試項目時不能解決的。呈現數秒後，不管被試是否找到合適的聯想詞，都要求停止思考，並判斷哪一組是具有解決方案的。被試的判斷在嚴格時間控制下基本是基於猜測、預感或直覺的，而此時對被試判斷結果的測量就是對直覺的測量。結果發現：被試判斷的正確率顯著高於隨機水平，即被試對是否存在合適聯想詞的知覺較為準確，但是他們並不確信他們的判斷。可見，鮑爾斯的實驗滿足了零相關標準。為了確定直覺現象中的思維無意識性到底受何因素影響，鮑爾斯等對「兩組三項組合」測驗進行了調整：操縱聯想詞和三個測試項目間的意義聯結。將測試項目組分為意義會聚和意義分離兩種。前者是指，遠距離聯想詞在和三個測試項目進行聯繫時，保持同一意思。後者指遠距離聯想詞並不是在和每一個測試項目進行聯結時，都有相同的意識，至少與一個測試項目聯結時的意義與其他兩個聯結時不同。鮑爾斯等的實驗結果顯示，聯想詞和三個測試項目聯結詞的意義會聚程度與被試判斷結果存在顯著相關。這就和內隱記憶領域的間接啟動實驗結論相仿，即啟動詞的聯繫顯著時，啟動效果好，雖然不能意識到啟動的存在，但仍表現為反應時的大幅度縮短。這可能說明直覺和內隱記憶一樣，也是內隱認知系統中的一部分。（鮑爾斯根據麥德尼克的遠距離聯想測驗設計了「兩組三項組合」）

（2）滑鐵盧格式塔趨合任務。鮑爾斯等希望將「兩組三項組合」程序推廣到非語詞領域。為此，他們設計了滑鐵盧格式塔趨合任務。該任務包含兩個測試項目組：一個為能趨合的項目組，其中的測試項目為一些熟悉物體的碎片表徵，被試能把這些表徵整合成一個整體；另一個為不能趨合的測試項目組，其中的測試項目為上述物體碎片的旋轉或替換。數秒鐘要求被試猜測哪一個測試組的物體碎片是可以整合的。結果顯示，被試直覺的正確率顯著高於隨機概率，但仍有人質疑：認為二擇一測驗的誤差太高，被試的高正確率可能完全是由於隨機誤差。鮑爾斯等（1995）調整後，在呈現兩組材料後，緊接著呈現一個表，表上有四個字，讓被試指出哪一個字是趨合的正確答案。結果發現，當呈現的是可趨合的項目組時，被試反應的正確率高。滿足了零相關標準。（鮑爾斯等希望將「兩組三項組合」程序推廣到非語詞領域。為此，他們設計了滑鐵盧格式塔趨合任務）

（3）累積線索任務。鮑爾斯等對「兩組三項組合」程序的另一個變式為累積線索任務。該任務中只有一個測試項目組，包括15個單詞，它們都具有一個共同的聯想詞。其中前12個單詞與聯想詞間的距離相對遠，而最後3個單詞的聯想詞距離則相對近些。實驗中，依次向被試呈現這些單詞，每次呈現後，都讓被試相出一個單詞來作為已有單詞列表中所有單詞的聯想詞。隨著呈現單詞數目的增多，有關正確答案的線索隨之增多，被試的聯想趨於準確，每當被試產生一個聯想詞後，都要求他們判斷這些聯想詞稱為整個詞題最終答案的可能性。結果表明，隨著項目依次呈現，被試的聯想詞越來越接近問題的真正答案，不過他們對可能性的判斷卻始終維持在一個較低的水平上。這種信心水平和正確率的分離可以作為元認知缺乏和無意識思維的證據。

（二）猜測標準與問題解決研究。

猜測標準最早由奇斯曼和梅里克爾（1984）提出，指言語報告等外顯測試表明被試處於猜測水平，但他們實際的行為水平則高於隨機水平，即言語報告等外顯測試和操作水平的分離。

（1） FOK範式。FOK就是知道自己能解決問題的感覺。這種感覺屬於元認知範疇，可以作為猜測標準中外顯測試的指標。FOK範式的程序：1、向被試提出一個難度較大的問題，例如，著名的傳教士和野人過河的問題；2、在問題解決過程中，如果被試不知道正確答案，則讓他們判斷自己能否解決問題，找到正確答案的可能性，或是估計自己距離解決方法有多近，即FOK判斷。3、考察被試所給出答案的正確性程度，並將之與FOK判斷進行比較。結果發現，被試的FOK評定和他們實際的正確程度完全背離，這種背離可以被解釋為無意識思維過程的證據。

（2）複雜系統控制任務。由於問題過於複雜，被試對系統規則的有意識探索，也即意識指導下的問題解決嘗試，往往得不到什麼結果。這樣，由於被試在外顯測試上的失敗，那麼他們在問題解決過程中確實發生的行為表現提升，就可以作為思維無意識過程運作的證據。例如，布羅德本特（1977）的城市交通運輸系統控制任務，儘管被試操縱系統的能力在逐漸改善，但是被試回答選擇題的能力卻沒有改善，這表明雖然被試並不外顯的知道變數間複雜的關係，但是他們好像內隱的習得了這種關係。另外兩個典型的例子是貝里和布羅德本特（1984）的糖生產任務和人際交互任務。

（3） 球-箱問題實驗。隨著研究的深入，研究者在複雜系統控制範式下，對思維的問題解決任務又作了進一步的探討，諸如：被試操作水平的提高確實是他們進行無意識思維的結果嗎？被試在問題解決的過程中，到底哪些階段時處於無意識水平呢，是策略的無意識還是對答案的無意識，或是整個思維都處於無意識呢？針對這些問題，雷柏和科托夫斯基（1997）設計了球-箱問題實驗。

1、問題形式。五個箱子和五個球，球的移動可以改變箱子的關閉狀態。

2、猜測標準的證實。實驗採用了分心任務，分心任務為不同高中低零記憶負荷。然後以上每一組被試又被隨機分成兩組，分別在領記憶負荷和中等記憶負荷條件下重新解決球箱問題。總之，似乎可見被試雖然在首次問題解決過程中能夠外顯的獲得部分關於問題規則的知識（言語報告和第二次成績間的相關），但是僅僅局限於一小部分（普遍低下的言語報告分數等），言語報告和行為水平改善的分離符合猜測標準。

3、思維策略的內隱性。雷伯和科托夫斯基推斷，在問題解決過程中，被試可能會選擇三種策略，這三種策略全都可能有效導致球箱問題的解決。最終雷柏和科托夫斯基得出結論認為：被試對自己在問題解決過程中使用的策略時無意識的。

四、思維的人工智慧。

（一）人工智慧的界定。

（1）圖靈測驗。圖靈測驗並不是一項真實的計算機思維模擬測驗，而是一個思想實驗，它為人工智慧下了一個高標準的操作定義。圖靈測驗旨在為評估計算機思維模擬過程是否有效提供標準。一個男人（A）、一個女人（B）和一個詢問者三人分屬不同房間，詢問著必須判斷出A是男人還是女人。A的目標是迷惑詢問者，B的目標是幫助詢問者。鑒於此，圖靈對人工智慧下勒一個操作定義：如果詢問者與計算機分別在兩個房間中，並且詢問著不能辨認計算機所給的問題答案，可以認為計算機很好的模擬了A（男人）的思維過程，在某種程度上，計算機具有了人工智慧。事實上，人的思維過程存在很大程度的隨機性，比如，決策過程中的有限理性，計算機對此類隨機過程的模擬具有缺陷，一旦計算機模擬存在一點點差錯，圖靈測驗的操作定義便無法滿足。（圖靈測驗即判斷男人女人測驗）

（2）強人工智慧和弱人工智慧。強人工智慧，也就是圖靈所說的人工智慧，是指直接將人腦看做一台數字計算機，或是將計算機看做人腦，計算即和人腦可以在各個方面進行完全匹配，機器可以擁有像人一樣的思維過程和智慧，而人的思維則可以解壓縮為計算機形式符號與邏輯語言的操縱。這種定義的高標準體現在連個方面：1、硬體匹配，人腦和計算機要都以「全或無」的方式進行信息加工。2、軟體匹配，人的思維要求具有規則性，可以轉換成某種計算機語言。人的思維過程在很多方面具有隨機性，有時並不是按照某一事先設定好的程序進行，人的思維過程和計算機模擬思維過程有時無法進行軟體擬合。瑟爾提出了弱人工智慧，指用計算機來模擬人類的思維過程，從而檢驗原有思維理論的正確性。弱人工智慧僅僅把計算機模擬作為一種工具和手段，而並不要求計算機模擬思維與人類的思維在軟硬體方面完全匹配。弱人工智慧基本上依據以下邏輯：雖然計算機模擬思維與人類的思維在軟硬體方面並不玩去哪匹配，但計算機模擬思維和人類思維總會有一定的共同點，這些共同點為延增現有的思維理論提供了依據。根據現有的思維理論來編製計算機程序，如果能使計算機以類似於人的方式達到類似於人的思維結果，那麼這一思維理論便得到證實。

（二）人工智慧的成果。

（1）逆向工作與邏輯理論家。啟發法所憑藉的是經驗的解題方法，也可稱為經驗規則。逆向工作和手段—目的分析是兩種較為常用的啟發法。根據問題解決時的逆行工作策略，紐厄爾、肖和西蒙（1956）成功的編寫了歷史上第一個模擬人解決問題的計算機程序（「邏輯理論家」），它模擬了人證明諸如矩形的符號邏輯定理的思維過程。「邏輯理論家」成功模擬了人的有限理性思維，驗證啟發式策略在人問題解決過程中確實存在，顛覆了以前對人類思維完全理性的錯誤觀點。

（2）手段-目的分析通用問題解決者。紐厄爾和西蒙研究發現，手段-目的分析是人類問題解決中的又一項重要的啟發式策略。手段-目的分析的核心就是要發現問題當前狀態的差異，然後找到並用合適的運算元來縮短這個差異，如此進行下去，以接近和達到目標狀態。換句話說，就是將問題的目標狀態或總目標分為若干子目標，通過實現一系列子目標最終達到總目標。以河內塔問題（三圓盤三柱）為例。紐厄爾、肖和西蒙（1958,1959）根據手段—目的分析策略編寫了另一個模擬人問題解決的計算機程序，稱為「通用問題解決者」。該程序可成功的用於從定力證明到河內塔及傳教士和野人過河問題等多種不同性質的問題。和「邏輯理論家」不同之處在於，「通用問題解決者」包含一個長時記憶庫，以及一個短時記憶或工作記憶，以串列方式對信息進行各種操作。「通用問題解決者」系統的內部知識是以產生式來表徵的。一個產生式由條件和行動兩部分組成，「若條件滿足X，則實際行動為Y」。產生式系統顯得更為靈活，可以根據情境變化來調整行為，這種靈活性使計算機模擬的思維過程更加接近人的思維過程。

（3）思維的無意識和策略模擬程序。有時很難對別是的外顯思維過程進行測試，比如，給被試一個較難的問題，並讓他們以出聲思維來報告其解題的策略，此時，被試外顯報告的策略往往是支離破碎的，或者根本不涉及問題的核心，很難評價和確定被試所使用思維策略的正確程度。而此時若根據被試言語報告的策略，用計算機來模擬被試可能的解題過程，然後再對其進行評價，則是較為有效的外顯測試指標。將計算機模擬成績與被試真實的行為水平進行比較則可以驗證或證偽思維過程中的無意識。麥克喬治和伯頓（1989）的研究就是其中一例。根據被試提供的啟發式，由計算機模擬得到的模擬行為可以作為外顯測試指標。比較計算機模擬行為和實際行為後，發現對於1/3被試而言，啟發式所產生的模擬行為和他們的實際行為一樣好，有的甚至好於實際控制行為；而另外2/3的表現則符合猜測標準。這表明外顯測試和行為水平可能並非完全分離，其中存在個體差異：對於有些被試來說，在解決糖生產問題時，思維過程基本上是無意識的，對於另一部分被試來說，這一難度似乎並不突出，因而解決問題的過程完全處於意識層面控制之下。可見，使用計算機模擬來演繹人的外顯思維策略，並將之與實際的問題解決行為進行比較，是檢驗思維內隱性的有效工具。

（三）人工智慧的局限性。這些局限主要是針對強人工智慧的。

（1）反應標準上的局限性。瑟爾（1980）提出了一個假想實驗，揭示了人工智慧在反應標準上的局限性，這一假想實驗被稱為中文房間。整個實驗只有三個步驟：首先，將中文字元送入房間；其次，被試按照指導書的內容將輸入的中文符與已有的中文字元進行匹配；最後，被試將新的中文字元送出房間。實際上，中文房間實驗模擬了一段計算機程序：輸入一段中文符，經過運算，輸出另一段中文符。實驗的結果可能是：房間外面的人相信你是一位通曉漢語的人，雖然實際情況是你對漢語根本一竅不通。瑟爾認為，事實上，計算機和中文房間中的被試一樣，雖然表現的好像能進行各種思維，解決各種問題，但是實質上則只是根據一套實現設定好的原則進行類似條件發射似的反應，他們反應的標準是當前刺激與預先存儲的某個刺激的匹配程度，而不是真正根據語義或是某一思維策略進行反應。計算機程序中，唯一遵循的原則是計算機語言的合法性，而不是更高級的意義標準，計算機根本不懂問題所描述的內涵。而真正的人類思維過程是智慧的凝聚，反應標準應是高級的意義成分，或是有目的的思維策略，思維的基礎是對整個問題內涵與外延的整體把握。計算機思維模擬的反應標準和人思維的反應標準大相徑庭，從這層意義上來說，計算機反應標準上的局限性使得人工智慧無法達到人類的智力水平，無法重複人類的思維過程。（瑟爾的中文房間）

（2）加工方式上的局限性。計算機程序具有線性結構，往往要求執行完一條命令後，在執行下一條命令，同時執行兩條命令則會發生錯誤。艾森克（1984）而人類指出：人如果堅持線性加工，那麼只能有刺激驅動加工，即自下而上的加工，而不會有概念驅動的加工，即受到過去經驗與知識影響的、自上而下的加工。實際上，人類的思維很大程度上受著經驗的影響，比如啟發式策略。人的思維活動既包含概念驅動過程，也包括經驗驅動過重，且是並行加工的。計算機的加工方式限制了人類思維模擬的精度。

（3）調節系統的缺失。諾曼認為人有三個系統：認知系統是服務於調節系統的，而情緒系統處於兩個系統之間。正是因為缺失了調節系統，計算機思維模擬程序往往不能應付多種情境或在多種情境中進行選擇。

*參考資料

實驗心理學/郭秀艷著. —北京：人民教育出版社，2004