定量與定性之辯——美國政治學研究方法的融合趨勢

06-12

1994年，普林斯頓大學出版社發行了由加里·金(GaryKing)?羅伯特·基歐漢(RobertO.Keohane)和西德尼·維伯(SidneyVerba)三位重量級的政治學者(以下簡稱KKV)合作的政治學方法論著作———《設計社會調查》?此書一出版立即成為政治學研究方法演進中具有分水嶺意義的著作?儘管書中開篇指出定性和定量的研究方法在解釋社會現象的邏輯層面上一脈相承且相互補給，但此書被視為把量化方法全面推入美國政治學主流方法的濃重一筆，成為採用定量研究的政治學者的方法論「聖經」?此後，關於方法論的爭辯被認為進入了「後KKV時代」(post-KKVera)，掀起了前所未有的關於定量與定性研究方法的激烈爭論?10年後，一本彙集了當前美國政治學界諸多重要學者論文的方法論著作《重新審視社會調查》出版了?此書的目的在於對定量研究的主流地位發起挑戰，對量化研究提出尖銳批判，主張政治學研究中方法論的多元化?與此同時，誕生了相當一大批反思KKV?重新審視定性分析的文章?2009年，《設計社會調研》的作者之一羅伯特·基歐漢也開始反思量化研究的局限?他承認，在展示變數與自變數的因果關係方面，定性的案例分析和敘事性分析有著更勝一籌的優勢?在激烈的爭辯之後，政治學界很快出現了思路更為寬闊且包容的走向，主張方法論的融合?架構精緻的混合分析方法論文章不但得以進入《美國政治學評論》這樣的頂級期刊，而且很快成為高引文章，迅速被運用於政治學期刊論文著作?博士論文?研究生的教學大綱，等等?在KKV著作出版20年後的今天，政治學界關於定量定性研究方法的深入討論使得學者們對政治學方法的認知更為透徹，儘管辯論仍在繼續，但也不乏共識，KKV一統天下的地位正在逐漸式微，方法論的融合與多元的趨勢不可阻擋，雖然單一方法論仍然被認為還有著不可替代的價值?

一、定量研究的強勢崛起

2003年，美國政治學學會旗下的《政治科學與政策》(PoliticalScience&Politics)出版了一個專輯，以統計的方式對20世紀70年代以來美國政治學研究方法進行摸底?七個頂級的刊物，全美的政治學博士學科，以及美國政治?比較政治學和國際政治三個方向的數據顯示，量化統計的方法一直是刊出文章的主流，約佔65%，而且在90年代後期後呈現了明顯的上升趨勢，尤其是《美國政治學評論》上採用量化統計方法的文章高達80%以上?就不同領域而言，政治方向的論文90%採取量化研究方法，國際政治和比較政治學相對略低，但在過去20年內也呈現了明顯的上升之勢?與此相對應，案例和定性分析期刊論文從1975年的12%降至1985年的7%，到1999—2000年只剩下1%?從全美前57個政治學博士點的培養模式來看，66%的博士課程要求必修統計量化課程，其中56%以上要求至少修兩門課，而只有9%要求必修定性研究方法論課程?對於量化技術的掌握幾乎已經成為職業生存?進入主流研究領域的必要條件?定量研究的強勢?政治學研究的方法論缺乏多元的現象引發了諸多學者的擔憂?

定量研究就是運用數字?線性回歸等相關的統計學技術進行因果關係推斷與解釋的研究方法?根據KKV，一個規範的實證研究必須遵循一個穩定的框架，首先要提煉一個有意義的研究問題，然後運用恰當的理論給出學理上的因果假設，再通過選擇樣本?收集數據，最終給出解釋性和因果性經驗型的驗證?理論上講，這個框架對定性和定量研究都適合?兩者的區別起始於第三步，即樣本的選擇和相關數據的收集?通常意義上的定量研究是指大樣本研究(Large-NStudies)，定性研究則指小樣本的深度挖掘(Small-NStudies)，後者的N可以小至1，即個案分析，而N=2或3時，通常稱為比較分析(comparativeanalysis)?不過，大樣本研究與小樣本研究的不同，更重要的是背後分析邏輯的差異?大樣本分析是以變數為導向(variable-oriented)的分析邏輯，即要在對大量樣本收集數據中抽象出理論所指的諸多自變數和應變數，而後用統計的方法來檢測自變數和應變數之間可能的因果關係?相對格式化且公開的定量分析的過程便於複製檢驗過程，看起來更具科學性?更重要的是，撇開具體的統計學技術問題，把研究議題放入大量的樣本中來考察，是對因果關係可否進行普遍性的推及(generalization)的檢驗?這被視為大樣本分析最重要的優勢，因為理論上自變數和應變數之間的因果關係若通不過大樣本檢驗是無法進行一般性的推斷的?如果兩個變數之間的關係缺失一般性，理論假設的因果關係就得不到實證支撐，理論和經驗的脫節要麼需要更為精確的實證驗證，要麼就面臨理論崩潰之虞?

儘管定量分析在理想狀態下對理論的一般性檢驗具有邏輯上的優越，但縱觀定量分析的整個過程，從把涉及的概念統統量化為數字，在大量樣本中進行統計計算，到推斷出因果結論，每個環節都可能出現諸多問題，使得推斷出的所謂一般性因果關係值得質疑?對於定量分析的抨擊就是圍繞這些環節展開的?

二、定量研究中概念衡量的困境

進行政治學實證研究的關鍵一步就是對於概念的描述性測量(des-criptiveinference)，這是理論和實證相銜接的關鍵?有效衡量所討論的概念是定量和定性分析共同面對的問題，只是兩者採用不同的方式:後者往往採用相對模糊的表述，如「高」「低」「多」「少」;而前者採用精確打分的方式進行區分，如「A國民主得分為2」「B國為7」等?不同於自然科學領域中像「溫度」「體積」這些概念的簡潔明了，社會科學中有很多概念即使被廣為使用，但內涵大有爭議?當政治學的定性研究者們還在爭論一些重要概念的內涵時，卻發現定量研究的同行們已經開始用數字描述，這些爭執在整齊劃一的數字里煙消雲散了?因此，量化的有效性(measurementvalidity)，即這些量化指標是否準確地反映政治學概念的內涵以及分析對象是否被恰當地評估得分，成為對定量研究最直接的拷問?

下面以政治學裡重要的一個概念「民主」為例，看其是如何被量化以及可能出現的問題?量化民主實質考察的是「民主度」(thelevelofdemocracy)，各國在民主度上的差異是該命題解釋的對象?現有的量化民主的資料庫可謂紛繁?以PolityIV為例，該資料庫以如下方式操作民主概念?一個成熟的民主至少表現在三個指標上:(1)政治參與自由開放且具有實質意義的競爭;(2)國家行政部門人選(如總統)來自民選;(3)對於行政機關領導的權力要有真正意義的牽制?然後又將三個指標細化為一系列次指標，例如，一國要在選舉的競爭性指標上得2分，必須要做到行政機構的人選在兩黨或多黨的候選人中通過競爭性選舉而產生;如果具有雙重的行政機構，其中之一由繼承或指定而產生，那麼只能得1分?這些明確且易於操作的指標實際上存在諸多的問題?

首先，民主概念被如此操作化是否合理?眾所周知，民主是一個從古希臘就開始熱烈爭論的概念，相關的思辨與研究不計其數?如此大刀闊斧地把對這個複雜概念的爭論簡化為幾個指標是否擊中了現代民主的最核心內涵呢?這些指標是否存在西方選舉民主的偏見呢?這樣整齊劃一的衡量是否存在概念過度延伸問題(conceptualstretching)呢?諸如此類的問題接踵而來?而實際上，關於民主的名目繁多的資料庫對概念的操作化定義五花八門，資料庫之間雖然相關度較高，但不同概念定義下，具體編碼標準與方式還是存在較大差異?不過，不管如何具體定義民主，都是採取了類似的就簡去繁的操作方式，這種武斷的方式對於擅長將概念闡釋得翔實而具體的傳統定性研究者來說是莫大的挑戰?其次，操作化過程中的準確性問題也值得考量?例如，PolityIV數據中另一個關鍵詞是「競爭性選舉」?按照該資料庫的給分，波札那應該是一個運行得相當不錯的民主國家，但如果考察該國的選舉，根本無競爭性可言，1974—2009年間的選舉，波札那民主黨(BDP，BotswanaDemocraticParty)所佔的席位比重基本都維持在80%以上，最低的1994年也達到了67%?實際上，類似的問題在所有人工編碼的資料庫中都存在，甚至每一個概念的每一個指標都會涉及?但一旦進入定量研究的標準化進程，刻板數字背後的諸多問題都被掩蓋，如果無法接受量化操作過程中某些原則的妥協或變通，那麼受制於這些資料庫的定量研究者們基本上寸步難行，而正是這些變通在定性研究者看來是不合適的?再次，如何詮釋具體數值的內涵也是一個大問題?因為操作化民主這樣的複雜概念往往包含了很多進一步細化的指標，不同國家可能最後獲得類似或完全一致的分值?例如，尼加拉瓜?韓國和1990—1999年的保加利亞三國的「民主度」分值均為18，但顯然這幾個國家民主發展的具體背景及狀況相去甚遠?進一步質問，比它們高一分或者低一分的那些國家真的存在與他們之間所謂的「等距」差別嗎?這些豐富多元的民主發展呈現的差異最終被湮沒在資料庫中，歸入了統計模型的計算?

對於初始進入量化研究領域的學生或者堅定的定性方法論學者，首先會對這些量化概念存有諸多困惑，以上呈現的問題並不複雜甚至顯而易見?但問題是，這樣的缺陷是否足以否定定量研究作為整體的方法論?這一方法在政治學界以及整個社會科學領域的流行難道只是個謬誤?追溯起來，給予一個概念精確衡量的初衷並非壞事，操作化技術也大可在辯論中不斷提升，更多數字背後的詮釋可以加深理解最後的因果關係?

三、樣本?統計模型與因果關係的不確定性

在定量研究中，與量化概念一併進行的是樣本選擇，爾後進入統計模型的計算?定量研究者們孜孜以求的就是KKV討論的「平均因果效應」(meancausaleffect，beta)?不過，準確的估算值Beta係數的獲得受制於一系列因素，除去以上討論的變數的衡量謬誤等，還包括諸多問題———各式類型的樣本選取偏差(selectionbias)?統計模型錯定(modelmisspecification)?因果關係中的內生性問題(endogeneity)?變數的交互作用(interactiveeffect)，等等?當然，如果涉及實驗方法，從實驗設計開始，每一個指標數據收集的環節都可能直接影響最終的結論?其中，所涉及的方法論內容幾乎貫穿了一個政治學定量研究的博士生方法論訓練的全過程?以「現代化理論」(modernizationtheory)為例，可大體反映定量研究有可能出現的因果解釋的爭議甚至謬誤?

1959年，李普賽特發表題為《民主的社會前提:經濟發展與政治合法性》的文章，開啟了馬拉松式的關於經濟發展與民主之間關係的理論爭論與實證檢驗，其中支持與質疑的聲音交錯而至?1997年，在《世界政治》上，普沃斯基試圖運用自二戰以來的全球範圍內的大數據，針對幾十年來的爭論進行計算，得出具有「一般性」的結論?他的研究結果顯示，民主轉型的發生與經濟發展水平沒有關係，但是如果經濟發展水平較高的國家發生民主轉型，民主得以鞏固的概率更高?他甚至給出了精確的民主嬗變的經濟指標?然而，這一基於全球樣本的大數據似乎並沒有讓經濟發展變數之於民主發展的「平均因果效應」一般化?對此，博伊克斯與司多科提出質疑?他們認為，普沃斯基的實證檢驗在案例選擇?模型選定以及檢驗民主化的內生性等方面都存在問題，進而影響了最終因果關係的確立?他們將樣本選取回溯到1850年，並考慮到其他他們認為可能引起民主的內生性變化的經濟指標以及交互變數作用，包括資本流動與國際因素等?其最終結論認為，高水平的經濟發展更利於民主轉型?2006年，愛潑斯坦?拜茨等聯合發文挑戰普沃斯基的結論，認為現代化理論完全站得住腳?他們採用了全新的指標衡量民主，運用了新數據?全新的統計模型?從方法論的角度，我們至少看到以下兩點?

第一，統計模型的穩定性實際上是相當脆弱的，樣本選擇?主要變數的衡量?統計模型的選擇?模型運算過程中可能出現的統計學技術處理方式等都會直接干擾到模型最後的結論?稍有定量研究經驗的學者都有這樣的體會，很多情況下，模型加入的控制變數稍有變化，beta值及統計學的重要性就會產生劇烈變化?因此，實證檢驗過程中的技術稍有不過關，基於大數據得出的結論很可能就是個錯誤?專攻政治學方法論的學者們主要的任務之一就是通過複製數據?重新比對運算指出這一過程中的差錯?因此，被認為是定量分析主要優勢之一的可以將結論一般化，實際上需要建構在相當苛刻的條件之上?當然，定量研究遵循的是統計模型分析中被廣泛認同的知識和慣例，實證檢驗的每一步驟的清晰表達使得研究的複製成為可能，但是每一個環節的稍有不同的處理方法都可能指向不同的結論?像普沃斯基的研究，我們很難說其存在明顯的技術性謬誤，或者說其後的批判者的統計學技術更高一籌?但應用了更多樣本?看起來更合理的指標衡量及統計技術後，結論的確產生了根本性的變化?因此，定量研究可以一般化結論這個觀點本身也是需要檢驗的?

第二，在運用統計模型進行計算的過程中，沒有直接檢驗理論與所呈現的概念之間的因果關係，是針對定量研究比較普遍的批判?具體來說，量化模型對於解釋因果關係是非常不充分的，因為統計模型本身並沒有展示正向或反向的因果關係究竟是如何產生的?因此，絕大多數大樣本量化的分析無法驗證因果關係本身，驗證的只是變數之間因果關係之後有可能呈現的結果?對「現代化理論」的檢驗最終在統計模型計算中轉化為人均GDP與民主度之間的關係，但人均GDP是否意味著經濟發展?社會結構變遷?民主意識抬升等還與民主化可能發生的路徑相關聯?例如，包括石油在內的自然資源豐富國家就成了所謂的例外?自然資源豐富帶來的人均GDP的高指標與經濟結構?市民社會等元素並不存在預設的關係，數據與具象化的政治演變路徑脫節了?

總之，仔細考究定量研究的過程就會發現，它在導向一般化因果關係的道路上可謂磕磕絆絆，也正是在對這些定量研究所呈現問題的批判中，學者們看到了定性研究的長處以及可能的在定量定性研究之間取長補短的混合分析思路?

四、定性研究的優勢以及混合研究法的提倡

早在20世紀70年代，利普哈特就給出了小樣本研究面臨的「太多變數，太少樣本」(manyvariable，smallnumberofcases)的著名論斷，定量研究啟用了以變數為導向的研究路徑來解決這一難題?這些學者認為，小樣本的研究可以彌補大樣本研究的諸多缺陷，尤其是在因果關係的闡釋與理論的建構當中?定性研究者甚至針對定量分析中數據的主導思路(data-setobservation)，給出了針鋒相對的「因果過程觀察數據法」(ca-usalprocessobservation，CPO)?他們認為，案例以及比較分析能夠更為深入地闡釋概念進行描述性解釋，從而為分析者提供探究「黑箱」之內事件的機會?更為重要的是，研究者對僅有的一個或幾個案例數據更加容易做到了如指掌，可以更好地釐清變數之間相互作用的來龍去脈，更好地展現因果機制究竟如何切實發生在某個或幾個案例當中?這一細緻深入的挖掘過程還可能醞釀出其他合理的因果解釋，提煉其他與案例背景相關的變數，分析可能存在的互動效應以及因果機制產生的必要條件，等等?總之，小樣本定性研究能夠產生對於理論假設以及數據之間更為近距離的透視，也能展示出變數互動中更精確的過程追蹤?這樣，對於大樣本定量研究中概念過度延伸?統計模型中因果機制展示相對缺失的問題都可以得到一定程度的彌補與克服?

意識到這兩種方法可能在理論的建構?概念的闡釋以及結論的實證檢驗方面有互補作用後，學者們在反思定性研究的長處的同時，考慮到多元的方法論在政治學研究中的應用，也就是將定量與定性的研究結合起來共同解決所研究的問題?塔羅很快就表明這一方法論的立場，此後類似多元化方法論的倡導一直沒有停止?大衛·拉汀認為，只有將形式理論(formalmodel)?定量?定性方法三者結合起來，方能給出最好的解釋;蓋瑞在指出案例研究的優勢之後，提出了統一的定性定量方法論路徑?儘管這些學者主張的混合分析法存在差別，但在融合定量與定性方法的整體方向上達成了共識?利普曼的「嵌套式的定量定性混合法」(nestedanalysis)，精緻地建構了混合分析法的具體操作步驟，成為最受歡迎的混合分析法的方法論文章之一?根據他的思路，定量定性方法可以進入分析的循環，既可以在定量大樣本檢驗之後通過案例或比較分析來展示因果關係在具體案例中的作用機制(modeltesting)，或通過對例外案例的深入考察建構新的理論(model-building)，也可以在大樣本分析並未呈現明顯的一般性規律的情況下，通過案例分析直接考察因果關係，爾後進入新的大樣本分析，如此循環?利普曼混合分析法的設計充分利用了定性與定量分析的優缺點相互彌補這一基本格局，因為可操作性強，迅速激活了學者的應用熱情?

當然，對混合分析法的讚揚聲中也夾雜著不少質疑的聲音?這些學者主要是從哲學的角度質疑這兩種分析方法在本體論與認識論層面的互補接洽問題，認為它們根本上屬於不同的範式?但是，這樣的質疑並沒有阻擋混合分析法逐步被廣泛接納並迅速普及，推動其在技術層面更加趨於合理?新近發表的文章表明，學者們已經開始思考在純粹的定量框架內通過定性的信息來加強因果解釋?而且，這種方法論融合趨向不僅表現在定量定性混合法的逐漸流行上，更表現為對單一研究法的更多寬容?

五、結語

美國政治學協會從2003年起專門設立「定性與混合分析法」分支(QualitativeandMulti-MethodResearch，Section37)?這是在方法論基本一邊倒的時期試圖進行平衡的手段，至少表明政治學界已經在反思:政治學中無條件地運用定量方法最終可能破壞政治學研究本身?過去10年政治學方法論演進中的融合趨勢是對這一反思的最好應和?實際上，這也與其他社會科學方法論的嬗變路徑是吻合的?2007年，《混合研究法期刊》(Journal ofMi-xedMethodsResearch)誕生，成為方法論多元化趨勢的標誌性產物?對於定量研究尚在起步階段的中國政治學界來說，洞察到國際政治學前沿方法論融合的趨勢既是機遇也是挑戰，無論是從事定性還是定量研究的學者，互相的借鑒以及多元的方法論訓練如今看來已經不可避免?

限於篇幅，省略了參考文獻和注釋，本文原載於：《國外社會科學》，2016年第4期。

作者：祁玲玲，南京大學政府管理學院副教授