實證研究是什麼?怎麼做?為什麼你一定要做一次?

我在出國讀博士以前雖然也做了參與了一點科研內容,但是真正讓我對學術發生興趣、真正開始理解學術研究還是在來美國接觸了實證研究之後。

如果你是個社會科學研究者,我認為你一定要嘗試自己設計一次實證研究,哪怕它不是你的主要研究目標。因為設計、執行自己創造出來的實證研究,實在是太有意思了。

打個比方,這種能夠自己設計、執行、驗證自己的研究的感覺,就好像藝術家從頭到尾經歷幾年精心打磨出來一件藝術品,就像建築設計師從無到有、從想像到現實看見自己腦中的圖像矗立在大地上。

它實實在在的是你的創造,而創造一件東西過程中的快感和創造後的成就感恐怕是沒有任何其他事情可以替代的。

什麼是實證研究?

實證研究,empirical study, 是基於對事實、客觀的現象、數據進行系統的驗證,而得出問題結論的研究。實證研究的三大特徵是以證據為依託、有數據、和可以驗證和重複驗證看一個研究是不是實證研究,最直接的辦法是看它文章里有沒有呈現data (數據)---這裡的數據並不單指「定量」數據,而是既包括定量也包括定性的數據。所以實證研究從數據類型上分可以分為兩種:

  • 定量型實證研究
  • 定性型實證研究

有人會以為只有定量的研究才是實證研究,這其實是誤解。訪談的對話、實地觀察的筆記、archival data, 這些都是數據,只不過是定性的數據。

什麼研究不是實證性研究呢?沒有數據的,不依託現實中驗證的證據的。比如理論構建的研究、文獻綜述型文章等。沒有收集數據、呈現數據、經數據分析的研究不是實證研究,而是conceptual study, 或者theoretical study (理論性研究)。

實證研究重要嗎?

重要,特別重要。最大的原因是,這是目前為止社會科學領域最被廣泛接受、最流行、最常見的研究類型。其次,功利一點的原因是,這也是社會科學領域學者們最容易發文章的類型(英文期刊)。或者,從趨勢的角度看,在可預見的接下來幾十年,實證研究的方法應該繼續成為社會科學屆最重要、最主流的研究方法。而國內這幾年實證研究的興起和快速發展更加印證了這一點。

實證研究怎麼做?

簡單來講,實證研究最核心的工作是以下這三步:

第一步:你要確定一個研究問題

這個研究問題最好是你感興趣的,要是非常具體的,要是可以檢驗的。(我在之前的幾篇文章里專門討論過選題,有興趣的同學可以移步選題(1)——Social research的三種目的以及什麼是研究問題; 以及選題(2)——What is a Good Research Question? ) 比如, 以下都是可以作實證研究的題目:

  • 提升電費能夠促進人們節約用電嗎?
  • 每年年初制定計劃的人會比不做計劃的人工作效率更高嗎?
  • 在醫院工作的人,是比不在醫院工作的人更容易生病還是更不容易生病?
  • 數學好的人語言能力會更差嗎?
  • 隨著年齡增加,人的同情心會逐漸增加嗎?
  • 一個非營利組織的籌款數額與員工對工作滿意度有相關性嗎?
  • 明星片酬越高的電影票房越高嗎?
  • 養狗的人比養貓的人更願意跟其他人社交嗎?
  • 學生自發上知乎的頻率跟學習成績成相關性嗎?

以上是我隨便舉幾個例子, 你會發現, 實證研究的主題經常是非常有趣,非常接地氣的,跟我們生活息息相關的,所以我相信很多學者都是跟我一樣,因為自己做了實證研究而對研究這件事本身發生了巨大的興趣 。

而另一方面,當你自己做過實證性研究,你會發現你看待周圍人和事物的方式或多少發生一些變化,你相當於給自己的思維加了一道升級的新設備,它會幫助你更有力的思考很多現實問題。你還會發現,其實我們生活中很多人們習以為常、或者習慣性接受了的觀點,未必是經得起推敲的事實,因為它們從未經過系統驗證。

我們中國悠久的歷史和沿承的文化決定了我們很多知識是通過經驗、習俗、或口耳相傳來積累的,而不是經過系統的、以事實為依據的科學驗證來積累的。那麼這就意味著可能有不少的流行的觀念、習慣、想法都還沒有經過驗證,都需要有數據去支持,都值得去展開質疑和進一步探討。這也意味著,作為一個社會科學研究者,在國內做實證研究,其實還有大量「低垂的果實」沒有被開採,大量的貢獻等待著學者做出,正是被需要的好時候。

2. 第二步:你要自己設計出驗證題目的過程

這其實就是寫proposal(計劃書)的過程。你要在這一步里思考怎樣才能夠驗證你的研究問題,而具體來說,也就是收集到什麼樣的數據能夠幫你驗證你的研究假設。

從這一步開始,你要做的工作就越來越有意思了,你開始通過你自己的能力去創造一個從未有過的過程。這裡面需要你具備很多基礎知識和思維能力,但是它誘人的地方在於,你設計的研究,會跟其他任何人設計的都不完全一樣,那是你做的,你創造的,你把握的,一定帶你著思維方式、教育背景、訓練背景的獨特烙印。這個研究可是真真正正、從裡到外印著你名字的作品。

比如說,「在醫院工作的人,是比不在醫院工作的人更容易生病還是更不容易生病?」這個題目,是我有一次去醫院的時候忽然想到的,雖然不是我自己的研究範圍,但是我覺得是一個很有意思的話題。這裡我好奇的並不主要是醫院工作人員更容易被傳染、或者免疫能力更強的問題,我當時在醫院裡的感受是,所有的工作人員每一天都會接觸很多的病人、談論很多的疾病名稱、看到很多的病痛癥狀。他們談論、思考、接觸這些疾病和癥狀的頻率,大概是我們普通人的好幾十倍。我們平時也就是偶爾會談論起某個人生病了,或是偶爾看到別人生病的癥狀。所以我特別好奇這種」談論」和「接觸」對人的心理暗示有沒有影響,人會不會因為每天討論的病情很多,就更容易得某種病呢?

要想真的用實證方法來驗證這個問題,不同的學者的設計思路一定會不一樣。比如,到底什麼樣的數據類型才能回答問題?定量還是定性的方法更有效?訪談還是問卷的方法更適合?如何測量「更容易生病」這個變數?選取多少個醫院的工作人員才夠?選哪裡的醫院?要不要選多家不同類型的醫院?要不要把不同的工作人員(比如醫生、護士、其他工作人員)區分開來研究?….這些方面都需要考慮,具體做起來每個學者也都會有不一樣的設計。

更系統一點說,這一步要想把研究設計得精彩,意味著我們需要有以下幾個方面的知識( 後續專欄文章會分別梳理的模塊):

  • Sampling (抽樣): 什麼是樣本? 有什麼不同的抽樣方法? 抽樣背後的邏輯是什麼?什麼時候應該用什麼樣的抽樣方法才合理? 定量研究和定性研究sampling方法有何不同?
  • Data collection (數據收集): 了解數據收集的不同方法,以及各種方法的具體步驟
    • 訪談(interview):結構化訪談,非結構化訪談,以及半結構化訪談(structured, unstructured, and semi-structured

      interview) 分別在什麼情況下使用? 什麼才是高質量的訪談? 如何做好面對面訪談?
    • 問卷(Survey): 什麼情況下時候使用問卷? 應該使用哪種類型的問卷形式(網路問卷、電子郵件問卷、紙質版問卷等)? 哪個網上問卷編輯的網站能滿足你的問題類型? 問卷里應該先問什麼後問什麼? 問卷應該多長? 應該什麼時候發反饋率最高? 應該什麼時候做follow up, 以及如何管理和跟蹤參與者資料庫?
  • Measurement (測量): 如何問好你想知道的問題呢?你問了問題就一定能得到你想知道的東西嗎?如何能準確測量你的變數呢?怎樣保證較高的validity (效度)和reliability(信度)呢?是否應該選擇和使用前人建好的問題呢?

實證研究很大的迷人之處在於,實證研究的設計,永遠沒有最好,只有更好。

真正做起來實證研究的時候,你會發現各種選項都有各有其優勢和劣勢,就像特點不同的兵器,你拿起哪一把都必須接受它的弱點,所以看起來好像不難的事情其實裡面需要考慮和權衡的細節非常多,因為無論你選擇哪種抽樣方法、數據收集辦法、測量的方式,你都真切的知道它們不會是完美的方式。然而 如何在不可能出現完美的情況下,做出盡量去無限接近完美的設計, 或者說如何在已知困難的事情面前想出巧妙的方法,這就是做研究的巨大魅力。

我總覺得這世界上可以自己決定的事不多,而親手做實證研究時,你就像是坐在駕駛艙的位置,通過每一步自己親手做出的設計去觀察和了解這個世界。每一個步驟都可以一絲不苟,做的精良一點再精良一點。大概沒有什麼事是比看到自己親手設計和創造的東西做出了好的效果更有成就感了。

3. 第三步:數據收集上來之後,你要用統計學或其他合適的分析方法來驗證結果了

這一步簡單來說,就是「見證奇蹟的時刻!」

我自己在所有做實證研究的所有步驟中,這一環最讓我上癮,也就是data analysis, 數據分析的時候。時而覺得坐在那裡嗖嗖嗖的幾個小時就沒有了,異常興奮,特別想知道分析出來的結果到底是什麼樣的。

我曾經跟我一個朋友描述過這麼興奮,就好像你本來憑空想像出來的一個想法,你自己琢磨出來一個印證過程,結果通過數據客觀分析一看,居然你的想法真的被印證了!你說你是不是會覺得自己on top of the world呢?

或者,有的時候結果居然跟你假設的恰恰相反---這難道不是太好玩了嗎?你認為養狗的人會比養貓的人更喜歡跟別人social,然而結果恰恰是養貓的人更愛社交,這到底是為什麼?是你分析時用的工具不對,還是你有什麼沒有發現的東西呢?

分析數據的時候需要擁有「知道使用哪種工具」的能力-----各種數據分析的方法都是我們工具箱里的不同工具,它們都有自己最擅長的領域,而面對你的數據,你的研究問題,你需要找到最適合自己的那一把工具,你還要知道你的數據滿不滿足能夠使用這個工具的條件(也就是理解它們各自的」assumption」—假定)。這個能力,是要不斷通過看教材、看別人實證文章、和自己做實證研究進行積累的。

我覺得在這一步驟,重要的並不是你要記住所有分析工具的具體使用步驟(這些都能在網上和教科書里輕鬆的查到),而是要知道到底在什麼時候去拿起哪種工具。比如, 要了解以下這些工具在什麼情況下使用:

  • Linear correlation and linear regression
  • Factor analysis
  • Structural equation modeling
  • MANOVA, MANCOVA, ANOVA
  • Partial least squares regression
  • Logistic regression
  • Probit, ordinal, nonlinear regression
  • Hierarchical linear and multilevel mixed

    models
  • Social network analysis: QAP, MRQAP ….

很多工具的學習也是通過使用該工具來實現的,沒有哪個學者可以對所有分析工具了如指掌,但是做實證研究做的越多,你自然而然接觸到的工具也就會越多。所以很多時候並不是準備的萬無一失了才上戰場,而是在戰場上邊向目標努力邊利用機會學習。積累和學習一個工具本身就是做實證研究的一大樂事。

完整的做完一次實證研究通常需要多長時間?

一個高質量的實證研究從開始設計到論文最後成型往往至少需要兩三年的時間,這還不考慮投稿期間的等待時間和revise and resubmit的時間。

從上面的過程你能看出無論從設計、數據收集還是後續的數據分析、論文撰寫,每一個步驟都需要花費很多時間和精力,如果前面的設計或者數據收集做的不好,那麼很多時間就白花了。

所以,李一諾不是說,「開始八篇論文才能發表一篇」。這是研究者應做的心理準備。也是研究者應該為自己驕傲的原因。

寫實證文章時,結構安排上有套路可循嗎?

有。簡單來說,實證文章的結構須涵蓋以下幾個部分:

  • 交代研究問題
  • 探討研究問題的重要性和綜述文獻
  • 提出假設1,假設2,假設3…
  • 介紹你的數據,收集過程,和變數的測量
  • 列出數據分析結果
  • 結論

僅此而已。

但這不重要。

真正重要的是要理解實證文章背後的行文邏輯:為什麼要這樣行文?為什麼要有各個部分的內容,比如為什麼一定要有研究假設、數據收集、數據結果?為什麼要介紹變數的測量方法?為什麼這一部分要放在那一部分在前面?為什麼要寫出研究的局限和後續研究展望?…..

本質上來講,你要真正理解實證研究背後的信仰:不經過事實驗證的都不能算作是真正的知識。

因為這種假設,實證研究里數據的角色特別重要,所以數據一定必須是客觀的、真實的、準確的,不能有一點弄虛作假成分的

想起我導師教給我,所有放原始數據的文件夾都命名為」Raw data—don』t touch!!」----就怕原始數據因為各種原因出現了錯誤,導致最後分析結果功虧於潰,前功盡棄。

這種對客觀數據的尊重、一絲不苟,也是對事實、客觀世界、和真理的敬重。

我們不是可以篡改知識真相的人,我們只是觀察者,是去努力接近真實世界本質的人。我們更無資格去誤導繼來者。

最後,我不做實證研究不行嗎?

行,當然行。不做實證研究依然可以非常厲害,我曾真誠地表達過我對理論研究者的敬意,因為不是誰都有能力做純理論構建的。所以絕沒有要所有人都去只做實證研究的意思。

但同時,我會鼓勵和支持從沒有做過實證研究的社會科學研究者至少親手、完整地參與一次實證研究。這是因為:

  • 親手做一次實證研究能幫你理解為什麼實證研究現在這麼主流、這麼流行;
  • 你能更好的理解實證研究跟理論研究到底有哪些不同;
  • 你再學研究方法時,能夠更好的理解為什麼我們要去鑽研如何訪談、如何設計問卷、如何抽樣的那些細節;
  • 你以後讀文獻的時候會遇見很多實證性研究,自己做過實證研究之後看別人的文章會看得更明白、更快、也更能看出文章的好壞;
  • 你也許會從此愛上實證研究,而多了一條研究的主線,何樂而不為呢?

所以,不如從今天開始,親手嘗試做一次實證研究吧 :)


推薦閱讀:

男權社會的科學依據
什麼才是真正的反思機制?
又是一個戊戌年,咱說好不要變法行嗎?
我們為什麼不一樣?——談學術寫作與一般寫作的不同

TAG:社會科學 | 學術研究 | 實證 |