Research Process: 做一個高質量的社會研究項目一般都需要涵蓋哪幾個步驟?
今天以social research 中目前最為主流的empirical research 為例說一說一般做research 的大體步驟, 為我們接下來的分塊文章打個基礎。
剛開始做research的時候感覺我們大多數人都會不知從何入手,這是再正常不過的事情。估計一般大家有這麼幾種開始的方式:從做文獻綜述開始,從收集數據開始,或者一上來就開始動筆寫。然而一個高質量的research project的每個步驟和每一部分都應該是緊密聯繫、互相牽制的,所以如果前面的工作沒做好,後面的就會受到顛覆性的影響,大有前功盡棄的危險。
這一過程還是很傷心力的。這就像舞龍表演,要想舞的精彩舞的默契,龍頭的作用總是無比關鍵,而後面每一塊龍的「肌肉」都需要緊緊相連,緊跟龍頭保持步子一直. 具體舉例,如果沒有確定一個「合格」的researchquestion 就難以知道哪種數據收集的方法得當;沒有做好literature review 就不知道在問卷中使用哪些measurementscales. 所以明確research process的順序至關重要。-----而這一點,初看起來像是老生常談,可是往往需要親自動手做了好幾個project的人才能真的有心得,恍然大悟教科書上那些話原來不是為了充數寫上去的。
所以接下來我們要介紹總體流程---今天這篇文章之所以要先出要先講,就好比一進遊樂園的門工作人員先塞給你一張地圖,讓你在遊覽之前先了解遊樂園有多大,有哪些項目,都在哪裡,然後再去每一個具體景點玩的忘情的時候會想起,嗯,不光有這個遊玩項目,我們還得記得去玩其他的呢。
OK,那就開門見山,直接展示一下最常見最正規的research process 是這樣的:
這其中每一個步驟就組成了做好social research最重要的幾個步驟,我們之後會具體講解每個步驟和researchdesign 的過程。這一篇文章的目的是讓你對於research的整體流程有個overview--拿起公園地圖準備上車啦。
Step 1:What』s your research question?
第一步就是確定「研究問題」。研究問題就是你想研究什麼,然而這裡面學問很大很大, 也經常需要很長一段時間才能把研究問題徹底確定下來。我個人經驗是,research question的創新性這一點常常比較困難----你為什麼做這個研究?之前沒有學者研究嗎?有的話你的研究有什麼不同?沒有的話你有沒有考慮過為什麼別人沒研究呢?你問的這是一個重要的research question嗎?---以上這些問題還都是第一層面的,第二層面,你要確保這個research question 不是too broad or too narrow,而要適合手頭的資源和時間---這個對於新手來講可不是一件容易事。每次在researchmethods的課上我都會要學生做一個term paper, 大概第三第四周的時候要求學生確定題目,然後不出意料的,有四分之三的都需要重新改動,因為不是題目太大就是題目太小,不適合作為一個term paper. 另外research question 還是跟literature review 緊密相連的, 逐漸narrow down的過程也是通過讀越來越多的相關literature 而完成的,這其中牽涉出如果科學有效的做literaturereview和管理lit review的問題。Research question確立的時候也要考慮到之後research design 的打算,所以常常花好幾個月的時間,一般來說,具體research question確定下來的時候,其實大體的research design都已經規划出來了。
Step 2:What are your hypotheses?
有了研究問題要問自己,我文章里要做怎樣的研究假設?研究假設就是你還不知道答案的時候,你先立在那裡的靶子----一般都是在empirical study里, 並且是quantitative research的時候才立研究假設,有了研究假設,後面的部分就是要試圖reject/accept這個假設。 這裡要注意,hypotheses 和proposition還是不一樣的,我們講hypothese 的時候再專門說。
舉個例子,這些年美國關於貓和狗的研究很多,而且日新月異的,一般我們對於貓一直有個普遍看法就是貓沒有狗那麼sociable, 喵星人們貌似並不是很需要人的陪伴,而且有的時候跑來湊人又多半是為了得到主人給提供的小魚乾。然而這只是一種大眾的普遍看法,真正想通過research得出科學的結論怎麼辦呢?那就得先確定研究問題 (例如,research question= 貓是更喜歡跟人接觸呢還是更喜歡小魚乾呢?),然後就是設定hypotheses: 根據人們的習慣看法,我假設「貓是喜歡小魚乾勝過喜歡跟人的接觸的」。 好,這些都要列下來,放到文章里,還要在每一個你所設定的hypothesis前面通過聯繫現有文獻來論證你為什麼這樣設定這個假設,接下來的文章部分就是奔著去證明這個hypothesis是否正確了。
你可能會問,為什麼要有hypothesis呢?我有了研究問題就直接去發現不久行了嘛?這個跟statistics裡面用到的分析方法有關係,做回歸分析和線性分析的時候我們需要現有假設,然後看置信區間裡面多大可能會reject這個假設。如果非要簡單來說的話,就是為了讓結論非常靠譜非常嚴謹,不僅我要知道我使用的數據能不能support或者reject某一個假設,我還得知道我有多大把握。
Step 3:How do you test your hypotheses?
現在我有了一個關於貓喜歡小魚乾的假設,我如何驗證假設呢?這個時候research design就開始了。大概我們都會想到的一個辦法就是讓人和小魚乾分別出現在喵星人的身邊,看貓咪對哪個更有熱情。但如果某隻喵星人一直自助餐所以不需要小魚乾,但是卻5天都沒見到人了,這種情況下這隻貓即便對人很熱情也不能就證明喵星人喜歡人比喜歡食物多對吧?另外,還有sample size (抽樣數量)的問題,就是我調查多少只貓才能算是足夠做出某個結論呢?1隻肯定不行的吧?5隻也肯能不夠吧?那麼50隻,500隻,要多少才行呢?另外,貓的種類還不同呢,我是不是急需要測短毛貓又要有暹羅貓?既要測普通家養貓,又要側shelter寄養的貓?(因為家貓和shelter的貓脾氣性格真的很不一樣)socialscience最神奇的地方就在這裡:沒有任何兩個人的research design 會是完全一樣的,所以你做的東西,你設計出來的data collection, 你的對照組設計,你用的measurement, 都會是你research的特色, 做出來之後才會讓你有迷人的小驕傲啊。
Research design的過程像是在給一個建築物畫圖,一旦完成,後面的就是按照圖來執行了,比如收集數據, 清理數據,分析數據,這些其實早都設計好了步驟,絕不該是去受了數據才決定的---否則在收數據的時候怎麼知道問什麼問題,要誰來回答呢?
Data collection----measurement-----survey question----data analysis 這幾個步驟需要完全consistent起來,前後對照著設計,根據research question的不同可以千差萬別,研究設計也沒有最好只有更好。是的,到底如何設計一個research是沒有標準答案的。
Step 4:Data Collection (數據收集)
收數據和分析數據是我最喜歡的兩個過程,收數據的興奮點在於接觸人和approach truth的過程,而分析數據的興奮點在於發現自己的hypotheses 真的被驗證為成立的時候("I"m a genius!")。
Data collection裡面的data,中文譯文並不很好用,「數據」聽上去必須有個數才行,然而data 可以使定量也可以是定性的,所以訪談的內容也是數據,調查問卷定量或定性的內容也是數據,focusgroup (集體式訪談)的採訪結果也是數據,從被調查者那裡收集來的信息就是數據。
數據收集給了我們很多可能去接觸不同的人,了解不同的世界。我是一個喜歡了解不同事物的人,對於我們大多數人來說卻只能過自己的生活,無論你的職業是什麼,你每天做的事情做久了就逐漸習慣了低頭挖自己的礦,搬自己的磚,而不知道別的礦里都有什麼。收集數據給我們一個得天獨厚的機會去了解別的礦里和別人的山頭上士什麼樣的風景,而且我們可以以一個完全中立的researcher的身份去做這件事情,去旁觀,去記錄,不用帶主觀臆斷的去收集信息。而這一記錄社會上各種現象的過程,本質上講是人類自己研究和學習自己的過程,去研究人類創造出來的社會,這社會裡面形形色色的機構和組成,解釋為什麼不同人會有不同的行為,甚至去預測在什麼情形下人會有什麼反應,就像預測行星的運行軌道。這本身在我看來是再有意義不過的事情。
Step 5: Data Process—data cleaning, transform (數據處理)
數據收集來了叫做raw data, 不是可以立刻就分析的,我們要把它變成能夠分析的形式,這個過程統稱data process,根據不同情況包括data cleaning,variable transform, variable combine等等。這個過程就像製作玩具模型的時候修掉邊邊角角,讓玩具模型變得規規矩矩,然後才你才可以準備開始搭積木構建大作品。
Step 6:Data Analysis (數據分析)
這是出核心東西的階段,就像我們去檢查身體驗血的時候,血樣(data)已經採好了,貼上標籤放在一處,然後就可以拿機器過來分析血液成分。
常用的方法根據定性和定量的數據的不同而不同,定性的常用方法包括thematic coding, 定量的包括correlation analysis, crosstab, linearregression, 等等。分析方法五花八門而且還在不斷湧出,請注意對於一個研究問題並沒有一個完美的data analysis方法,而只更為合理的,更可以接受的分析方法。社會科學家們通常在大腦中儲存在一個龐大的工具箱,裡面有各種dataanalysis的方法,並不是所有工具都需要同時拿出來用,最重要的是知道遇見什麼問題該把哪樣工具拿出來---該用剪刀的時候你拿鎚子是沒有用的,雖然我也不會阻止你。
Step 7:Write your report. (生成報告)
這一步就是生成最後的研究報告了,報告的形式可能是一篇conference paper, 或者是準備投稿的manuscript,或者是一篇term paper, 也可能是executivereport. 無論你的研究結果想生成什麼,大體結構都是離不開要闡述清楚你這個研究的research question,為什麼要研究這個,如何研究的 (methodology and data), 如何分析的,還有得出了什麼結論。這幾塊是研究報告最基本的模塊。
---------------------------------------------------------------------
先說這麼多,希望你心裡已經對遊樂園的地圖有個大概的印象了。等到我們深入聊不同部分的時候,你也可以經常回這篇文章來看看為什麼我們要care某一個環節,以及它和其他部分是怎樣聯繫起來的。
-----------------------------------------------------------------------
另外,關於貓更喜歡吃小魚乾還是更喜歡跟人social的研究,科學家真的做了實驗,對喵星人感興趣的小夥伴read more here:
Cats Are Actually Nice, Scientists Find
推薦閱讀:
※先記單詞書,還是直接從試題中積累單詞來記憶,哪個更科學更好?
※我學新聞傳播,最近看傳播學定量和定性研究方法,沒搞明白。有沒有人替我解釋下這兩個區別(最好結合例子)?
※怎麼辨析傳播學研究中的文本分析、話語分析、內容分析?
※如何培養一個興趣愛好並能夠保持深入研究?