如何在設計的問卷中對職業的種類進行劃分?

大四狗一枚,正在為畢業論文設計問卷,其中一道題涉及到對被訪者職業的詢問,但是對於職業的分類怎樣都分不好,求大神指點,在問卷中要如何進行職業分類?


專註問卷設計數年,這個問題,我必須怒答之。

一、先糾正錯誤思路。
千萬不要照抄@信德維拉(這頭像,我真心喜歡)提供的職業分類,否則涉及職業變數的統計回歸將毫無意義,假若碰到一個較真的老師,你的畢業論文會死的很慘。

為何?

你做的是畢業論文,有效樣本撐死500個。國家統計局和西南財經大學(CHFS的主持者)做的研究,有效樣本起碼幾K。這在統計中是存在質的差距。

換言之,樣本規模和分類個數之間存在正相關,多大樣本規模就適應多少個分類。要根據你的樣本量來確定你的單變數的分類個數——職業有多少個分類

職業分類相當於統計研究中的分類變數,在統計中,每一個分類都算一個變數。
我想,題主做了問卷,那總是要跑數據吧,那我就以本科階段常用數據統計軟體SPSS作為例子。
用過SPSS的都知道,凡是分類變數,每一個分類都是一個變數,反映在變數視圖這樣的:

與之對應,教育程度作為一個定序變數(小學、初中、高中、大學),只需佔一個變數空位。這反映到數據視圖就是這樣

(這兩個圖是我自己為回答問題臨時用SPSS做出來,其中職業分類不能作為參考)

題主既然要做問卷,就是要做定量分析,那就是要做回歸統計咯。
於是無論如何,你的研究都會涉及方差分析,會出現一個類似的回歸方程:
Y=d_{1}  +d_{2} +d_{3} +bx+alpha
Y是你要解釋的因變數,d就是你的職業變數,d_{n} 就是職業分類,專業點講叫虛擬變數,x則是定距變數(我們假定就是收入吧),alpha 則是常數。
要使這個方程有意義,至少在每一個變數上都存在一定的樣本數量,至於數量大小就按你的抽樣方式來定。樣本數量過小,即使是0樣本,沒有腦子的統計軟體還是會根據數學方程給出一個回歸數據,告訴我們這個關係是否是顯著的,但是那個數據是沒有任何推論意義的,換言之其研究結論不能適用於到樣本代表的群體,也就不具有現實意義的。當然,如果該研究是地道的簡單隨機抽樣,設多少分類都沒關係——但是,誰見過哪個社會研究真能做到簡單隨機抽樣?敢這麼說的,大概都會被專業人士呵呵一臉吧。

二、解答問題:不存在權威正確的職業分類,只存在適合你研究目標的職業分類

先捫心自問以下幾個問題:
1.我的研究問題到底什麼?
2.該用什麼方法來做研究,研究針對範圍有多廣?全國?全省?還是局限於學校?有必要做定量研究么?
3.如果要做定量研究,我的先期準備有沒有做好?比如有沒有認真研究相關研究文獻,有沒有組織過幾次訪談。
4.能否把研究問題具體化成一個變數關係假設?
5.採用什麼抽樣方法?分層抽樣?路遇抽樣?整群抽樣?
6.樣本規模有多大?問捲髮放量有多大?如何保證問卷回收情況?
7.受訪人員會配合我的研究么?會不會就隨意一填了事?
如果題主能通過這幾個問題,這樣就可以進行定量研究,至少在大方向,題主的論文不會有大問題。
題主沒有給出具體的研究設計方案,說實話,真的很難給你答覆。我就在這裡假設一下,但願有一點參考意義。
比如,研究代際影響,如父母職業對子女高考成績是否有影響,影響有多大。
1.先翻翻文獻,看看國內靠譜的研究是怎麼做的。學生黨最愛的CNKI,上面的研究絕大多數都很不靠譜,注意分辨,如果實在不濟,就選幾個重要的刊物,如社會學研究,北京大學學報等等,如果能找外文自是不錯,美國在代際研究方面已經做了很精深了,我個人會去看看美國同行怎麼做。
2.至少組織一次小組訪談,這是一種以最快的速度了解最多的信息的好辦法。
3.然後,作出研究假設,
這是我自己杜撰的——公職人員,教師會對子女的高考成績有顯著正影響,其次是企業內的管理人員,最末是基層員工和農民,他們甚至可能有負作用。
4.因為我的有效樣本規模只有200個,根據之前的研究假設,我的職業分類會有重點的突出公職人員、教師、企業內管理人員這幾項,結果分類就是這樣:


1.公職人員(含公務員,和除教師外的事業單位人員) 2.教師 3.企業管理人員 4.工人(含農民工) 5.農民 6.個體戶

@白志楊 專業沒學好,該打屁股了,有空請我來做家教,保你重拾專業基礎,不要錢,管飯就行。


可參照的資料包括:

  • 國家數據國家統計局的年度數據中,就業人員和工資一項內的分類。
  • 中國家庭金融調查CHFS對職業的分類。


如果需要比較全的話,不是隨便填填就完事的,推薦一個實際中用得比較多的,如果結合職務和學歷的話,就更全面了


1各級政府部門、企事業單位、黨政機關和公眾團體的領導者

2專業技術人員(教師、醫生、工程技術人員、作家等專業人員)

3職員(從事一般性事務工作的人員)

4商務人員 5第三產業服務人員

6產業工人 7從事農林牧漁業的勞動者

8家庭主婦 9學生 10私營企業主

11失業 12離退休人員 13其他


職業劃分作為選項,需要滿足的一個重要條件是「完備性」,即任何一類職業在選項中都可以有自己合適的選擇。為什麼大家樂於參考現有普遍認可的調查問卷的職業劃分方式?因為一方面這些問卷往往是被嚴謹設計過的,能保證完備性,另一方面這些劃分方式也是大家普遍認可的。所以,我覺得參考現有問卷的劃分方式未嘗不可。

自己隨便進行職業劃分,如果答辯老師問有什麼依據就可能啞口無言了,參考普遍認可的問捲起碼算是一種依據吧。當然,如其他回答者所說,如果根據你的研究目的與研究對象特徵,自己有更合適的劃分不是沒有可能的,但是如果自己沒有一個嚴謹的分析過程,個人認為,還真不如參考一個現有普遍公認問卷的劃分方式。如果某類職業的選擇者為0,自己統計一下數據發現這列數據都是0,就直接刪除就好了。(stata軟體這種情況下是自動就不進入回歸的。)另外,如果根據現有問卷的職業劃分方式,自己搜集好數據以後發現,有些職業樣本量太少,不具分析價值,可以自己把這些類別合併為「其他」,總之,搜集詳細的數據對於數據分析來說是不會「吃虧」的,缺陷是增加了回答難度。

另外,教育水平進入回歸一般有兩種方式,一種是教育年限,比如小學6年,初中9年,高中12年,大學16年等等,此時是以一個連續變數的形式進入回歸;另一種是以離散變數的形式進入,量化分析術語叫做虛擬變數,類似於職業的進入方式,如果有n類教育水平,就生成n-1個虛擬變數。至於小學取1,初中取2,高中取3……這種生成方式幾乎沒在正規發表研究中看到過,本身也不科學,它相當於假設小學6年教育、初中3年教育和高中3年教育對因變數的影響是等同的。


推薦閱讀:

TAG:學術 | 社會學 | 畢業論文 | 問卷調查 | 心理統計 |