問卷調查中的調研樣本數量一般按用戶基數的多少百分比來調研?
「樣本量越多越好」這個錯誤概念很多人都有。。。
首先,抽樣調查(Sampling Survey),就是以俱有代表性的樣本架構來代表整體。為甚麼?能做普查(Census)就不需要去代表啦!再者,問卷調查是屬於定量調研,會涉及樣本量,而座談會(Focus Group Discussion,或一些國家如日本韓國美國會叫Focus Group Interview, 我個人比較傾向於FGD的叫法,這叫做Discussion,討論,是需要互動,而Interview就是你問我答的機械化模式)是定性調研方式,不講求樣本量這玩意兒。看到有人回答說座談會什麼二三十樣本。。。這個我每次看到都抓狂。。。
就如我們看一幅圖片,像素高低其實關鍵在於我們要放大到多大,要看得多仔細。如果我們看到一個圖片目的只是想知道是男是女,或者是長頭髮短頭髮,像素不需要太高。抽樣(Sampling)的樣本數量也是同理。因為是抽樣,肯定有統計誤差,樣本量大,誤差範圍也相對降低,就是說像素高,不容易看錯而已。所以如果要分析得仔細,要看到比如說每個城市裡面的一些特徵等等,就要在城市樣本上做到足夠分析的量。
為甚麼樣本量不需要太大?因為Sampling Error(抽樣誤差)基於:Confidence Level,Standard Deviation在決定。在最典型的數據分佈上,基本是Normal Distribution,也就是Bell Curve類型的分佈,樣本最大的Deviation會是在50% Percentile上,然後我們看看在不同的Confidence Level上的Z value,再計算出不同樣本量再最大Deviation上的區別。我們會發現,樣本量如果達到一定程度,再繼續往上加,這個數據的誤差區域不會有太大太明顯的縮小。每個調研的投入和產出還是要衡量的(除非錢多沒地方花)。所以,樣本只要足夠給我們特定用途上得到大家有信心的指引就可以了。
就是說,如果抽樣方式正確,也就是說能夠達成俱有代表性的樣本,關鍵就是在數據使用者對這個統計誤差的容忍程度上了!
在Infinite Universe和Finite Universe上(不好意思,中文不知道叫什麼,不過Universe在統計學裡不是宇宙的意思哦!只是「全部」調查目標的意思),樣本量和誤差範圍的計算方式有些不一樣,如果有興趣,可以自行查看教科書。首先看你的調研方式,定性FGI通常人少點,定量調研量大點。
然後,說實話,看預算→ →
補充一點,樣本量的選擇不需要根據你的總用戶數來定。從統計學上講,一般三百多個樣本就能夠達95%的置信度。再加樣本也只是浪費錢而已。各個行業有所不同吧。剛看到 @伍勇 的答案說20%,別逗了,我們公司一年賣上百萬輛車,那我們得找多少樣本?
像我們新車上市調研的話,一般一個城市的樣本也就在在200左右。這還只是定量調研。定量結束後會從中選取定性調研對象,也就二三十個人而已。最主要的一點是:樣本要有代表性,而並不是樣本越多越好。選取了不正確的樣本,反而不利於形成準確客觀的調研結論。而且,如果一個產品的客戶有數萬甚至更多,都作為調研對象的話,那調研需要多少預算?調研問卷你需要處理多長時間?
最好能做到Sampling樣本可以涵蓋多個人群特徵:年齡,性別,職業,收入,等等……一般我們會給調研公司一個抽樣框架(Sampling Frame),他們來尋找我們需要的受訪者。
========================================
看到下面 @謝丹 的答案說「看到有人回答說座談會什麼二三十樣本。。。這個我每次看到都抓狂。。。」
我也很抓狂,我說過這些樣本都放在一起做定性訪談么?
在每個城市我們的FGD(Focus Group Discussion)樣本確實是二三十人甚至更多,但是我們並不會把他們聚到一起只做一個FGD,一般會分為幾個小組,比如接受組,拒絕組,潛在用戶組,等等……每個小組一般不會超過六個人。
而且這只是一個城市的樣本,一般一個新車診斷調研項目(Car Clinic),我們總的定性調研樣本可能接近一百人,因為不光有FGD,還有一對一訪談,用戶日記,動態試駕以及經銷商走訪,所以,座談會二三十個樣本很多麼?我會告訴你我們有些項目的定性樣本有數百人么?
再重複一下我在答案開頭寫的那句話:各個行業有所不同。所以不要用自己行業的標準去衡量別人。推薦閱讀:
※那些做了很多壞事,傷害了很多人的人最終會得到報應嗎?
※同性戀占人群比例是如何得出的?
※做調查問卷類的網站靠譜的有哪些?
※你會因女生身上什麼特質而喜歡上她?
※在網上做調查問卷能掙錢嗎?靠譜嗎