問卷調查中的調研樣本數量一般按用戶基數的多少百分比來調研？

01-26

「樣本量越多越好」這個錯誤概念很多人都有。。。

首先，抽樣調查（Sampling Survey），就是以俱有代表性的樣本架構來代表整體。為甚麼？能做普查（Census）就不需要去代表啦！再者，問卷調查是屬於定量調研，會涉及樣本量，而座談會（Focus Group Discussion，或一些國家如日本韓國美國會叫Focus Group Interview, 我個人比較傾向於FGD的叫法，這叫做Discussion，討論，是需要互動，而Interview就是你問我答的機械化模式）是定性調研方式，不講求樣本量這玩意兒。看到有人回答說座談會什麼二三十樣本。。。這個我每次看到都抓狂。。。

就如我們看一幅圖片，像素高低其實關鍵在於我們要放大到多大，要看得多仔細。如果我們看到一個圖片目的只是想知道是男是女，或者是長頭髮短頭髮，像素不需要太高。抽樣（Sampling）的樣本數量也是同理。因為是抽樣，肯定有統計誤差，樣本量大，誤差範圍也相對降低，就是說像素高，不容易看錯而已。所以如果要分析得仔細，要看到比如說每個城市裡面的一些特徵等等，就要在城市樣本上做到足夠分析的量。

為甚麼樣本量不需要太大？因為Sampling Error（抽樣誤差）基於：Confidence Level，Standard Deviation在決定。在最典型的數據分佈上，基本是Normal Distribution，也就是Bell Curve類型的分佈，樣本最大的Deviation會是在50% Percentile上，然後我們看看在不同的Confidence Level上的Z value，再計算出不同樣本量再最大Deviation上的區別。我們會發現，樣本量如果達到一定程度，再繼續往上加，這個數據的誤差區域不會有太大太明顯的縮小。每個調研的投入和產出還是要衡量的（除非錢多沒地方花）。所以，樣本只要足夠給我們特定用途上得到大家有信心的指引就可以了。

就是說，如果抽樣方式正確，也就是說能夠達成俱有代表性的樣本，關鍵就是在數據使用者對這個統計誤差的容忍程度上了！

在Infinite Universe和Finite Universe上（不好意思，中文不知道叫什麼，不過Universe在統計學裡不是宇宙的意思哦！只是「全部」調查目標的意思），樣本量和誤差範圍的計算方式有些不一樣，如果有興趣，可以自行查看教科書。

首先看你的調研方式，定性FGI通常人少點，定量調研量大點。

然後，說實話，看預算→ →

補充一點，樣本量的選擇不需要根據你的總用戶數來定。從統計學上講，一般三百多個樣本就能夠達95%的置信度。再加樣本也只是浪費錢而已。

各個行業有所不同吧。剛看到 @伍勇的答案說20%，別逗了，我們公司一年賣上百萬輛車，那我們得找多少樣本？

像我們新車上市調研的話，一般一個城市的樣本也就在在200左右。這還只是定量調研。定量結束後會從中選取定性調研對象，也就二三十個人而已。最主要的一點是：樣本要有代表性，而並不是樣本越多越好。選取了不正確的樣本，反而不利於形成準確客觀的調研結論。而且，如果一個產品的客戶有數萬甚至更多，都作為調研對象的話，那調研需要多少預算？調研問卷你需要處理多長時間？

最好能做到Sampling樣本可以涵蓋多個人群特徵：年齡，性別，職業，收入，等等……一般我們會給調研公司一個抽樣框架（Sampling Frame），他們來尋找我們需要的受訪者。

========================================

看到下面 @謝丹的答案說「看到有人回答說座談會什麼二三十樣本。。。這個我每次看到都抓狂。。。」

我也很抓狂，我說過這些樣本都放在一起做定性訪談么？

在每個城市我們的FGD（Focus Group Discussion）樣本確實是二三十人甚至更多，但是我們並不會把他們聚到一起只做一個FGD，一般會分為幾個小組，比如接受組，拒絕組，潛在用戶組，等等……每個小組一般不會超過六個人。

而且這只是一個城市的樣本，一般一個新車診斷調研項目（Car Clinic），我們總的定性調研樣本可能接近一百人，因為不光有FGD，還有一對一訪談，用戶日記，動態試駕以及經銷商走訪，所以，座談會二三十個樣本很多麼？我會告訴你我們有些項目的定性樣本有數百人么？

再重複一下我在答案開頭寫的那句話：各個行業有所不同。所以不要用自己行業的標準去衡量別人。