今天真是全台灣最關心統計學的一天,補充一些資料:
怎麼知道所抽取的樣本真的能夠有效地反映母群呢?從母群中抽取樣本時,必需使樣本具代表性,推論母群情況時才不致有太大的誤差。要抽取具有代表性的樣本 ,必須同時兼顧樣本的品質與樣本大小。樣本的品質取決於選取樣本的過程,關鍵是「不偏」和「獨立」;不偏是指母群中的每個個體被選中的機會都一樣;獨立是指一個個體被選中,不 會影響其他個體被選中。
所以抽樣方法很重要。
要得到有意義的結果,該抽取多大的樣本呢?
決定樣本大小要考慮兩個因素:信心水準和抽樣誤差。
信心水準(confidence level):信心水準是以百分比來表示,意思是有多大的信心可以樣本來推論母群。通常是設定在 95%或 99%,換包話說,通常是在 95% 的信心水準或是 99% 的信心水準下,由樣本推論到母群;而大部分的研究人員都選用 95% 的信心水準。
抽樣誤差(confidence interval):或稱為誤差容忍度,一般在媒體或是學術論文中都是以正負數值來表示,如:抽樣誤差在正負 3 個百分點以內。因為是由樣本推論到母群,勢必有誤差,研究者可以容忍多大的誤差,就是所謂的confidence interval。
決定好信心水準和抽樣誤差,接下來就要計算樣本數了。網路上就有樣本數計算機只要點選信心水準(95% 或是 99%),輸入抽樣誤差和母群人數,就可以算出樣本大小。
舉例來說,如果想要調查台大學生的金錢觀,根據台灣大學 2003 統計年報台大共有 29,830 位學生,如果要針對台大學生進行抽樣,在 95% 信心水準和抽樣誤差在正負 3 個百分點以內時,必須抽取 1,030 位學生為樣本。
如果放寬抽樣誤差為 5 個百分點的話,只要抽取 379 位學生即可。如果提高信心水準為 99%,抽樣誤差一樣是 5 個百分點的話,必須抽取 651 位學生;如果信心水準是 99%,而抽樣誤差提高到 3 個百分點以內的話,則必須抽取 1,741 位學生為樣本。
所以民調通常會附上信心水準、抽樣人數、抽樣誤差等數字。
原文出自農藝女孩看世界臉書,芋傳媒經授權轉載。
評論被關閉。