CHAPTER 12
抽 樣
本章大綱
抽樣的概念
抽樣的專有名詞
抽樣的原則
影響樣本推論的因素
選擇樣本的目標
抽樣的類型
隨機 / 機率抽樣設計
非隨機 / 非機率抽樣設計
混合抽樣設計
樣本大小的計算
抽樣的概念
優點:節省時間、財力、及人力資源。
缺點:只能估計或預測,有誤差的存在。
抽樣的專有名詞
母群體(Population)或研究母群體(Study population)
樣本 (Sample)
樣本大小 (Sample size)
抽樣設計或策略 (Sampling design or strategy)
抽樣單位 (Sampling unit)
抽樣架構 (Sampling frame)
樣本的統計量 (Sample statistics)
母數 (Population parameters)
抽樣的原則:原則一
在樣本的統計量與母群體的真實母數間通常都有差異存在,而其主要的原因是由於樣本中所選擇的個體不同所造成。
例:A=18,B=20,C=23,D=25。(樣本大小=2)
+
CD
+
BD
BC
AD
AC
AB
(1)與(2)間的差
母群體平均數(2) (母數)
樣本平均數(1) (樣本統計量)
樣本
抽樣的原則:原則二
樣本的大小越大,則所估計的母群體母數便越正確。
例:A=18,B=20,C=23,D=25。(樣本大小=3)
+
BCD
+
ACD
ABD
ABC
(1)與(2)間的差
母群體平均數(2) (母數)
樣本平均數(1) (樣本統計量)
樣本
樣本大小=2,樣本統計量與母數間的差在到+。
樣本大小=3,樣本統計量與母數間的差在到+。
抽樣的原則:原則三
所欲研究的母群體變項其差異越大,則樣本統計量與母群體平均數間的差異越大。
例:A=18,B=26,C=32,D=40。(樣本大小=3)
+
BCD
+
ACD
ABD
ABC
(1)與(2)間的差
母群體平均數(2) (母數)
樣本平均數(1) (樣本統計量)
樣本
A=18,B=20,C=23,D=25,(1)與(2)間的差在到+。
A=18,B=26,C=32,D=40,(1)與(2)間的差在到+。
影響樣本推論的因素
樣本大小﹔
抽樣母群體變異的範圍。
選擇樣本的目標
選擇樣本的目標:
一定的樣本大小,增加估計的精確性﹔
樣本選擇時能避免偏誤。
樣本選擇時可能發生偏誤的情形:
以非隨機的方法抽樣﹔
抽樣架構未正確且完整的涵蓋所有抽樣母體﹔
抽樣母群體的某一部分無法掌握。
抽樣的類型
抽樣的型態
隨機/機率抽樣
簡單隨機抽樣
分層隨機抽樣
分層比例抽樣
分層非比例抽樣
混合抽樣
非隨機/機率抽樣
叢集抽樣
單一階段
雙階段
多階段
定額抽樣
偶遇抽樣
立意抽樣
滾雪球抽樣
系統抽樣
隨機 / 機率抽樣設計
隨機/機率樣本須符合下列兩要件:
相等:被抽取的機率相同﹔
獨立:不受其他因素影響。
隨機/機率樣本主要的優點:
可代表抽樣的母群體﹔
可作為機率理論統計的資料。
抽選隨機樣本的方法
抽選隨機樣本的方法
籤筒﹔
電腦程式抽樣﹔
亂數表抽樣。
抽選隨機樣本的不同系統
不置回抽樣﹔
置回抽樣。
亂數表抽樣程序
確認母群體中所有抽樣單位的數量。
將每一個抽樣單位予以編號,從1號開始。
隨機選一個行與列的交會點為起始點。
步驟一
步驟二
步驟三
從亂數表中隨機選相同位數的數字。
步驟四
決定樣本大小。
從亂數表中抽選所需數量的抽樣單位。
步驟五
步驟六
隨機 / 機率抽樣設計的種類
簡單隨機抽樣(Simple random sampling)
分層隨機抽樣(Stratified random sampling)
叢集抽樣(Cluster sampling)
簡單隨機抽樣的步驟
確認母群體中的每一個抽樣單位,並予以編號。
決定樣本大小(n)。
以籤筒、亂數表、或電腦程式來抽選樣本。
步驟一
步驟二
步驟三
分層隨機抽樣的步驟
確認母群體中的每一個抽樣單位。
決定母群體的分層數(K)。
每個個體分到適當的分層中。
步驟一
步驟二
步驟三
將每個分層內的個體予以編號。
步驟四
決定樣本大小。
決定使用比例或非比例分層抽樣。
步驟五
步驟六
分層隨機抽樣的步驟(續)
分層非比例抽樣
分層比例抽樣
步驟七
決定每一層要抽出的個數。
步驟八
以簡單隨機抽樣抽出每一層所需的個數。
步驟七
決定每一層佔母體的比率(p)。
步驟八
以簡單隨機抽樣抽出每一層所需的個數。
決定每一層需抽出的個數(樣本大小) × (p)。
步驟九
叢集抽樣
將抽樣母體分成若干團體,稱為“叢集”。
對每個叢集使用簡單隨機抽樣,抽出所需個數。
範例:
非隨機 / 非機率抽樣設計
定額抽樣(quota sampling)﹔
偶遇抽樣(accidental sampling)﹔
立意抽樣(judgemental or purpose sampling)﹔
滾雪球抽樣(snowball sampling)。
定額抽樣
主要考量:
很容易接近母群體的便利性﹔
研究者受母群體一些顯而易見的特質所引導。
優點:
花費最少的抽樣方法﹔
不需要母群體的相關資訊﹔
保證所抽選的人確為研究所需的人。
缺點:
樣本非隨機樣本﹔
抽選個體具有某特質,無法代表母體。
偶遇抽樣
主要考量:
很容易接近母群體的便利性。
優、缺點與定額抽樣相似。但是較無法獲得所想要的資訊。
應用面:
市場調查﹔
新聞報導。
立意抽樣
研究者僅選擇具有所需資訊的人來訪問。
應用面:
建構歷史真相﹔
描述現象﹔
發展鮮為人知的事實。
滾雪球抽樣
使用網絡來選擇樣本的過程。
應用面:
溝通型態﹔
決策﹔
團體中知識的傳播。
缺點:
整體樣本的選擇依賴第一次所接觸的人。
母群體很大不適用。
混合抽樣設計(系統抽樣設計)
第一個體以簡單隨機抽樣產生,其餘個體以等距方式抽出。
範例:
50
49
48
47
46
45
44
43
42
41
40
39
38
37
36
35
34
33
32
31
30
29
28
27
26
23
10
22
9
21
8
19
6
18
5
17
4
16
3
13
25
12
24
11
20
7
15
2
14
1
抽樣架構
Interval (k)
3
48
43
33
28
23
18
38
13
8
抽選出樣本
Interval (k)
Interval (k)
系統抽樣的步驟
準備所有抽樣單位(N)的名冊。
決定樣本大小(n)。
決定等距的寬度= = (K)。
步驟一
步驟二
步驟三
以簡單隨機抽樣抽選第一個個體。
步驟四
相隔等距依序抽出其餘個體。
步驟五
決定樣本大小的考慮因素
信心水準的範圍?
估計母群體參數的正確程度?
估計研究變項的變異程度?
研究預算?
決定信心範圍的公式
公式:
=母群體平均數的估計值
=樣本平均數
=95%的信心水準
=標準誤
=標準差
=樣本大小
範例
假設決定容忍的誤差,表示:
換句話說,希望 或
t值
信心水準
值的獲得方式
猜測﹔
諮詢專家﹔
由先前相似的研究中獲得﹔
先以試測(pilot study)來計算。