此处是大标题样稿字样十五
字以内
學習目標
. 學習為學習為何何樣樣本本經經常是唯一用常是唯一用來認識來認識母母體體的途的途徑徑。。
. 學習學習如何抽取如何抽取樣樣本本。。
. 學習樣學習樣本平均本平均數數之抽之抽樣樣分配分配。。
. 學習學習中央中央極極限定理限定理。。
. 學習樣學習樣本比例之抽本比例之抽樣樣分配分配。。
. 學習學習 t t 分配分配。。
本章架構
抽抽樣樣
抽抽樣樣方法方法
統計統計量量與與抽抽樣樣分配分配
樣樣本平均之抽本平均之抽樣樣分配分配
樣樣本比例之抽本比例之抽樣樣分配分配
t t 分配分配
抽抽樣樣
母母數數(parameter) (parameter)
由母由母體測體測量出用量出用來來描述母描述母體體特徵的特徵的數數值值,,如母如母體體平平
均或母均或母體變異數體變異數。。
誤誤差差(error)(error)
母母數數真值真值與與由由樣樣本所得到之估本所得到之估計計值的差值的差。。
抽抽樣調樣調查查實實例例——電視電視收收視視率率調調查查
以以國內國內的收的收視視率率調調查公司查公司來來看看,,共分共分幾種幾種不同的不同的類類型型,,ACAC
尼尼爾爾森公司以森公司以裝設裝設people-meterpeople-meter來進來進行家行家戶戶收收視調視調查查。。潤潤利利
收收視視率率調調查公司所做的收查公司所做的收視視率率調調查查則採則採用分用分層隨機層隨機抽抽樣電樣電
話訪問話訪問的方式的方式,,與潤與潤利相同的利相同的還還有天和水行有天和水行銷顧問銷顧問公司公司
((僅僅作作廣廣播收播收聽聽率率調調查查))。。此外此外,,從從民民國國八十九年起八十九年起,,財財
團團法人法人廣廣播播電視電視事事業發業發展基金也加入收展基金也加入收視視率率調調查的查的準備準備工工
作作,,與與日本的收日本的收視視率率調調查公司合作查公司合作,,先期以先期以進進行行電視電視收收視視
行行為調為調查和查和廣廣播收播收聽聽行行為調為調查研究查研究為為主主。。
以以現現有的收有的收視視率率調調查技查技術術而言而言,,其其調調查查僅僅以量化的衡量以量化的衡量為為
原原則則,,無無法法進進行行質質的的調調查查。。若若僅僅作作為節為節目品目品質評質評定的定的單單一一
標準標準,,在在說說服力上略服力上略顯顯不足不足,,因因為為收收視視率率調調查查為為一一「「點點人人
頭頭式式」」的的調調查方式查方式,,可算出可算出「「有多少人正在看有多少人正在看」」,,但但卻無卻無
法法調調查收查收視視者者對該節對該節目的目的優優劣劣評價評價,,因此因此,,收收視視率高低率高低與與
節節目品目品質並無質並無直接直接關係關係。。
抽抽樣樣((續續))
誤誤差的差的來來源源
1. 抽抽樣誤樣誤差差(sampling error)(sampling error)
由由隨機隨機抽抽樣樣代替普查所代替普查所發發生之不生之不
確確定性定性。。
2. 非抽非抽樣誤樣誤差差(nonsampling (nonsampling
error)error)
其他其他種種種種非因非因隨機隨機抽抽樣樣之不之不確確定定
性所造成的性所造成的誤誤差差,,包括包括樣樣本本選擇選擇
偏差偏差(sample selection bias)(sample selection bias)、、測測
量偏差量偏差(response bias)(response bias)以及自我以及自我
選擇選擇偏差偏差(self-selection bias)(self-selection bias)。。
抽抽樣樣((續續1)1)
非抽非抽樣誤樣誤差的差的來來源源
1. 樣樣本本選擇選擇偏差偏差(sample selection (sample selection
bias)bias)
由於抽由於抽樣樣方法的不正方法的不正確確所造成的所造成的 。。
2. 測測量偏差量偏差(response bias)(response bias)
包含了包含了資資料料記錄錯誤記錄錯誤、、受受訪訪者故者故
意提供不意提供不實資訊實資訊等等。。
3. 自我自我選擇選擇偏差偏差(self-selection (self-selection
bias)bias)
包含了受包含了受訪訪者拒者拒絕絕回答回答、、或在或在 call call
-in -in 投票中投票中,,投票者通常是有主投票者通常是有主動動
傾傾向且有向且有強強烈意烈意見見者者 。。
抽抽樣樣方法方法
簡單隨機簡單隨機抽抽樣樣(simple random sampling)(simple random sampling)
分分層隨機層隨機抽抽樣樣(stratified random (stratified random
sampling)sampling)
部落抽部落抽樣樣(cluster sampling)(cluster sampling)
系系統統抽抽樣樣(systematic sampling)(systematic sampling)
非非隨機隨機抽抽樣樣(nonrandom sampling)(nonrandom sampling)
抽抽樣樣方法方法實實例例——電腦輔電腦輔助助電話訪問電話訪問系系統統
近年近年來來,,國內國內的民意的民意調調查查幾幾乎都乎都採電話訪問採電話訪問方式方式來來
進進行行。。主要原因是主要原因是電話電話在在國內國內普及率已近普及率已近99%99%,,幾幾
乎家家都有乎家家都有電話電話,,無無法接受法接受電話訪問電話訪問的民的民眾極眾極少少。。
電腦輔電腦輔助助電話訪問電話訪問系系統統(Computer Assisted (Computer Assisted
Telephone Interviewing SystemTelephone Interviewing System,,簡稱簡稱CATIS) CATIS) ,, 利利
用用電腦儲電腦儲存存電話號碼電話號碼的母的母體體清清冊冊,,利用利用電腦電腦程式程式執執
行行統計統計的的隨機隨機取取樣樣,,架架設問設問卷在卷在電腦電腦中中,,然後由然後由電電
腦腦直接自直接自動撥號動撥號,,訪員訪員在在線線上直接上直接鍵鍵入入訪問結訪問結果果,,
再再經經由由電腦電腦的的監聽監聽、、看看、、錄錄系系統統,,更有效的管理更有效的管理電電
訪訪的的執執行行,,使民意使民意調調查在查在統計統計抽抽樣調樣調查查執執行技行技術術上上
的可能缺失的可能缺失減減到最低程度到最低程度。。
簡單隨機簡單隨機抽抽樣樣
定定義義
使得母使得母體內體內所有可能抽出的所有可能抽出的樣樣本被抽出的本被抽出的機機率均相等率均相等,,
而由而由這種這種方法所抽出的方法所抽出的樣樣本就本就稱為簡單隨機樣稱為簡單隨機樣本本
(simple random sample)(simple random sample),,或或簡稱為隨機樣簡稱為隨機樣本本( (
random sample)random sample)。。
重要的重要的統計統計特特質質
. 不偏不偏(unbiased)(unbiased)
母母體內體內每一每一個體個體被抽到的被抽到的機會機會均等均等。。
. 獨獨立立(independence)(independence)
母母體內體內某一某一個體個體被抽到被抽到與與否不否不會會影影響響其他其他個體個體被被
抽到之抽到之機會機會。。
簡單隨機簡單隨機抽抽樣樣((續續))
優點優點::
. 母母體體名名冊冊完整完整時時,,樣樣本抽取方便本抽取方便,,方法方法簡單簡單 。。
. 估估計計式式簡單簡單((樣樣本本機機率率為為定值定值,,甚至相等甚至相等))。。
缺缺點點::
. 完整母完整母體體名名冊冊不易取得不易取得,,或取得成本很大或取得成本很大時實時實行困行困
難難 。。
. 當當母母體樣體樣本本單單位位過過多多時時,,抽抽樣樣作作業業相相對對上不便上不便((如如
母母體體名名冊幾萬戶冊幾萬戶))。。
. 樣樣本分配分散本分配分散,,增加增加調調查行政作查行政作業業困困難難((如台如台灣灣地地
區區住住戶戶580580萬戶萬戶要抽要抽1800018000戶戶))。。
. 當樣當樣本本單單位差位差異異大大時時,,樣樣本代表性恐有不足本代表性恐有不足((如估如估
計計所得所得,,抽到高所得或偏低所得抽到高所得或偏低所得) ) 。。
簡單隨機簡單隨機抽抽樣實樣實例例
某公司某公司舉辦舉辦尾牙餐尾牙餐會會,,會會中中並並有抽有抽獎獎活活動動,,為為了了獎勵員獎勵員工工
這這一年一年來來的辛的辛勞勞,,公司提供一部汽公司提供一部汽車車及若干家及若干家電電作作為為抽抽獎獎
用用,,與會與會的的員員工每人工每人發給發給一一張兩頭張兩頭印有印有號碼號碼的摸彩券的摸彩券((兩頭兩頭
的的號碼號碼相同相同,,且一半且一半為為存根存根聯聯,,一半一半為為抽抽獎聯獎聯)),,撕下其中撕下其中
的抽的抽獎聯獎聯後投入摸彩箱中後投入摸彩箱中,,然後由董事然後由董事長將長將之之攪攪拌均拌均勻勻,,
依序依序請請公司各公司各級級主管抽出摸彩券主管抽出摸彩券,,以以決決定家定家電與電與汽汽車車的得的得
獎獎人人。。這這就是就是簡單隨機簡單隨機抽抽樣樣。。
分分層隨機層隨機抽抽樣樣
定定義義
將將母母體體依母依母體內個體體內個體的某些特性分的某些特性分為為若干若干沒沒有交集有交集
的的層層(strata)(strata),,務務必使必使層內層內的差的差異異小小((又又稱為稱為同同
質質(homogeneity)(homogeneity)),),而而層間層間的差的差異異大大((又又稱為稱為
異質異質(heterogeneity)(heterogeneity)))。。
母母體內體內的每一的每一個體個體均只均只屬屬於其中一於其中一層層,,再自每再自每層層中中
抽取抽取簡單隨機樣簡單隨機樣本本,,這這些些來來自各自各層層之之簡單隨機樣簡單隨機樣本本
即即構構成一分成一分層隨機樣層隨機樣本本(stratified random (stratified random
sample)sample)。。
分分層隨機層隨機抽抽樣樣((續續))
比例分比例分層隨機層隨機抽抽樣樣
(proportionate stratified random sampling) (proportionate stratified random sampling)
在每一在每一層層中所抽取之中所抽取之隨機樣隨機樣本本數數若按照每一若按照每一層層中中個個
體數體數在在總總母母體體中所中所佔佔比例比例決決定定。。
非比例分非比例分層隨機層隨機抽抽樣樣
(disproportionate stratified random sampling) (disproportionate stratified random sampling)
若各若各層層所抽出之所抽出之隨機樣隨機樣本本數數不能反映出各不能反映出各層層在母在母體體
中所中所佔佔比例比例。。
樣本
母
體
分分層隨機層隨機抽抽樣樣((續續1)1)
圖圖 分分層隨機層隨機抽抽樣樣
第一層
第二層
第三層
…
…
…
…
第K層
分分層隨機層隨機抽抽樣樣((續續2)2)
優點優點::
. 樣樣本分配本分配較較均均勻勻,,可提高估可提高估計確計確度度 。。
. 可以分可以分別別得各得各層訊層訊息息,,並並做比做比較較分析分析。。
. 各各層層可可視視情形情形採採取不同之抽取不同之抽樣樣方法方法。。
. 便於便於尋尋找找樣樣本跳本跳動動之之來來源源((如如連續連續性性調調查每季每月查每季每月
就就業業、、失失業業、、人力人力資資源源調調查查))。。
. 可在各可在各層設層設立行政立行政單單位位,,以利以利調調查方便查方便。。
限制限制::
. 分分層變數層變數之之選選取取((分分層層特性特性))需多加注意需多加注意。。
. 分分層層不能有重不能有重疊現疊現象象。。
. 分分層層後後樣樣本本資資料之整理料之整理與與估估計較簡單隨機計較簡單隨機抽抽樣複雜樣複雜。。
分分層層抽抽樣實樣實例例
交通部交通部觀觀光局光局為瞭為瞭解解週週休二日制度休二日制度實實施後施後,,對國對國人人
國內國內旅旅遊遊的影的影響響及改及改變變,,於於8787年首次年首次辦辦理理『『週週休二休二
日日實實施施對國內對國內旅旅遊遊的影的影響調響調查查』』,, 以提供政府及以提供政府及
旅旅遊遊相相關業關業者者參參考之依考之依據據。。
以各以各縣縣市之住宅市之住宅電話號碼電話號碼簿做簿做為為抽抽樣樣清清冊冊,, 即抽即抽
樣樣母母體體之之來來源源。。抽抽樣樣方式方式採採分分層層抽抽樣樣法法::臺灣臺灣地地區區
依北依北、、中中、、南南、、東東分分為為四四層層,,各各層層依照依照層內戶數層內戶數占占
台台灣灣省省總戶數總戶數的比例分配的比例分配樣樣本本數數;;層內層內各各縣縣市再依市再依
照其照其戶數戶數比例分配其比例分配其樣樣本本。。預計樣預計樣本本數數1,5001,500人人。。
以以電話訪問調電話訪問調查查,,居住在居住在臺灣臺灣地地區區之家庭住之家庭住戶內戶內十十
二二歲歲以上之以上之國國民民,,且就且就讀學讀學校或服校或服務單務單位已位已實實施施週週
休二日或隔休二日或隔週週休二日者休二日者。。<<資資料料來來源源::行政院主行政院主計計
處處>>
部落抽部落抽樣樣
定定義義
將將母母體體分分為為若干若干沒沒有交集的部落有交集的部落,,母母體內體內的每一的每一個個
體體均只均只屬屬於其中一部落於其中一部落,,再自所有部落中再自所有部落中簡單隨機簡單隨機
抽取若干部落抽取若干部落樣樣本本,,並對這並對這些些簡單隨機簡單隨機部落部落樣樣本作本作
完整的普查完整的普查。。
不同於分不同於分層隨機層隨機抽抽樣樣,,其要求部落其要求部落內內要要異質異質。。理理論論
上上,,每一每一個個部落均可部落均可視為視為母母體體的的縮縮小小,,最常最常見見的部的部
落落區區分便是按照地域分便是按照地域來區來區分分。。
部落抽部落抽樣樣((續續))
部落抽部落抽樣樣之之優優點點
部落抽部落抽樣樣因因調調查查範圍僅範圍僅限於限於較較小小範圍範圍的部落的部落內內,,因因
此也此也較節較節省人力省人力時間與經費時間與經費。。
二二階階段部落抽段部落抽樣樣((two-stage cluster samplingtwo-stage cluster sampling))
有有時時若部落太大若部落太大,,則則可在抽到的部落可在抽到的部落內內再再細細分更多分更多
部落部落 。。
部落抽部落抽樣樣((續續1)1)
圖圖 部落抽部落抽樣樣
部落抽部落抽樣實樣實例例
假假設設某公司想某公司想調調查高雄市市民每月消查高雄市市民每月消費費在甲在甲產產品的品的
支出支出,,計畫計畫在所有在所有1111個個行政行政區區中中隨機隨機抽出抽出44個個行政行政
區區,,然後再然後再從從被抽出的行政被抽出的行政區區中中隨機隨機抽出一抽出一條條路路
((街街)()(如遇街道跨如遇街道跨區時區時,,則僅調則僅調查查屬屬於於該區該區的住的住戶戶
)),,然後普查然後普查該條該條路路((街街))的所有住的所有住戶戶。。這這就是部落就是部落
抽抽樣樣。。
系系統統抽抽樣樣
系系統統抽抽樣樣之定之定義義
將將大小大小為為NN的母的母體內體內之之個體隨機個體隨機排序排序,,再自前再自前kk個個個個
體體中中隨機隨機抽取一抽取一個體個體作作為為第一第一個樣個樣本本,,然後自然後自該個該個
體體起起,,每隔每隔kk個個體選個個體選取一取一個樣個樣本本,,直到直到選滿選滿nn個樣個樣
本本為為止止。。kk值的值的決決定定
其中其中,,n=n=樣樣本大小本大小
N= N=母母體體大小大小
k= k=樣樣本本選選取取間間隔隔
系系統統抽抽樣樣((續續))
. 當當母母體體大小大小為無為無限限時時,,kk值大小值大小則則可依方便可依方便決決定之定之。。
. 系系統統抽抽樣樣的目的的目的並並不在降低抽不在降低抽樣誤樣誤差差,,而是而是純純粹粹
為為了方便及管理考量了方便及管理考量。。
. 當當母母體內個體體內個體排序出排序出現現某一某一週週期性或期性或規則時規則時,,系系
統統抽抽樣樣的使用就必的使用就必須須非常小心非常小心,,不然不然,,則則很容易很容易
增加抽增加抽樣誤樣誤差差 。。
系系統統抽抽樣實樣實例例
某某製製造造燈燈泡的工泡的工廠廠,,計畫計畫生生產產50005000個燈個燈泡泡,,想想從從中中
抽取抽取5050個樣個樣本本,,以了解不良品的比例以了解不良品的比例,,若若採採取系取系統統
抽抽樣樣,,則則依依50005000個燈個燈泡生泡生產產的的順順序序,,做做為為假想的假想的編編
號號,,其次其次決決定抽定抽樣區間樣區間kk,,k=5000/50 =100k=5000/50 =100,,然後然後
從從11至至100100中以中以簡單隨機簡單隨機抽抽樣樣抽出一抽出一數數,,做做為為起始起始點點,,
如抽出如抽出3535,,最後只要每生最後只要每生產產第第100100個燈個燈泡泡,,便便將該將該
燈燈泡抽出泡抽出,,即生即生產順產順序序為為35,135,235,335,…,493535,135,235,335,…,4935的的
燈燈泡泡,,就被抽出做就被抽出做為樣為樣本本。。
非非隨機隨機抽抽樣樣
非非隨機隨機抽抽樣樣(nonrandom sampling)(nonrandom sampling)
任何一任何一種種抽抽樣樣方法在自母方法在自母體選體選取取樣樣本的本的過過程中程中並並不不
包括包括隨機選隨機選取者取者,,均均屬屬於非於非隨機隨機抽抽樣樣。。
非非隨機隨機抽抽樣樣方法因非方法因非機機率抽率抽樣樣,,所以也不所以也不適適合做合做統統
計計分析分析與與推推論論,,抽抽樣誤樣誤差也差也無無法客法客觀觀的的計計算出算出來來。。
一般在一般在廣廣播播電視電視常出常出現現的叩的叩應應((call-incall-in))民民調調即即屬屬
非非隨機隨機抽抽樣樣的一的一種種。。
隨機隨機抽抽樣與樣與非非隨機隨機抽抽樣樣的比的比較較
. 估估計計值的信值的信賴賴度度::機機率抽率抽樣樣可依可依統計統計理理論論求得求得樣樣本的估本的估
計計值值、、抽抽樣誤樣誤差和信差和信賴區間賴區間。。非非機機率抽率抽樣樣的估的估計計值值則則包包
含含難難以衡量的偏差以衡量的偏差,,無無法客法客觀評觀評估估樣樣本估本估計計值的正值的正確確性性。。
. 統計統計效率效率評評估估::機機率抽率抽樣樣可比可比較較不同不同樣樣本本設計設計的相的相對對效效
率率,,非非機機率抽率抽樣則沒樣則沒有客有客觀觀的的統計統計方法比方法比較較。。
. 母群母群體體的情的情報報::機機率抽率抽樣樣所需有所需有關關母群母群體體的情的情報較報較少少。。
非非機機率抽率抽樣樣,,所需的情所需的情報較報較多多。。
. 經驗經驗和技巧和技巧::機機率抽率抽樣樣的的設計設計和和執執行比非行比非機機率抽率抽樣樣需要需要
專業專業化的技巧和化的技巧和經驗經驗。。
. 時間時間::機機率抽率抽樣樣的的設計設計和和執執行行較較繁繁雜雜,,花花費時間較長費時間較長。。
. 成本成本::機機率抽率抽樣樣的的設計設計和和執執行行為達為達到某些目的到某些目的,,費費用用較較
多多。。
統計統計量量與與抽抽樣樣分配分配
母母數數(parameter)(parameter)
由母由母體體中中計計算出用算出用來來描述母描述母體體的的數數值值測測量量結結果果。。
統計統計量量(statistic)(statistic)
由由樣樣本中本中計計算出用算出用來來描述描述樣樣本的本的數數值值測測量量結結果果。。
抽抽樣樣分配分配(sampling distribution)(sampling distribution)
在一母在一母體體中重中重複複抽取固定大小的抽取固定大小的隨機樣隨機樣本本,,由由該隨該隨
機樣機樣本所本所計計算出之算出之統計統計量的所有可能量的所有可能結結果之果之機機率分率分
配配,, 稱為該統計稱為該統計量的抽量的抽樣樣分配分配。。
例例 考考試試平均成平均成績績
假假設設某次某次統計學統計學考考試試前五名高分的成前五名高分的成績績分分別為別為 91 91、、
9292、、9393、、9494及及 95 95 分分,,若若將這將這五名同五名同學當學當成一母成一母體體,,
則則母母體體之平均成之平均成績為績為
= (91+92+93+94+95)/6 = 93 = (91+92+93+94+95)/6 = 93((分分))
今若自今若自該該母母體體中中隨機隨機抽取抽取兩兩名同名同學為樣學為樣本本(n=2)(n=2)計計
算平均成算平均成績績,,則該則該平均成平均成績績之抽之抽樣樣分配分配為為何何??
解答解答::若自若自該該母母體體中中隨機隨機抽取抽取兩兩名同名同學為樣學為樣本本
(n=2)(n=2)計計算平均成算平均成績績,,則則所有可能抽出之成所有可能抽出之成對樣對樣本本
及其平均成及其平均成績見績見表表 。。
例例 考考試試平均成平均成績績((續續))
表表 所有可能所有可能樣樣本及本及樣樣本平均本平均((n=2)n=2)
例例 考考試試平均成平均成績績((續續1)1)
表表 樣樣本平均的抽本平均的抽樣樣分配表分配表((n=2)n=2)
例例 考考試試平均成平均成績績((續續2)2)
圖圖 樣樣本平均的抽本平均的抽樣樣分配分配圖圖((n = 1 n = 1 和和 2 2))
例例 考考試試平均成平均成績績((續續3)3)
今若自今若自該該母母體體中中隨機隨機抽取三名同抽取三名同學為樣學為樣本本(n=3)(n=3)計計
算平均成算平均成績績,,則該則該平均成平均成績績之抽之抽樣樣分配又分配又為為何何??
解解::
表表 所有可能所有可能樣樣本及本及樣樣本平均本平均(n = 3)(n = 3)
例例 考考試試平均成平均成績績((續續4)4)
表表 樣樣本平均的抽本平均的抽樣樣分配表分配表(n = 3)(n = 3)
例例 考考試試平均成平均成績績((續續5)5)
表表 樣樣本平均的抽本平均的抽樣樣分配分配圖圖(n = 3)(n = 3)
樣樣本平均之抽本平均之抽樣樣分配分配
取出放回或取出放回或無無限母限母體體
自一平均自一平均數為數為 與標準與標準差差為為的母的母體體中抽取一大小中抽取一大小
為為 n n 之之隨機樣隨機樣本本(X(X11, X, X22, , …, X…, Xnn)),,樣樣本平均之期本平均之期
望值望值與變異數與變異數如下如下
樣樣本平均之抽本平均之抽樣樣分配分配((續續))
樣樣本平均之抽本平均之抽樣樣分配分配((續續1)1)
在有限母在有限母體體中中採採抽出後不放回抽出後不放回
樣樣本平均之期望值本平均之期望值與變異數與變異數如下如下
其中其中,, 為為有限母有限母體體修正因子修正因子,,一般一般認為認為,,當當
nn 0 0 .05N .05N時時,,上式中的修正因子即可省略不用上式中的修正因子即可省略不用
。。
例例 平均月薪之期望值平均月薪之期望值與標準與標準差差
假假設設高科公司有高科公司有 1000 1000 名名員員工工,,已知其平均月薪已知其平均月薪
為為 40,000 40,000 元元,,月薪月薪標準標準差差為為 5,000 5,000 元元,,今若自今若自該該
公司中公司中隨機隨機抽取抽取 25 25 名名員員工工調調查其月薪查其月薪,,該該25 25 名名
員員工之平均月薪之期望值工之平均月薪之期望值與標準與標準差差為為若干若干??今若今若
改自改自該該公司公司隨機隨機抽取抽取 100 100 名名員員工工調調查其月薪查其月薪,,則則
該該 100 100 名名員員工之平均月薪之期望值工之平均月薪之期望值與標準與標準差差為為若若
干干??
例例平均月薪之期望值平均月薪之期望值與標準與標準差差((續續))
解解::
25 25 名名員員工之平均月薪期望值工之平均月薪期望值為為
40,000 40,000 元元。。因因
n n (25 (25 1,000)1,000),,平均月薪之平均月薪之標準標準
差差為為
((元元))
100 100名名員員工之平均月薪期望值仍工之平均月薪期望值仍為為 40,000 40,000 元元。。但但
因因n > n > ,,須須用有限母用有限母體體修正因子修正因子計計算算標準標準
差差
((元元))
樣樣本平均之抽本平均之抽樣樣分配分配((續續2)2)
在常在常態態母母體體 X ~ N ( X ~ N (, , 22))的假的假設設下下
樣樣本平均的抽本平均的抽樣樣分配分配
例例 銀銀行等待行等待時間時間
假假設設泛太泛太銀銀行每位行每位顧顧客等待服客等待服務務的的時間時間呈常呈常態態分分
配配,,平均等待平均等待時間為時間為 10 10 分分鐘鐘,,標準標準差差為為 2 2 分分鐘鐘。。
為為作服作服務務品品質調質調查查,,隨機隨機抽抽選選 16 16 名名顧顧客客瞭瞭解其等解其等
待服待服務時間務時間,,問該問該 16 16 名名顧顧客平均等待客平均等待時間時間超超過過
11 11 分分鐘鐘的的機機率率為為何何??
解解::
令令XX為為每位每位顧顧客等待服客等待服務時間務時間,,由由題題意知意知為為常常態態分分
配且配且 = 10 = 10 、、 = 2 = 2
例例 銀銀行等待行等待時間時間((續續))
故故 ,,
即即
因此因此該該1616名名顧顧客平均等待客平均等待時間時間超超過過1111分分鐘鐘
的的機機率率為為%%。。
例例 銀銀行等待行等待時間時間((續續1)1)
圖圖 顧顧客平均等待客平均等待時間時間超超過過 11 11 分分鐘鐘的的機機率率((例例
))
樣樣本平均之抽本平均之抽樣樣分配分配((續續3)3)
在常在常態態母母體體 X ~ N ( X ~ N (, , 22))的假的假設設下下
樣樣本和的抽本和的抽樣樣分配分配
例例 飲飲料料會會被退被退貨嗎貨嗎??
「「喝好茶喝好茶」」盒盒裝飲裝飲料平均每盒重量料平均每盒重量為為 500 500 克克,,標準標準
差差為為 10 10 克克。。今今「「每日每日」」便利商店便利商店進進了一批了一批「「喝好喝好
茶茶」」盒盒裝飲裝飲料料並隨機並隨機抽取一箱抽取一箱((內內含含20 20 盒盒))飲飲料料
進進行重量行重量檢驗檢驗,,若若該該箱箱飲飲料重量不足料重量不足 9900 9900 克克,,則則
整批整批飲飲料通通退料通通退貨貨。。若若該該盒盒裝飲裝飲料之重量呈常料之重量呈常態態分分
配配,,請問該請問該批批飲飲料料會會被退被退貨貨的的機機率率為為何何??
解解::令令 X X 為為「「喝好茶喝好茶」」盒盒裝飲裝飲料每盒之重量而得到料每盒之重量而得到
例例 飲飲料料會會被退被退貨嗎貨嗎??((續續))
故故
,,
因此因此該該批批飲飲料料會會被被「「每日每日」」便利商店退便利商店退
貨貨的可能性的可能性為為 % %。。
例例 飲飲料料會會被退被退貨嗎貨嗎??((續續1)1)
圖圖 整箱整箱飲飲料不足料不足 9900 9900 克重的克重的機機率率((例例))
樣樣本平均之抽本平均之抽樣樣分配分配((續續4)4)
中央中央極極限定理限定理(central limit theorem)(central limit theorem)
無論無論母母體體分配分配為為何何,,自平均自平均數為數為 、、標準標準差差為為 的的
母母體體中抽取中抽取 n n 個隨機樣個隨機樣本本,,若若樣樣本大小本大小 n n 夠夠大大(n (n
30) 30) ,,則樣則樣本平均本平均 的抽的抽樣樣分配分配會趨會趨近於常近於常態態分配分配。。
– 無無限母限母體體
– 有限母有限母體體抽出後不放回抽出後不放回
樣樣本平均之抽本平均之抽樣樣分配分配((續續5)5)
中央中央極極限定理亦限定理亦適適用於用於樣樣本和的抽本和的抽樣樣分配分配
– 無無限母限母體體
– 有限母有限母體體抽出後不放回抽出後不放回
樣樣本平均之抽本平均之抽樣樣分配分配((續續55))
圖圖 不同母不同母體體分配下分配下,,不同不同樣樣本大小本大小樣樣本平均之抽本平均之抽樣樣分配分配
例例 年年終獎終獎金金與減與減薪薪
假假設設某某產產品推品推銷員銷員平均每天平均每天賣賣出出 1000 1000 件件產產品品,,每每
天天賣賣出出產產品品數數之之標準標準差差為為 100 100 件件。。今公司於年今公司於年終終欲欲
瞭瞭解解該銷該銷售售員員之之銷銷售售業績業績,,遂遂隨機選隨機選取了取了 100 100 天的天的
銷銷售售業績來檢驗業績來檢驗,,若若該該 100 100 天的平均天的平均銷銷售售數數量超量超過過
1025 1025 件件,,則發給該銷則發給該銷售售員員年年終獎終獎金金;;若若該該 100 100 天天
的平均的平均銷銷售售數數量不足量不足 985 985 件件,,則則要扣要扣減減其薪其薪資資。。問問
該銷該銷售售員員既得不到既得不到獎獎金亦金亦沒沒有受到有受到減減薪薪懲罰懲罰之之機機率率
為為何何??
例例 年年終獎終獎金金與減與減薪薪((續續))
解解::
令令XX為該銷為該銷售售員員之每天之每天銷銷售售產產品品數數量量,,雖雖然然XX之分之分
配未知配未知,,因因為樣為樣本本夠夠大大((nn= 100 > 30= 100 > 30),),所以所以該銷該銷
售售員員任任 100 100 天的平均天的平均銷銷售售數數量之抽量之抽樣樣分配近似常分配近似常態態
分配分配 ,,故故
今欲求今欲求該銷該銷售售員員既得不到既得不到獎獎金亦金亦沒沒有受到有受到減減薪薪懲罰懲罰
之之機機率率,,即即為為
例例 年年終獎終獎金金與減與減薪薪((續續11))
因此因此該銷該銷售售員員年年終終收入收入沒沒有任何有任何
新的新的變變化之化之機機率率為為 。。
例例 年年終獎終獎金金與減與減薪薪((續續2)2)
圖圖 平均平均銷銷售售數數量介於量介於 985 985 與與 1025 1025 件之件之機機率率((例例 ))
例例 接力接力賽賽破破紀錄紀錄
假假設設某大某大專專院校全院校全體學體學生生參參加加 100 100 公尺公尺賽賽跑的平均跑的平均
時間為時間為 15 15 秒秒,,標準標準差差為為 3 3 秒秒。。今今學學校校隨機隨機抽抽選選 36 36
位同位同學參學參加大加大專運動會專運動會之之 3600 3600 公尺接力公尺接力賽賽跑跑,,若若
3600 3600 公尺接力公尺接力賽賽跑之大跑之大會紀錄為會紀錄為 8 8 分分鐘鐘整整,,試問試問
該該 36 36 位同位同學學破破紀錄紀錄之之機機率率為為何何??
例例 接力接力賽賽破破紀錄紀錄((續續))
解解::
令令XX11, X, X22, …, X, …, X3636為該為該校校隨機隨機抽抽選選之之 36 36 位同位同學學各各
跑跑 100 100 公尺所花公尺所花時間時間,,因因學學生人生人數夠數夠多多((n= n=
36>3036>30))
該該 36 36 位同位同學學跑出的成跑出的成績績是低於是低於88分分鐘鐘((或或 480 480 秒秒))
之之機機率率為為
例例 接力接力賽賽破破紀錄紀錄((續續1)1)
因此因此,,若自若自該該校中校中隨機隨機抽取抽取 36 36 位同位同學參學參加加 3600 3600公公
尺尺 接力接力賽賽跑跑,,其成其成績績破大破大會紀錄會紀錄之之機機率率為為 % %。。
例例 接力接力賽賽破破紀錄紀錄((續續22))
圖圖 接力接力賽賽跑破跑破紀錄紀錄之之機機率率((例例 ))
樣樣本平均之抽本平均之抽樣樣分配分配((續續6)6)
結論結論
1. 母母體體是常是常態態分配分配,,則樣則樣本平均的本平均的
抽抽樣樣分配亦是常分配亦是常態態分配分配。。
2. 母母體體不是常不是常態態分配分配,,則則在在樣樣本本夠夠
大大時時,,樣樣本平均的抽本平均的抽樣樣分配分配會會近近
似常似常態態分配分配。。
3. 樣樣本平均的期望值等於母本平均的期望值等於母體體平均平均
。。
4. 樣樣本平均的本平均的標準標準差比母差比母體標準體標準差差
小小 倍倍。。
樣樣本比例之抽本比例之抽樣樣分配分配
樣樣本比例本比例((Sample ProportionSample Proportion))
其中其中XX: : 樣樣本中某特定本中某特定類別類別族群之族群之發發生次生次數數
nn: : 樣樣本大小本大小
樣樣本比例之抽本比例之抽樣樣分配分配((續續))
樣本比例之平均數與變異數
– 無無限母限母體體
– 有限母有限母體體且母且母體體大小大小((NN))與樣與樣本本
大小大小((nn))的比例的比例關係關係n/Nn/N為為> >
情情況況下下,,
樣樣本比例之抽本比例之抽樣樣分配分配((續續1)1)
自一成功自一成功機機率率為為 p p 的二的二項項分配抽取分配抽取 n n 之之隨機樣隨機樣本本,,
在大在大樣樣本本((npnp 5 5 且且 n (1n (1--p)p) 5 5))的情的情況況下下,,樣樣本本
比例比例 ( ) ( )的抽的抽樣樣分配近似分配近似為為
– 無無限母限母體體或有限母或有限母體體大小大小NN滿滿足足
– 有限母有限母體體大小大小NN滿滿足足
例例 保保單單之之續續保率保率
某保某保險險公司宣公司宣稱稱其保其保單單每年之每年之續續保率保率為為 85% 85%,,遠遠
高於全高於全國國所有保所有保險險公司之公司之總續總續保率保率。。假假設設全全國國的的續續
保率保率為為 80% 80%,,並並且且該該保保險險公司之宣公司之宣稱稱正正確確,,今自今自
該該公司去年之保公司去年之保單單中中隨機隨機抽取抽取 100 100 份份檢檢查是否在今查是否在今
年又年又續續保保,,問這問這 100 100 份份隨機隨機抽取之保抽取之保單單之之續續保率高保率高
於全於全國國之之機機率率為為何何??
例例 保保單單之之續續保率保率((續續))
解解::
令令pp為該為該公司保公司保單單之之續續保率保率,,nn為樣為樣本本
大小大小,,由由題題意知意知,, pp= = 且且nn= 100= 100。。
因因npnp = (100)() = 85 >5 = (100)() = 85 >5 且且n(1-p)n(1-p)= =
(100)() = 15 > 5(100)() = 15 > 5,,根根據據中央中央極極
限定理限定理,,該該100 100 份份隨機隨機保保單單之之續續保率保率
的抽的抽樣樣分配近似常分配近似常態態分配分配
例例 保保單單之之續續保率保率((續續1)1)
因此在因此在續續保率保率為為 85% 85% 之保之保險險公司中公司中隨機隨機抽取抽取 100 100 份份
保保單單,,而此而此 100 100 份保份保單單之之續續保率高於全保率高於全國續國續保率保率
80% 80% 之之機機率率為為 。。
例例 保保單單之之續續保率保率((續續2)2)
圖圖 樣樣本保本保單續單續保率超保率超過過全全國國平均的平均的機機率率((例例 ))
tt分配分配
無論無論在大在大樣樣本或在小本或在小樣樣本常本常態態母母體體的的
情情況況下下,,將樣將樣本平均本平均 標準標準化後化後,,
所得到之所得到之
為為一一標準標準常常態態分配之分配之隨機變數隨機變數,,亦即亦即
Z Z 之分配之分配為為一平均一平均數為數為 0 0 與標準與標準差差為為
11之常之常態態分配分配。。
tt分配分配((續續))
在母在母體標準體標準差未知的情差未知的情況況下下,,若要若要對對
樣樣本平均本平均 標準標準化化,,則則 () () 式分式分
母中的未知母母中的未知母體標準體標準差便差便須須用用樣樣本本標標
準準差差來來估估計並計並取代之取代之,,如此一如此一來來,,便便
產產生了一生了一個個新的新的統計統計量量,,我我們稱們稱之之為為
tt 統計統計量量( ( tt statistic) statistic)::
tt分配分配((續續1)1)
tt分配分配
自常自常態態母母體體X~N(X~N(, , 22))下下隨機隨機抽取大小抽取大小為為nn的的樣樣本本(X(X11, ,
XX22, , …, X…, Xnn) ) ,,則統計則統計量量
之分配之分配為為自由度自由度 n n--1 1 之之 t t 分配分配。。
自由度自由度
.= .= 樣樣本大小本大小((nn)) 事前需要估事前需要估計計的其他母的其他母數數數數目目
tt分配分配((續續2)2)
tt分配的特性分配的特性
1. tt分配分配與標準與標準常常態態分配分配ZZ類類似似,,但它但它
的的變變化化較較常常態態分配分配為為大大,,左右左右兩兩
尾也尾也較長較長。。當樣當樣本大小本大小為無為無限大限大
時時,,tt分配分配與與ZZ分配完全相同分配完全相同。。
2. tt分配的自由度等於分配的自由度等於樣樣本大小本大小減減1 1
。。
3. tt分配分配隨隨著自由度的增加著自由度的增加會趨會趨近近標標
準準常常態態分配分配。。當當自由度自由度vv 30 30時時,,
即可用即可用標準標準常常態態分配分配來來代替代替tt分分 配配。。
tt分配分配((續續3)3)
圖圖 tt(5) (5) 、、tt(10)(10)及及ZZ分配分配
THANKS