数理统计分析与应用
第 4谢 关于计星值硇植验与估计(2)
二、关于平均值的检验与估计
在第 3讲 已介绍过有关平均值检
验与估计的基本概念 ,本节 主要是说
明平均值检验与估计的具体方法,同时
还要介绍 有关两个总体平均值差异的
检验与估计。前者是根据样本的平均
值 来 检验 其总 体 的平均 值 有无 变 化
(差异),后者则是根据两总体的样本平
均 值来检验原来两总体 的平均值有无
显著差异
(一)总体平均值的检验与估计。
当作业方法或设备有部分改变时,
使用改变后抽取的样本之 n个数据平
均值 ,可 以检验总体 改变前 、后 的
平均值是否发生了变化 。在总体平均
值 的假设检验中,有时 已知总体的方
差 ,有时不知总体 的方差 。对于 已知
总体方差的总体平均值 的检验 ,可采
用第 3讲 介绍 的使用正态分布的 U检
验。对 于未 知总体方差 的总体平均值
的检验 ,则需要利用样本的方差来估计
总体的方差 .即利用下面将介绍的 t分
布 (t--distribution)进行检验。
1.t分布 。
前面第 3讲 曾讲过 ,若从平均值为
, 标 准 偏 差 为 的 正 态 总 体 N
(肛,盯 )中抽取大小为 n的样本 ,则样本
平均值 遵从正态分布 N( , )。将
有关方差 的检验与估计
普 济
这x通过下式的变换予以标准化。
= 一 (1)
| n
则 U遵从标准正态分布 N(0,1 )。
当总体的 未知时 ,我们用从样
本的 n个数据求得标准偏差 来代替
式 (1)中的 ,则所得的下式 :
t= 二 二 (2) 一 、-,
s/x/n
遵从 自由度 u=(n一1)的 t分布。
t分布是以 0为中心 、左右对称 的
分布 .其 形态 随自由度而变 :当 自由度
t,为 ∞ 时,同正态分布一致 。t分布在
平均值与相关 系数等的检验与估 计中
常有应用。
表 l为 t分布的数值表。例如 自由
度t,为 10,t的绝对值lt l取某值以上
概率 P(两 侧 概率 )为 0.05时 的 t值
为 2.228。图 1中的两侧斜线部分即是
两侧概率合计 P=0.05。查表 1得到的
结果表示为 :
一 £n025(10)=tn975(10)=2.228
它是 自由度 10的 t分布两侧概率
5%点(单侧概率 2.5%点)(图 1)。
一 般 。则表示为
一 £ (u)=t 1一。P(u)
2 ‘
2.总 体 方差 已知 时 的总 体 平 均值
的检验与估计。
在第 3讲已触及到这个 问题 ,这里
再次介绍一下检验与估计的具体步骤。
奶酪的装盒作业以往是手工进行 ,
产品重量稳定在平均值 252.Og,标准
偏差 0.9g。最近 改用 自动装 盒作业 ,
抽取 20盒求出其平均重量为 251.52g。
在标准偏 差不变 的情况下 ,试 问 自动
化后产品重量 同以往 的平均重量有无
显著差异?且 问 自动化后产品重量的
总体平均值为多少?
因为手工装奶酪作业的产品重量
长期稳定 。于是手工作业时的总体平均
值与标准偏差为
0=252.0, 0=0.9
(1)总体平均值的检验。
自动化作业后 的总体平 均值检 验
步骤如下。
①提出假设,确定显著性水平。
Ho: =/z o(自动化后产品重量的
总体平均值 同于手工作业时的总体
平均值 。=252.Og)
H-:/z#/z o( 与 。有了显著差异)
仅 :0.05
②求自动化后样本数据的平均值。
n:20. =25l_52g
③计算 u。(利用式(1))
U o: 二 :堑!: 二
0/、/n 0.9/v~6
-- - - 2.385
83
维普资讯
数理统计分析与应用
表 1 t分 布 表
. P_+£
从 自由度 lb'与两侧概率 P(单侧概率 P/2)
求 t表
O.2O O.1O O.O5 O.O2 O.Ol O.0ol
O.9O O.95 0.975 O.99 0.995 0.9995
l 3.078 6.314 12.706 31.82l 63.657 636.6l9
2 1.886 2.920 4.3o3 6.965 9.925 31.599
3 1.638 2.353 3.182 4.54l 5.841 l2.924
4 1.533 2.132 2.776 3.747 4.604 8.6lO
5 1.476 2.Ol5 2.571 3.365 4.032 6.869
6 1.44O 1.943 2.447 3.14l 3.7o7 5.959
7 1.4l5 1.895 2.365 2.998 3.499 5.408
8 1.397 1.860 2-306 2.896 3.355 5.04l
9 1.383 1.833 2.262 2.82l 3.250 4.78l
lO 1.372 1.8l2 2.228 2.764 3.169 4.587
ll 1.363 1.796 2.201 2.7l8 3.106 4.437
l2 1.356 1.782 2.179 2.68l 3.055 4.3l8
l3 1.350 1.77l 2.16o 2.650 3.012 4-22l
14 1.345 1.76l 2.145 2.624 2.977 4.140
l5 1.34l 1.753 2.131 2.602 2.947 4.073
l6 1.337 1.746 2.120 2.583 2.921 4.0l5
l7 1.333 1.740 2.11O 2.567 2.898 3.965
l8 1.330 1.734 2.101 2.552 2.878 3.922
l9 1.328 1.729 2.O93 2.539 2.861 3.883
20 1.325 1.725 2.086 2.528 2.845 3.85O
2l 1.323 1.72l 2.080 2.5l8 2.831 3.8l9
22 l-32l 1.7l7 2.O74 2.508 2.819 3.792
23 1.3l9 1.714 2.O69 2.50o 2.80r7 3.768
24 l-3l8 1.7ll 2.O64 2.492 2.797 3.745
25 1.3l6 1.708 2.O60 2.485 2.787 3.725
26 l-3l5 1.706 2.O56 2.479 2.779 3.707
27 1.314 1.703 2.O52 2.473 2.771 3.690
28 l3l3 1.7Ol 2 O48 2.467 2.763 3.674
29 l-3ll 1.699 2.O45 2.462 2.756 3.659
30 l-3lO 1.697 2.O42 2.457 2.750 3.646
40 1.303 1.684 2.O21 2.423 2.704 3.55l
6O 1.296 1.67l 2伪 O 2.390 2.66o 3.460
l2O 1.289 1.658 1.980 2.358 2.617 3.373
∞ 1.282 1.645 l_96o 2.326 2.576 3.29l
例如 :u=5.P=0.05对应的 t值 为2.571。这表示遵从 自由度 5的 t分布 的随机
变量取绝对值 2.571以上的概率为 0.05。上侧概率 (或下侧概 率)为 0.025。
④查正态分布表求显著性水平 5% 重量总体平均值同手工作业时的产品
(两侧概率 )对应值 ,且同 M。比较 、判
定。
除了直接查“正态分布表”(见本文
后 的附表)外 ,利用 t分布 自由度 为
∞ 时成为正态分布的关系.查本讲表 1
亦 可 :
I 。I=2.385 > 。975 1.96
0=一2.385< n025=-1.96
结果是 以显著性水平 5%检验 .判
定拒绝原假设 ,即 自动化后的产品
重量总体平均值有了显著差异 ( 。值
上角附以“ 表 示以 5%显著性水平检
验的显著差异:若 1%显著性水平进行
检验有显著差异则一般附以“ ”)。进
而 ,从 比 。值小,还可以讲 自动化后
产品重量变轻了。
注 :在正态分布中 ,图 2的斜线部
分是两侧的概率之和为 P(单侧概率为
P/2),两个分位点的关系如下 :
一 旱 l一
t 0
.025(10)=一2.228 t0 975(10)=2.228
图 1
(u:10.
t分 布
P=0.05)
手
U P u1{ 2
图 2 正态分布表
(2)总体平均值 的估计。
自动化后 的产品重量 的总体平均
值 ,使用样本平均值 作为点估计值 。
点估计值 : = ,251.52g
置信度 95%的 自动化后产品重量
总体平均肛 的区间估计如下。
①求 自动化后 n=20的样本平均
值 。
n=20. =251.52g
②确定置信度(1-OL)。
仅:O.05(5%),置信度为95%。
③从正态分布表求显著性水平 5%
(两侧概率)的对应值。
n975: 1.96
④求总体平均值的置信度 95%的
置信界限。置信界 限为:
± l一~xr/Vn (3)
所以 ,置信上限:
+ 1一~xr/Vn :251.52+
1 96 X0.9| =251.91
置信下限:
一 l一睾 /、/n:251.52一
1.96X0.9/ =251.13
自动化后 的产 品重量 总体平均在
251.13—251.91g区 间 内 (置 信 度 为
维普资讯
表 2 自动化后的奶酪重量与计算
用辅 助表 (n=20)
X,=( -X0)× =( ,一251.5)×10
X, X
252.9 14 196
252.3 8 64
251.5 0 0
250.4 —11 121
251-3 —2 4
252.2 7 49
251.7 2 4
251.9 4 16
252.9 14 196
252.0 5 25
250.5 —10 100
251-4 —1 1
252-2 7 49
251.3 -2 4
250.2 —13 169
251_3 —2 4
250.5 —10 100
251.7 2 4
250.9 —6 36
251-3 -2 4
计 5030.4 4 1146
95%)。
(3)总体方差未知时的总体平均值
的检验与估计。
当总体方差不 明时.应该用样本的
n个数据予 以估计 ,也就是利用式(2)。
t:羔 二 一 或 业
s l l-
计算出的 t值同查 自由度 t,=fn一1)
的t分布表得到的 tt x(n-1)或 tl_ (n-1)
进行比较 .然后判定总体平均值是否改
变 。
关于总体平均值的区间估计 ,采用
类似式(3)的下式
±£ 一导(t,)s/、/n (4)
来求得 。
在本讲举例 中 ,要通过 自动化后
样本的 20个数据 (表 2)求标准偏差,
然后 利用其值进行总体平均值的检验
与估计。
总体平均值的检验步骤如下。
①提 出假设 ,确定显 著性水平
(同于总体方差已知的场合)。
②利用表 2求出样本的 ,s。表
2的数据变换式为 :
X。:( .--'X0)h:( 。一251.5)×10
(式 中的假设平 均 。取作 251.5,
乘数 h取作 10)
于是
=
Y.Xi
×
1
n 凡
=251.5+砉×击=251.52g
S= 窆 盟
= 1146一 }× =11.452
s=~~/11.452=0
.776g
③计算 t。
t。: :笪
s八/n 0.776/、/20
= 一 2.766
④查 t分布表求出显著性水平5%
的对应值且同 t。比较 、判定。
一 t 0
.025(19)=t 0.975(19)=2.093
因此有
It 0 I:2.766 >tn975(19)=2.093
以显著性水平 5%进行检验 ,判定
拒绝原假设 H。而接受备择假设 H 。也
就是 ,自动化后的产 品重量 总体平均
值同手工作业时有了显著不同。
现在.再进行总体平均值的估计。
点估计值 : =251.52g
按 式(4)得到 区间估计值 (置信 度
95%):
251.52±2.093×0.776/
= 251.16~251.88g
以置信度 95%进行估计 ,自动化后
的 产 品 重 量 总 体 平 均 值 在 251.16~
251.88g之间。
(二)两个总体平均值差异的检验
与估计。
对 于两个正态 总体平均值性差异
的检验 .现仍采用前面所讲两 总体方
差的差异检验例来说明。
某化学药 品的填 装采用 A、B两
台充填机进行 。试根据下面数据研讨
各充填机的填装量有无显著差异?
数理统计分析与应用
A:2O.8 19.6 20.4 20.O 20.9 20.1 2O.6 20.1 2O-3 19.9fg】
B:2O_3 2O.8 2O.7 2O.9 20_3 2O.8 21.0 21.O
1.两总体平均值差异的检验与估计
在使 用 A、B两 个总体 的样本平
均值 , 检验两个总体平均值有无
显著差异时 ,首先应该使 用 F分 布检
验两个 总体的方差有无显著差异 当
认为方差没有显著差异时 ,可采 用下
述方法 检验 其平均 值有无 显著差异 。
现规定 :
两个总体的样本大小 :n ,n
两个总体的样本平均值 : ,
两个总体的样本平方和:S ,S
由于 已知两总体的方差没有显著
差异 ,故可用下式来估计两总体样本的
共同标准偏差:
(5)
如果两 个总体 的总体平均 值 ,
e没有显著差异 ,则下式的统计量
t:— (6) 一一 、u, \/ 去
遵从 自由度为
t,=(nA一1)+(nB一1):n^+nB-2
的 t分 布 。将式(6)计算的 t值 同查
自由度 t,的 t分布表值进行比较 ,即可
进行两总体平均值差异 的检验。
关于两总体平均值之差的估计 :
点估计值: 一 = 一 e
置信度(1-仅)的区间估计值:
)+ 手 s 1v/去 (7)
这 里 ,s用 式 (5)求 得 ,t,为 (nA+
nB一2)。
至于 A、B各 总体 的总体平均 值
的区间估计值仍采用式 (4)
±£ 一 (t,)s/、/n
式 中的 s分 别使 用 A、B两总体
的各 自样本标准偏差 ,但 因两 总体方
差没有显著差异 ,也可使用式 (5)的
s。这时 ,自由度并不是 t,A=n 一1与
维普资讯
数理统计分析与应用
t,B= B一1而应是 t,= A+ B一2。
注)A产品的质量特性 遵从平均
值为 ,方差为 盯 的正态分布 ;B产
品 的质 量特性 y遵从 平均值 为 ,标
准偏差为 盯 的正态分布。当 与 y间
没有特别相关关系时 .下图所示的 x+-y
遵 从平 均值 为 ± ,标 准偏 差为
O'x2+盯v2的正态分布,这便是“方差的可
加性”。
卜—一 一 j— y—+j
A 【 B l
L—., ................. . ..........』.......-.— —-——-_J
————一 +V—————
卜一 v— I
在式 (6)给出的两总体平均值差
异 的检验式 中 。根据方差 的可加性 ,
相对于分子 ( 一 ),分母 的方差为
(s A2/ A+sB / B)。由于使 用了 A、B
共同的方差 s ,所以最后分母 的方差成
为( +上 )s z
。
A B
前面一节 已对 A、B两台充填 机
的方差作了检验 .认为两总体方差 无
表 3 计算 用辅 助表 (填 装量 g)
X :( 。-x0)× =( 一20.0)×10
^
X ^ XA2
B XB XB2
20.8 8 64 20-3 3 9
19.6 —4 16 20.8 8 64
20-4 4 16 20.7 7 49
20.O O O 20.9 9 81
20.9 9 8l 20-3 3 9
20.1 1 1 20.8 8 64
20.6 6 36 21.O 1O 1o0
2O.1 1 1 21.O 1O 1o0
20-3 3 9
l9.9 —1 1
计 202.7 27 225 165.8 58 476
显著差异 ,故可用 以下步骤进行有关 s为
平均值的检验与估计。
(1)两总体平均值差异的检验。
①提出假设,确定显著性水平。
H0: A=/zB(A、B两充填 机 的
填装量 A, B无显著差异 )
H。: ≠ e(A、B两充填机的填
装量 , e有显著差异 )
Ot:0.05
②计算检验所需的统计量(表3)。
2o-o+ ×
. 凡
= 2010+
=
.
1u
20.0+ =20.725 丁165.8
= 20.725
{∑
={225一簪}× 52·
{∑
={476一譬}× -o.555
因此,根据式 (5),共同的标准偏差
= 薷
:~/1.521+0.555一:0.360W 10 +8
— 2
: :
60、/击专
: —
-
=.
0 .4
—=
5
-
5
: 一 2.66
0.171
④查 t分布表的值且与 t。比较,进
行判定。
根据 Ot=0.05,t,= A+ B一2=16
查表 1的 t分布值得到:
t 0
.975(16)=2.120
It 0 I=2.66 >t唧5(1 6)=2.120
结果判定.A、B两台充填机的药
品填装量 (总体平均值)有显著差异。
(2)两总体平均值之差的估计。
对于 A、B两总体平均值之差 的估
计如下。
. ⋯ . 一 / \ 一 点估计值 : e 一 = e 一互
= 0.455g
区间估计值(置信度 95%):
(X—B--XA -一争 1v/
= 0.455±2.120×0.360×、V/—
1
l_0一+ 8一
= 0.455±0.362=0.093~0.817g
此外 .还可进行各充填机的总体平
均值的区间估计.例如对于 A机可用下
式求得 :
±£l一 s/、/ A
式 中的 s既可使用 sA,也 可使用
式 (5)求得的共同 s。不过,要注意采用
sA时 ,查 t分 布表 使用 的 自由度 为
一 1;而采用共 同的 s时 ,查 t分布表
使用 的自由度则为 A.卜 B一2。
如果使用共同的 s.则有 :
20.270±2.120×0.360/
: 20.270±0.241
也 就是 说 ,以 置 信 度 95%进 行
估 计 ,A充 填 机 填 装 量 的总 体 平 均
值在 20.029~20.51lg之 间 。
(3)韦尔奇 (Welch)检 验法 。
在两 个 总体 方 差 有 显 著差 异 的
维普资讯
t: (8) 、/
1
一
c .(1-c)
nA一1 /2B-1
c : /( + ) (9)
将式 (8)计算的 t值同 自由度
前面的计算已知 A、B充填两机
to975(15.71)<tn975(15)
= 2.131<lt 0 I=2.78
结论是 A、B两充填机的填装量总
体平均值有显著差异。
在此 ,为 求 t值 需 要 计 算 自由
度 ,而计 算 出的 自由度 =15.71并
不 是 整数 ,不便直接从 t分布表上查
t 0975(15.71)。
作为这时 的检验 .可考虑 以下 两
种方法。
① 利用 =15.71前、后的自由度
的t分布表值,计算出t值 t啷5(15.71),
再同t。比较作出判定 。
t 0
,975(15)=2.131
t 0
.
975(15.71)=?
t 0
.975(16)=2.120
t a975(15.71)=t 0.975(15)×0.29
0.975(16)×0.71=2.123
的样本数据: 15
SA=1.521 SB=0.555
V = 1= 10 1 l69
一
n .一 一
音 -o.O793
于是有 :
t o-
、/
= =丽-0.4550 169 00793 — 2-78
^ / . . . u.16_j,
V 10 8
c : /( + )
nA/ nA nB
=
10 /( + 盟8) /、 10
: 三__ ! 二
nA一1 /2B-1
0.63 .0.37
9 7
15.71
16
因此有 :
lt 0 l=2.78 >t 0.975(15.71)=2.123
判定平均值有显著差异。
当 自由度在 30以下时 ,可以利用
上述直接线性插值的方法求得 t表 、F
表所未列 自由度 的对应值。当 自由度
比 30大时 ,可利用 120/U进行线性插
值。例如求 t 0975(36)的值 :
t n975(30)=2.042
t n昕5(36)=?
t 0975(40)=2.021
t Q975(36)=t 0.975(30)×0.333
+ 0
.975(40
—
12
—
0
: 4
30 。
12 0
: 3.333
b
:3 4O 一
数理统计分析与应用
②从安全方面考虑进行检验。
要想得到有显著差异的结论时 .应
该跟比欲求 自由度小的 自由度 t值进
行比较 ,若 t。比该值大就判定有显著
差异 :
ta97s(15.71)< 0.975(15)一2.131<1t 0 1-2.78’
喜蓍耋晶
反之 ,要想得到没有显著差异 的
结论时 。应该跟 比欲求 自由度大 的 自
由度的 t值进行 比较 ,若该值比 t。大 ,
就判定没有显著差异 :
t0.975(15.71)<t Q975(16):2.120>t 0:2.O0
但是,t 0在 2.120与 2.131之间时,
不能使用这种从安全方面考虑的检验。
必须用插值法求得 tQ昕5(15.71),然后同
t o进行比较 、判定。
附表 正态分布表 (2l
有代 表性 的 1J,与 P的关 系
P
0.6745 O.25
1.OOoo O.15866
1.28l6 O.1O
1.6449 O.O5
1.96oo 0.025
2.OOoo 0.02275
2.3263 O.OlO
2.5758 O.o05
3.OOoo O.o0135
3.0902 O.o0l
87
维普资讯