第四部分 推论统计
概要
推论统计(Inferential Statistics)
应用较小的群体来推论可能的较大的群体的特征。
统计推断的基本思路
(1)提出假设(零假设和备选假设)
(2)描述统计特征
(3)应用统计方法判断假设成立的概率
章节结构
第12章介绍样本和抽样分布;
第13章介绍参数估计的基本概念和方法;
第14章重点介绍假设检验的知识;
第15章介绍方差分析;
第16章介绍其他重要的统计方法。
第12章 又回到抽样
在前几章的讲述中,我们主要围绕着随机变量的各种指标进行描述,事实上是基于总体的。而现实中,我们曾着重指出,有时不必或不能对总体进行直接研究,那么就需要抽样,而样本的最重要特征就是对总体的代表性,
本章内容:我们将对样本的指标进行描述,这些指标被称为统计量。
本章难度:easy!Maybe yes maybe no.
统计量
定义:设X1,X2,…,Xn,是来自总体X的一个样本,g(X1,X2,…,Xn)是X1,X2,…,Xn的函数,若g(·)是连续函数,且个中不包含任何未知参数,则称g(X1,X2,…,Xn)是一统计量。
简单地讲:你用样本数据折腾出来的变量就是统计量,唯一的要求是统计量里没有未知的东西。
贴士
统计量是针对样本的;
参数是针对总体的。
举几个例子
记住这些统计量
样本均值
样本方差
样本标准差
知道这些统计量
样本的k阶原点矩
样本k阶中心矩
贴士
以后你在学习参数的矩估计时这些是重要的统计量
抽样分布
统计量是样本的函数,它也是随机变量,因此统计量也存在分布形式。
统计量的分布被称为抽样分布。
你只有了解或者能够估计出统计量的分布特征,才能够判断一次抽样样本在整个分布中出现的可能性,从而推断你提出的假设是否合理。
下面介绍几种常用的统计量分布
(一)χ2分布
设随机变量X1,X2,…,Xn是来自总体N(0,1)的样本,则称统计量χ2=X12+X22+…+Xn2服从自由度为n的χ2分布,记为χ2~ χ2(n)。
通俗讲,n个标准正态分布的样本平方后相加,就得到一个自由度为n的卡方分布。
其分布函数
贴士
在统计学中,自由度指的是计算某一统计量时,取值不受限制的变量个数。通俗地讲,这里的自由度是指函数右端包含的独立变量的个数。
举个例子吧!
如有3个变量x、y、z,但x+y+z=18,因此其自由度等于2。
而某统计量f=f(x1,x2,…,xn),则自由度为n。
通常自由度df=n-k。其中n为样本含量,k为被限制的条件数或变量个数,或计算某一统计量时用到其它独立统计量的个数。
χ2分布概率密度曲线
o
f(y)
y
n=1
n=5
n=15
χ2分布的性质
χ12~ χ2(n1),χ22~χ2(n2),且有χ12 , χ22相互独立,则χ12 + χ22 ~χ2(n1+n2)
若χ2~χ2(n),则
E(χ2)=n, D(χ2)=2n
当n充分大时,有
所以统计分布表上χ2统计量一般只列到45
例12-1,计算χ(50).
解:你要弄明白题目的含义,计算自由度为50的χ2分布中的一点,所有比该点大的值的概率为5%。还记得这个分位点的概念吗?
o
f(y)
y
χ2α(n)
χ21-α (n)
α
α
(二)t分布
设X~N(0,1),Y~ χ2(n),且X和Y独立,则称随机变量
服从自由度为n的t分布。记为t~t(n)。
t(n)的概率密度函数为
t分布的性质
n →∞,则t分布等于N(0,1)分布。
所以,当n>45时,tα(n)≈zα
o
f(y)
y
对称性
所以t1-α(n)=-tα(n)
o
f(y)
y
tα(n)
t1-α(n)
(三)F分布
设U~ χ2(n1),V~ χ2(n2),且U,V独立,则称随机变量
服从自由度为(n1,n2)的F分布,记为F~F(n1,n2)
F(n1,n2)分布的概率密度为
F分布的性质
o
f(y)
y
Fα(n1,n2)
正态总体样本均值和样本方差的分布
设总体X(无论其服从什么分布,只要均值和方差存在)的均值为μ,方差为σ2,X1,X2,…,Xn是X的一个样本,则有
如X~N(μ, σ2),则
设X1,X2,…,Xn是总体N(μ,σ2)的样本,X,S2分别为样本的均值和样本方差,则有
最重要的定理之一
最重要的定理之二
设X1,X2,…,Xn是总体N(μ,σ2)的样本,X,S2分别为样本的均值和样本方差,则有
最重要的定理之三
设X1,X2,…,Xn和Y1,Y2,…,Yn分别是具有相同方差的两个正态总体N(μ1,σ2)和N(μ2,σ2)的样本,且这两样本独立。设X,Y分别为两个样本的均值,S2分别为两个样本的方差,则有
第13章 参数估计
统计推断基本可以分为两大类:
估计问题
假设检验问题
本章研究重点:
总体参数的点估计和区间估计
本章难度:
理解万岁!
点估计
例13-1,某年级某门课程,一天中缺席的人数X是一个随机变量,假设它服从参数λ>0的泊松分布,参数λ未知,设有以下样本,试估计参数λ。
解:由于X~π(λ),所以λ=E(X)。
最自然的想法是用样本均值来估计总体均值。
经计算样本均值X=,因此估计λ等于.
缺席人数
0
1
2
3
4
5
6
缺席k人的天数
75
90
54
22
6
2
1
参数估计的思想就是用一组样本(X1,X2,…,Xn)构造一个统计量θ ( X1,X2,…,Xn),利用θ的观察值去对总体的某些参数进行估计,而θ也就被称为估计量。
没错,样本对应统计量,总体对应参数,而当进行参数估计时,样本的统计量也就被称为估计量。
估计量一般用参数尖儿表示,例如参数a的估计量表示为â。
理解下来点估计方法
(一)矩估计:
用样本矩作为总体矩的估计量,从而估计总体参数的方法被称为矩估计法。
例13-2,设总体X在[a,b]上服从均匀分布,a,b未知, X1,X2,…,Xn是一个样本,试求a,b的矩估计量。
解:用样本矩来估计总体矩,即
A1=E(X) A2=E(X2)
其中,对于总体矩有:
E(X)=(a+b)/2
E(X2)=D(X)+[E(X)]2 =(b-a)2/12+(a+b)2/4
而对于样本矩,其计算公式如下:
将A1和A2替换总体矩计算公式中的E(X)和E(X2),就可以将计算a和b的值,这就是a和b的估计量
例13-3,设总体X在的均值μ和方差σ2都存在,且有σ2>0,但μ和σ2都未知。又设X1,X2,…,Xn是X的一个样本,试求μ和σ2的矩估计量。
解:这次不给解答了。
其实,答案的形式很容易想象,但并不是合适的。
(二)看起来最繁琐,其实道理最简单的极大似然估计
例13-4,已知一筐里装满红、白两种颜色的球,但两种球的比例a并不清楚,但是一个整数。你、我、他三人分别从中抽取一组样本(每组之间为放回抽样),已知你抽到100个红球,11个白球;我抽到201个红球,19个白球,他抽到9个红球,一个白球。现在请你估计参数a。
事实上,潜意识里,我们会选择最为靠谱的参数估计值。换句话讲,就是找到能够使你抽到该组样本的可能性最大的那个参数值。
首先假定总体X属离散型,分布律为P{X=x}= p(x;θ)设X1,X2,…,Xn是X的一个样本,想象Xi之间相互独立,那么你抽到这样一组数据的概率可以表示为:
P{X=X1∩ X=X2 ∩… ∩ X=Xn}
= p(X1;θ) p(X2;θ)… p(Xn;θ)= ∏ p(Xi;θ)=L(θ)
现在Xi是你的抽样,是已知的,而θ未知,所以这是一个θ的函数,我们将其表示为L(θ),称之为样本的似然函数。
事实上,我们可以通过改变θ来改变L(θ),目标是使得L(θ)最大,也就是使得你的抽样是最可能发生的,这时的θ (X1,X2,…,Xn;θ)称为参数θ的极大似然估计量。
若X属连续型,其概率密度为f(x; θ)。θ未知。则令似然函数为:
使得L(θ)最大的θ (X1,X2,…,Xn;θ)称为参数θ的极大似然估计量.
^
^
说的挺好听,如何求解呢
一阶导数为零啊!!
当然有时连乘的方式很不爽,我们希望向线性的方向转化。考虑L(θ)和lnL(θ)在同一θ处取得最大值,所以我们有时使用对数似然函数lnL(θ),并令其一阶导数为零
如何评价估计量
无偏性 若估计量θ (X1,X2,…,Xn) 的数学期望存在,且有
则称θ是θ的无偏估计量。
就是说,你提出的估计量的期望值必须等于相应的总体的参数值。
自己证明无论总体X服从什么分布,样本均值X都是总体X的数学期望μ=E(X)的无偏估计量。
n阶样本原点矩是n阶总体原点矩的无偏估计量。
^
^
_
例13-5,设总体X的均值μ和方差σ2都存在,且σ2>0,但μ和σ2都未知。又设X1,X2,…,Xn是X的一个样本,则σ2的估计量
是有偏估计量。
证:
有效性 设θ1(X1,X2,…,Xn) 与θ2(X1,X2,…,Xn) 都是θ的无偏估计量,若有
D(θ1)<D(θ2)
则称θ1较θ2有效。
一致性 设θ(X1,X2,…,Xn) 为参数θ的估计量,若当n →∞时θ依概率收敛于θ,则称θ为参数θ的一致估计量。
^
^
^
^
^
^
^
^
^
^
贴士:
我们自然希望一个估计具有一致性,但估计量的一致性只有在样本容量相当大的时候,才能显示优越性。因此,工程领域通常更关注有效性和无偏性
区间估计
对于一个未知量,人们在测量或计算时,不仅关心他的近似值,有时还希望明确误差。
换句话说,对于θ的点估计量θ,既然被称为估计量,事实上它对于θ的接近程度仍然是一个随机变量,即θ以某种概率落在θ的附近,离θ近的可能性大,离θ越远可能性越小,当然θ 落在整个实数空间中的可能性为1。
如果我们现在规定θ的可信程度(落在θ附近的可能性)应该达到某个概率水平(如95%),那么你就对应得出一个θ附近的区间, θ落在这个区间的概率是95%。
^
^
^
置信区间:设总体X的分布函数F(x; θ)含有一个未知数θ,对于给定值α(0<α<1),若由样本X1,X2,…,Xn确定两个统计量θ下和θ上,满足
P{θ下< θ< θ上}=1-α
则称随机区间(θ下,θ上)是θ的置信度为1-α的置信区间
θ下(X1,X2,…,Xn) 和θ上(X1,X2,…,Xn)分别称为置信度为1-α的双侧置信区间的置信下限和置信上限, 1-α为置信度。
贴士
置信区间置信度的意思就是,因为你不知道总体的参数真值是多少,那你就去划出一个区间,这个区间里有100(1-α)%的可能性包含了真值。
这里α实际上是真值不在置信区间的可能性
一般的我们希望1-α比较大,如95%,99%等,所以α的值就比较小,如,等。
例 13-6,设总体X~N(μ,σ2), σ2为已知,μ为未知,设X1,X2,…,Xn是来自X的样本,求μ的置信度为1-α的置信区间。
解:第一步你要去寻找一个合适的统计量,这个统计量中除了你要求解的参数外,应该不包含其他未知参数。这里你要求的是μ的一个区间,所以我们首先想到了如下统计量
我们知道对于一个变量Z~N(0,1),恰好有
所以,
展开得,
于是我们得到μ的一个置信度为1-α的置信区间
例如,我们取α=,即1-α=,又若σ=1,n=16,查表得zα==.于是我们得到一个置信度为95%的置信区间
如果我们统计计算样本均值的观测值有,
则可以将区间量化为
(±),即(,)
再解释解释
上题的含义是,你对总体X次随机抽样,那么抽出来的样本形成一个区间(,),该区间包括总体均值μ的可信度为95%。
当然,置信度为1-α的置信区间不是唯一的。例如,
但对于正态分布而言,它是区间长度最短的。
置信区间长度 与 成反比
区间置信的求解步骤
寻找一个合适的统计量,这个统计量中除了你要求解的参数外,应该不包含其他未知参数。该统计量的分布不依赖于任何未知参数。
利用分位点的概念确定满足该概率条件(1-α)时统计量对应的分位点的值。
根据这个分位点的值,计算目标参数的值域。
这个值域就是总体参数在置信度为1-α的置信区间
在上面的例子中我们已知总体的方差,通过它构建了样本统计量
而这在现实中是难于实现的,因为我们通常只有样本数据的观测值,即总体的方差是未知的。那在Z统计量中就存在了除目标参数μ以外的未知参数。这个统计量因此不满足条件。
这时就需要构建新的统计量。
我们知道:
S2是方差σ2的无偏估计量,那它将可以利用。
参考第12章定理二,
好了,我们这下有一个恰当的统计量t了。
由图得
因此μ的置信度为1-α的置信区间为
例13-7有一批糖果,现从中随机取16袋,称得重量(克):
设袋装糖果的重量近似服从正态分布,试求总体均值μ的置信度为的置信区间。
解:这里1-α=,α/2=,n-1=15, (15)=,由给出的数据算得x=,s=。由上式得到均值μ的置信度为的置信区间为
506
508
499
504
510
497
512
514
505
493
496
506
509
496
第14章 假设检验
假设检验的基本概念
例14-1 某车间用一台机器包装葡萄糖。包装的袋装糖的重量是一个随机变量,它服从正态分布。当机器正常时,均值为千克,标准差为千克,某日开工后为了检验包装机是否正常,随机地抽取它包装的9袋糖,称得重量为:
问机器是否正常?
(一)将问题转化为定量判断
如果我们首先假设对于这台机器包装的糖果的重量而言,标准差比较稳定,即σ =。那么今天这台机器包装糖的重量X~N(μ,)。
现在的目标就是判断μ是等于呢还是不等于呢?
而判断的依据就是抽取的9袋样品。
(二)提出假设,以备检验
我们提出假设:
H0:μ=μ0=
H1:μ≠μ0。
也就是说,我们首先假定机器正常。这是一种保守性的假设。
接着,我们通过样本做出判断是接受H0假设(拒绝H1假设),还是拒绝H0假设(接受H1假设)。
(三)通过样本检验假设
我们知道样本均值是总体均值μ的一个无偏估计量,如果假设为真,则x与μ0之间的偏差不应该过大,即|x-μ0|不应过大,比如说它不应大过某一个标准值k。
因为涉及随机事件,所以事实上,我们希望P{|x-μ0|>k}<α。
这表明我们将犯错误的概率控制在一个很小的范围α内,即P{拒绝H0|H0为真} <α。
(四)确定检验标准值k
通过具有明确分布特征的统计量建立概率统计形式。事实上|x-μ0|也可以用
来衡量。其中Z服从N(0,1).
因此问题等价于
(五)应用分位点确定临界值
由正态分布分位点的概念我们知道,这时的k’=zα/2,
如果 则说明样本均值与假设的总体均值偏差过大,已经超出标准,因此拒绝H0假设
如果 则说明样本均值与假设的总体均值偏差不大,未超出标准,因此接受(不能拒绝)H0假设。
补充定义
α称为显著性
Z称为检验统计量
H0称为原假设或零假设
H1称为备选假设(备择假设)
拒绝H0的区域被称为拒绝域,拒绝域的边界点被称为临界点。如上题中的k’=Zα/2
贴士
假设检验的过程就是通过样本构造一个不包含未知数的统计量,该统计量具有明确的分布形式,进而根据其分布和预先设定的显著水平,计算分布中满足这一概率条件的临界点,从而通过判断统计量计算值是否超出临界点来拒绝或接受原假设。
其背后的原理就是如果参数满足原假设,其样本的某些变型(统计量)就应该服从特定分布。如果样本值在该分布中是小概率事件,那么有理由怀疑其在一次抽样中不可能出现,从而推翻原假设。
两类错误
如前所述,我们在原假设H0为真时,存在犯拒绝H0的可能性α,称这类弃真错误为第I类错误。
而如果H0实际上不真实时,我也可能接受了H0,这类存伪的错误称为第II类错误。
现实中,我们希望犯两种错误的概率尽可能小,但当样本容量固定时,若减小犯一类错误的概率,则犯二类错误的概率往往增加。
若要同时减小犯两类错误概率,只有增加样本量。
所以我们通常只对第一类错误加以控制,而不考虑第二类错误的检验问题,这称为显著性检验。
检验的方向
如上题中,备选假设H1: μ≠ μ0称为双边假设。
形如“H0:μ=μ0;H1:μ> μ0 ”的假设形式被称为右边检验。
形如“ H0:μ=μ0;H1:μ< μ0 ”的假设形式被称为左边检验。
右边检验和左边检验统称单边检验。
设总体X~N(μ,σ2), σ2为已知,μ为未知,设X1,X2,…,Xn是来自X的样本,给定显著性水平α,分别计算单边检验的拒绝域。
对于右边检验H1:μ= μ0;H1:μ> μ0
对于左边检验H1:μ= μ0;H1:μ< μ0
例14-2 某厂生产的燃料燃烧率服从正态分布N(μ=40cm/s,σ2=4cm2/s2),现在改良技术后生产了一批新燃料,从中随机抽取n=25只,测得燃烧率的样本均值为
解:假设H0:μ= μ0=;H1:μ> μ0。
其拒绝域为
经计算得
而查表得=,所以z>,z落入拒绝域
因此拒绝H0,认为燃料的燃烧率有了显著提高
假设检验的步骤
根据实际问题的要求,提出原假设H0和备选假设H1;
给定显著性水平α以及样本容量n;
确定检验统计量以及拒绝域的形式;
按P{拒绝H0|H0为真}=α求出拒绝域;
取样,根据样本观测值确定接受还是拒绝H0
贴士
假设检验中原假设通常指定为相等形式,而备选假设通常是我们的研究假设,也就是说我们检验的目标是发现差分。
统计学家通常采用保守的观点验证自己的研究结果,只有当两个变量之间差分过大时,才认定两者之间显著不同。
通俗地讲,只有当原假设太不靠谱时,才否定它。事实上就是前面所提到的犯“弃真”的错误的可能性(α)很低。
样本容量的选取(介绍性内容)
在一些实际问题中,我们除了希望控制犯第I类错误的概率外,往往还希望控制犯第II类错误的概率
事实上,我们通常预先给定显著性水平以控制第I类错误的概率(α),进而通过选取样本容量的方法将犯第II类错误的概率(β)控制在一定范围内。
这就引入了施行特征(OC)函数。
施行特征函数或OC函数通过选择样本容量n,使得当真值μ≥μ0+δ或μ≤μ0-δ时,犯第II类错误的概率不超过给定的β。
对于方差已知的正态总体的均值检验有:
检验方向
假设形式
样本容量的选取
右边检验
H0:μ= μ0;
H1:μ≥ μ0+δ。
左边检验
H0:μ= μ0;
H1:μ≤ μ0-δ。
双边检验
H0:μ= μ0;
H1:|μ-μ0|≥ δ。
抽检方案的设定
例14-3,设有一大批产品,产品质量指标X~N(μ,σ2),以μ小者为佳,厂方要求所确定的验收方案对高质量的产品(μ≥ μ0)能以高概率1-α被买方接受,而买方则要求低质量的产品( μ≥ μ0+δ )能以高概率1-β被拒绝。α,β由双方商定给出,均为,并采取一次抽样以确定该批产品是否为买方所接受。问如何设计抽样方案,已知μ0=120, δ=20, σ2 =900.
解,我们知道第II类错误通常采用选取样本容量的方式予以决定,那么首先应该确定样本以满足买方对于拒绝低质量产品的要求。在此基础上,通过抽样样本,计算H0假设的拒绝域:
给出假设H0:μ= μ0;H1:μ≥ μ0+δ。
由上表
根据计算得,n≥,故取n=25。
接下来,确定原假设的拒绝域:
代入各个已知参数,计算得出样本均值X的范围。最终得,当样本均值大于等于时买方拒绝这批产品,小于时接受这批产品。
正态总体均值的假设检验
(一)已知σ2,关于μ的检验(u检验)
通过 样本和已知参数构建Z统计量
从而确定拒绝域,通常称为u检验法。
贴士
对于例14-2的形式,
(1)H0:μ= μ0;H1:μ> μ0
也许更为合理的设置是
(2)H0:μ≤ μ0;H1:μ> μ0
但通过确认可以发现。两者拒绝域完全一致
因此,该类问题通常归结为采用(1)中的假设形式
拒绝域的形式受H1形式的影响。
(二)σ2未知,关于μ的检验(t检验)
例如,假设形式H0:μ= μ0;H1:μ≠ μ0
显然,检验统计量中不能包括未知参数,则Z统计量 不能应用。
考虑到S2是σ2的无偏估计量,因此用其进行替代,形成统计量
但替代后形成的统计量不会服从正态分布。而根据第12章定理二知,它服从自由度为n-1的t分布,因此可以用t分布的分位点进行检验。
如果假定显著水平为α,我们构建t统计量
则原假设的拒绝域为
这种方法被称为t检验法。
拒绝域的确定请自己计算。
其他t检验的拒绝域形式,请自己计算。
某电子元件的寿命x服从正态分布,均未知,先测得16只元件的寿命如下:
159 280 101 212 224 379 179 264
222 362 168 250 149 260 485 170
问是否有理由认为元件的平均寿命大于225?
解:假设H0: μ= μ0=225;H1:μ> μ0=225
确定拒绝域
取α=,则(15)=。
又由样本得,X=,S=,得t=<
所以t不在拒绝域,故接受H0,即元件寿命不大于225小时
两个正态总体均值差的检验
设X1,X2,…,Xn和Y1,Y2,…,Yn分别是具有相同方差的两个正态总体N(μ1,σ2)和N(μ2,σ2)的样本,且这两样本独立。记样本的均值为X和Y,样本的方差分别为S12和S12,设μ1,μ2 , σ2均是未知,现在求检验问题:H0:μ-μ0= δ ;H1:μ-μ0> δ的拒绝域。取显著水平为α。
解决的过程肯定还是构造一个不含未知参数的统计量,并通过它的分布确定拒绝域。
回顾第12章定理三:
定理三:设X1,X2,…,Xn和Y1,Y2,…,Yn分别是具有相同方差的两个正态总体N(μ1,σ2)和N(μ2,σ2)的样本,且这两样本独立。设X,Y分别为两个样本的均值,S2分别为两个样本的方差,则有
引入t统计量
由定理三知t~t(n1+n2-2)。
那么由t分布的形式很容易确定原假设的拒绝域为
例14-4,在平炉进行一项试验以确定改变操作方法的建议是否会增加钢的产量,试验在同一个炉上进行,除操作方法外其他条件尽可能相同,先用标准方法炼一炉,再用改进方法炼一炉,交替进行,各炼10炉,其钢产量如下
标准方法:
改进方法:
设两样本相互独立,其分别来自正态总体N(μ1,σ2)和N(μ2,σ2),μ1 , μ2 , σ2均未知,问新方法是否能提高刚产量一个单位以上。
解:经计算n1=10,x=,s12=
n2=10,y=,s22=
假设H0:μ1-μ2= -1 ;H1:μ1-μ2< -1.
查表得,(18)=,
所以拒绝域为:
则,t=<,落入了拒绝域,所以拒绝H0,认为新方法确实能够将产量提升1个单位以上。
基于成对数据的检验
(t检验)
例14-5,有两台光谱仪Ix,Iy,用了测量材料中某种金属的含量,为鉴定他们的测量结果有无显著的差异,制备了9件试验品,现在分别用仪器对每一块试验品测量一次,得到9对观察值,如下:
问能否认为这两台仪器测量结果有显著差异。(α=)
X
Y
D=x-y
如果我们认为两个仪器没有显著的测量差异,则等价于将di看做是随机误差,而随机误差服从均值为零的正态分布,所以我们检验的问题就是d~N(μd,σ2),它的均值是否为零,d1,d2,…d9为它的一组样本。其中σ2未知
那么假设:H0:μd =0, H1:μd ≠0
记d的样本均值和样本标准差分别为d=,S=。建立t统计量,确定拒绝域
根据样本观察值|t|=<,落入了拒绝域,故接受H0,认为两台仪器的测量结果没有显著差异。
正态总体方差的假设检验
(一)单个总体的情况
设总体X~N(μ,σ2),μ ,σ2为未知,设X1,X2,…,Xn是来自X的样本,给定显著性水平α,要求检验假设:
H0: σ2 = σ02 , H1: σ2 ≠ σ02
σ02为已知常数。
由于S2是的无偏估计,当H0为真时,比值将围绕1附件摆动,而第12章定理二知
那么我们就取
作为检验统计量。
另,我们知道由于E[χ2(n-1)]=n-1,所以我们建立的χ2统计量期望为n-1,即S2/σ02的期望应该为1,这与原假设形式完全一致。事实上等价于,只要χ2统计量不过分偏离均值,我们就不能拒绝原假设。
由此,根据χ2分布的形式和分位点,我们可以确定原假设的拒绝域为:
该方法被称为χ2检验法。
14-6 某厂生产某型号电池,其寿命长期以来服从方差σ02 = 5000的正态分布。现有一批电池,怀疑其寿命的波动性有所变化,随机抽取26只测出其寿命的方差为S2=9200,问根据这一数据能否推断该批电池的寿命的波动性较以往有显著不同(α=)。
解:假设H0:σ2 = σ02 =5000, H1:σ2≠5000;
现在n=26, χα/22 (n-1)= χ(25) = , χ1-α/22 (n-1)= χ(25) =.
所以,拒绝域为:
显然, χα/22 =46>,落入拒绝域,认为电池寿命的波动性有显著变化。
(二)两个总体的情况
设X1,X2,…,Xn和Y1,Y2,…,Yn分别是具有相同方差的两个正态总体N(μ1,σ12)和N(μ2,σ22)的样本,且两样本独立。记样本的均值为X和Y,样本的方差分别为S12和S12,设μ1,μ2 ,σ12 ,σ22均未知,现在求检验问题:H0: σ12=σ22 ;H1: σ12>σ22的拒绝域。取显著水平为α。
这时貌似没有直接的定理可以应用了,但我们知道,例如对于第一总体而言有:
所以,有
如果H0为真,则
根据H1有拒绝域
上述方法被称为F检验法。
例14-7,在平炉进行一项试验以确定改变操作方法的建议是否会增加钢的产量,试验在同一个炉上进行,除操作方法外其他条件尽可能相同,先用标准方法炼一炉,再用改进方法炼一炉,交替进行,各炼10炉,其钢产量如下
标准方法:
改进方法:
设两样本相互独立,分别来自正态总体N(μ1,σ12)和N(μ2,σ22),μ1,μ2,σ12和σ22均未知,试检验 H0: σ12=σ22 ;H1: σ12≠σ22,取α=
解:原假设的拒绝域为
现在根据样本S12=,S22=,得S12/S22=,未落入拒绝域,所以可以认为两个总体的方差相等。
所以例14-4中应用统计量对均值的差进行t检验的方法不是乱盖的!
拟合优度检验
现实研究中,我们通常希望判断观察到的数据是否符合某一分布,或者说观察到的数据是否与预期的分布相一致。这时我们就需要应用拟合优度检验。
这里我们重点介绍卡方检验。
χ2统计量的构建和应用非常简单,具体如下:
其中Oi是某组实验的观测值, Ei该组实验的理论期望值
它服从自由度为df=k-r-1的卡方分布,其中,k是样本量(实验次数或分类数),r为待估参数的个数。
(一)卡方对于拟合度的检验
(二)单个样本的卡方检验
例14-9,你是某超级市场的经理,需要检验三种不同促销方案的效果,每种方案历时一个月,每次促销期间顾客数量见下表:
你希望了解每次促销期间顾客数量是否有明显差异。
35580
-
合计
11780
9
3
12100
6
2
11700
3
1
顾客人数
月份
促销方案
假设:
H0:每次促销促销顾客人数相等
H1:不同的促销期间顾客人数限制差异。
计算统计量:
选择显著水平:
选择显著水平α=,查表得χ2(2)=
结论:
由于χ2>,落入拒绝域,所以促销给顾客数量带来显著差异。
第15章 方差分析
方差分析是比较若干总体均值是否相同时最常用的统计方法。
例如,市场需求受到消费者年龄、地域、学历、收入或偏好等一系列影响,现实中往往需要分析哪些是决定性的关键因素,方差分析就是解决这类问题的有效方法。
在方差分析中,我们将那些影响实验指标的条件称为因素,而将因素所处的条件称为水平。
根据所研究问题涉及的因素数量可以将方差分析分为单因素方差差分析和多因素方差分析
(一)单因素方差分析
例15-1 你是某服装公司老总,拟通过市场调研检验不同年龄的消费者对于该公司生产的服装购买量有无明显差异,以决定是否细分市场。于是选择了一组调研对象,并按那年龄将其分为老中青三个水平。随机调查了贵公司下辖五个专卖店在某一时刻不同年龄消费者的购买情况,获得资料如下表。
问不同年龄对于该服装的购买量有显著影响吗?是否细分市场?
x =
总样本均值
x3= 224
1120
x35= 213
x34= 208
x33= 223
x32=2 30
x31= 246
青
x2= 211
1055
x25= 207
x24= 191
x23= 215
x22= 205
x21= 237
中
x1= 202
1010
x11= 200
x14= 187
x13= 210
x12= 237
x11= 215
老
均值
合计
5
4
3
2
1
专卖店
分组
H0:不同年龄对于该服装的购买量无显著影响;
H1:不同年龄对于该服装的购买量有显著影响。
问题显然还是构造统计量,但这之前必须弄明白如何设计统计量。
(1)提出一组变量
总离差平方和QT:
是实验的总误差,反应数据波动的程度。
其中,m是水平数量,n是实验数量。
事实上,我们是在用方差的思想度量数据的变异趋势。
组间离差平方和QA:
是各水平下样本均值与总体均值之间的差异。这是由于你分组引起的,被称为系统误差。
组内离差平方和QE:
是在各个水平下,样本值与水平均值之间的差异,这是有随机误差引起的,所以也称为随机误差平方和。
显然 QT=QA+QE。
例题中
我们来看重要的两个变量
QA表示分组形成的系统误差,QE是组内的随机误差,那么,如果假设H0为真,则QA与QE不会有明显偏差。如果两者偏差过大,则拒绝H0。
可以想见,如果QA =0,则无论如何不能拒绝H0 ;如果QE =0,则任何非零的QA都足以拒绝H0 。
借鉴中两个总体的方差检验方法,我们选用F统计量。
(2)选择检验统计量F
这里[m-1,m(n-1)]为自由度。
例题中m=3,n=5,所以,
若选定显著性水平α=,得[2,12]=
若选定显著性水平α=,得[2,12]=
可见[2,12]>F> [2,12]。所以10%的显著性水平下拒绝H0,5%以下的显著水平,接受H0,即说明不同年龄对于服装销量有影响,但影响不够强烈。没必要细分
(3)形成方差分析表
-
-
-
-
QT=
总误差
-
12
QE=2520
随机误差(组内)
(2,12)
(2,12)
2
QA=
因素A的作用(组间)
临界值
F值
自由度
离差
方差来源