第四讲 连续变量的统计推断(一):均值比较的t检验
第一节、假设检验概述
第二节、单样本的T检验
第三节、两独立样本的T检验
第四节、两配对样本的T检验
第一节 假设检验概述
一、推断统计与假设检验
推断统计是根据样本数据推断总体数量特征的统计分析方法。
根据样本来推断总体的原因:
总体数据不可能全部收集到。如:质量检测问题
收集到总体全部数据要耗费大量的人力和财力
推断统计通常包括以下两个内容:
假设总体的分布已知---参数检验
假设总体的分布未知---非参数检验。
统计方法
描述统计
推断统计
估计
假设检验
参数检验
非参数检验
参数检验:事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立;
非参数检验:是指在总体不服从正态分布且分布情况不明时,用来检验数据资料是否来自同一个总体假设的一类检验方法。由于这些方法一般不涉及总体参数故得名。
参数检验方法和非参数检验方法比较
非参数检验总是比传统检验安全。
在总体分布形式已知时,非参数检验就不如传统方法效率高。这是因为非参数方法利用的信息要少些。往往在传统方法可以拒绝零假设的情况,非参数检验无法拒绝。
非参数统计在总体未知时效率要比传统方法要高,有时要高很多。是否用非参数统计方法,要根据对总体分布的了解程度来确定。
二、假设检验的基本思想
1、假设检验采用的逻辑推理方法是反证法
为了检某假设是否成立,先假定它正确,然后根据样本信息,观察由此假设而导致的结果是否合理,从而判断是否接受原假设;
2、判断结果合理与否,是基于“小概率事件不易发生”这一原理的
即在一次抽样中,小概率事件不可能发生。如果在原假设下发生了小概率事件,则认为原假设是不合理的;反之,小概率事件没有发生,则认为原假设是合理的。
小概率事件在一次试验中几乎不会发生。
0
接受域
拒绝域
拒绝域
临界值
临界值
Z统计量
显著性水平
假设检验是对我们所关心的却又是未知的总体参数先作出假设,然后抽取样本,利用样本提供的信息,根据小概率原理对假设的正确性进行判断的一种统计推断方法。
如:对居民平均取款金额进行推断
H0:总体平均金额2000
样本平均金额为4000,由于存在抽样误差,不能直接拒绝H0。而需要考虑:在H0成立的条件下,一次抽样得到平均金额为4000的可能性有多大。如果可能性较大,是个大概率事件,则认为H0正确。否则,如果可能性较小,是个小概率事件,但确实发生了,则只能认为H0不正确。
... 因此我们拒绝假设 = 50
... 如果这是总体的真实均值
样本均值
m
= 50
抽样分布
H0
这个值不像我们应该得到的样本均值 ...
20
三、假设检验的步骤
(1)提出原假设H0。
即根据检验的目标,对待推断的总体参数或分布作一个基本假设
(2)选择检验统计量。
构造检验统计量,且该统计量一定服从某种已知分布.
(3)计算检验统计量值发生的概率P值
利用收集到的样本数据和基本假设计算检验统计量的值,并得到相应的相伴概率,即:检验统计量在某个特定的极端区域取值在H0成立时的概率.
(4)给定显著性水平α;
(5)作出统计决策。
如果相伴概率小于用户给定的显著性水平a,则拒绝H0.否则,不能拒绝H0.
什么是P 值?
是一个概率值;
如果原假设为真,P-值是抽样分布中大于或小于样本统计量的概率;
被称为观察到的(或实测的)显著性水平。
双侧检验的P 值
/ 2
/ 2
Z
拒绝
拒绝
H0值
临界值
计算出的样本统计量
计算出的样本统计量
临界值
1/2 P 值
1/2 P 值
左侧检验的P 值
H0值
临界值
a
样本统计量
拒绝域
抽样分布
1 -
置信水平
计算出的样本统计量
P 值
右侧检验的P 值
H0值
临界值
a
拒绝域
抽样分布
1 -
置信水平
计算出的样本统计量
P 值
利用 P 值进行检验
(决策准则)
若p-值 > ,不拒绝 H0
若p-值 < , 拒绝 H0
四、假设检验的两类错误
假设检验中的两类错误是指在假设检验中,由于样本信息的局限性,势必会产生错误,错误无非只有两种情况,在统计学中,我们一般称为Ⅰ类错误,Ⅱ类错误。
第一类错误(Ⅰ类错误)也称为 α错误:拒真,是指当虚无假设(H0)正确时,而拒绝H0所犯的错误。这意味着研究者的结论并不正确,即观察到了实际上并不存在的处理效应。
第二类错误(Ⅱ类错误)也称为β错误:纳伪,是指虚无假设错误时,反而接受虚无假设的情况,即没有观察到存在的处理效应。
四、均值比较检验的SPSS实现
【比较均值】子菜单
均值:分组计算样本的描述性统计量。
单样本t检验:单样本t检验,即比较样本均值和总体均值的t检验。
独立样本 t检验:独立两样本t检验,即比较两独立样本均值的t检验。
配对样本t检验:配对样本t检验,即比较配对设计的差数均值与0的t检验。
单因素 ANOVA:单因素方差分析。
第二节 均值(Means)—分组计算样本的描述性统计量
【均值】过程的特点:
和描述性统计分析的过程相比,【均值】过程可直接给出分组的统计结果
同时,可直接输出方差分析的结果而无需调用专门的方差分析过程
案例:在CCSS项目中,以项目启动时的2007年4月的数据为指数基线,基线期指数值为100,随后各期所计算出的指数则代表当期数值相对于“基线”调查数值的变动比例。中提供了北京、上海、广州3个一线城市的调查数据,现有如下目的:
对2007年4月北京、上海、广州3个一线城市的消费者信心指数值的均值进行描述。
对2007年4月3个城市消费者信心指数均值进行分组描述的分析步骤:
第一步:选择待分析的个案
第二步:均值描述过程
点击选项(Options)…
结果解读:
1、数据摘要与基本分组信息
2、方差分析结果
3、相关性度量表
4、选取不同分层变量对结果的影响
(1)分组变量设置为一层,则输出两个独立的表格。
如上图, 将两个分组变量“城市”和“学历”定义在同一层内,即二者是平等的关系,所以会分别按照性别和地区分组输出两张基本信息表。
(2)分组变量设置为两层,则输出一个交叉表格。
如前图,将“城市”作为第一层分组变量,“学历”作为第二层分组变量,二者之间是有层次关系的,所以最后输出的是先按城市分组,在同一城市内再按学历分组的一张基本信息表。
方法二:运用“探索分析”,
练习:1. 分析2007年4月总指数是否服从正态分布。
2.比较三个城市总指数的箱线图。
2007年4月总指数的正态性检验和Q-Q图
2007年4月三个城市总指数的箱线图
2007年4月三个城市总指数的比较:
第二节 单样本的t检验
一、检验目和条件
检验单个变量的均值是否与给定的常数(总体均值)之间是否存在显著差异。如:分析学生的IQ平均分是否为100分;大学生考研率是否为5%。
条件:要求样本来自的总体服从或近似服从正态分布。
总体均值的检验
总体 是否已知?
用样本标
准差S代替
t 检验
小
样本容量n
否
是
z 检验
z 检验
大
总体均值的检验(2 已知或2未知、大样本)
1.假定条件
总体服从正态分布
若不服从正态分布, 可用正态分布来近似(n30)
2.使用Z-统计量
2 已知:
2 未知:
总体均值的检验 (2未知小样本)
1. 假定条件
总体为正态分布
2未知,且小样本
2. 使用t 统计量
单样本T检验的实现思路
提出原假设:
计算检验统计量和概率P值
给定显著性水平与p值做比较:如果p值小于显著性水平,小概率事件在一次实验中发生,则我们应该拒绝原假设,反之就不能拒绝原假设。
三、单样本t检验的SPSS实现
案列:检验2007年4月3个一线城市的消费者信心指数值是否和基准值100存在显著差异。
在检验值框中输入检验值100
Option选项用来指定缺失值的处理方法。
其中:
(1)Exclude cases analysis by analysis表示计算时涉及的变量上有缺失值,则剔除在该
变量上为缺失值的个案;
(2)Exclude cases listwise表示剔除所有在任
意变量上含有缺失值的个案后再进行分析。
可见,较第二种方式,第一种处理方式较充分地利用了样本数据。在后面的分析方法中,SPSS对缺失值的处理方法与此相同,不再赘述。
输出默认95%的置信区间。
至此,SPSS将自动计算t统计量和对应的概率p值
输出结果:
总指数基本描述统计结果
样本标准差S
均值标准误
样本均值
样本容量n
人均住房面积单样本t检验结果
T检验值
自由度n-1
T统计量观察值的双尾概率P值
总值均值与原假设值差
差的95%的置信区间
检验结论:对于给定显著性水平α=,由于统计量的双尾P值大于,因此,不能
拒绝原假设,不能认为2007年4月的平均值与假设的总体均值有显著差异。
单样本t检验的应用条件:
由中心极限定理可知,即使原数据不服从正态分布,只要样本容量足够大,其样本均值的抽样分布仍然是正态的,因此,当样本量较大时,研究者很少去考虑单样本t检验的适用条件。
也就是说,只要数据分布不是强烈的偏态,一般而言,单样本和检验都是适用的。
练习
根据各保险公司人员构成情况数据,对我国目前保险公司从业人员的受高等教育的程度和年轻化的程度进行推断:
保险公司具有高等教育水平的员工比例的平均值不低于;
年轻人比例的平均值与无显著差异。
第三节 两独立样本的T检验
一、 两独立样本T检验的目的
利用来自两个总体的独立样本,推断两个总体的均值是否存在显著性差异;
注:
两独立样本的样本容量可以相等,也可以不相等;
样本来自的总体服从或近似服从正态分布。
两个独立样本之差的抽样分布
m
1
s
1
总体1
s
2
m
2
总体2
抽取简单随机样样本容量 n1
计算X1
抽取简单随机样样本容量 n2
计算X2
计算每一对样本
的X1-X2
所有可能样本
的X1-X2
m1- m2
抽样分布
两个总体均值之差的检验 (12、 22 已知)
1.假定条件
两个样本是独立的随机样本
两个总体都是正态分布
若不是正态分布, 可以用正态分布来近似(n130和 n230)
2.检验统计量为
两个总体均值之差的检验 (12、 22 未知,大样本)
检验统计量为
两个总体均值之差的检验 (12、 22 未知但相等,小样本)
检验具有等方差的两个总体的均值
假定条件
两个样本是独立的随机样本
两个总体都是正态分布
两个总体方差未知但相等
检验统计量
其中:
两个总体均值之差的检验 (12、 22 未知且不相等,小样本)
检验具有不等方差的两个总体的均值
假定条件
两个样本是独立的随机样本
两个总体都是正态分布
两个总体方差未知且不相等12 22
检验统计量
方差齐性检验(Levene F方法):
原理:
计算两组样本的均值
计算各个样本与本组均值的平均离差绝对值;
利用单因素方差分析推断两独立总体平均离差绝对值是否有显著差异。
注意:
在对两独立样本进行T检验时,两组样本方差相等和不等时使用的计算t值的公式不同,所以首先进行方差F检验。
用户需要根据F检验的结果自己判断选择t检验输出中的哪个结果,得出最后结论。
如果推断两总体方差相等则看方差相等的T检验值和P值,
如果推断两总体方差不相等则看方差不相等的T检验值和P值。
二、两独立样本T检验的SPSS实现
检验的基本思路
提出原假设H0:两总体均值不存在显著差异:
计算统计量和P值:
首先利用F检验确定两个总体的方差是否相等;
后再选择合适的T统计量计算观测值和概率P值;
根据显著性水平α和概率P值进行统计决策。
注:进行两独立样本t检验之前,正确地组织数据是一个非常关键的任务。SPSS要求将两组样本数据存放在一个SPSS变量中,同时,为区分哪些样本来自哪个总体,还应定义一个分类变量。
案例:研究者认为家庭收入高低可能会影响消费者信心的平均水平,收入较高的家庭其消费者信心应当较低收入家庭更高。
根据前期研究成果,CCSS项目中,将受访家庭按照年收入是否大于万无人民币分为两组。
要求,以2007年4月的数据为例,比较这两组家庭的消费者信心均值有无显著差异。
原假设是:两个家庭收入级别在总指数上无显著差异,即:
数据文件,index1为总指数,Ts9为家庭收入2级。
SPSS两独立样本t检验的基本操作步骤是:
4、单击Define Groups按钮定义两总体的标志值。其中:Use specified values表示分别输入两个不同总体的变量值;Cut point框中应输入一个数字,大于等于该值的对应一个总体,小于该值的对应另一个总体。
2、选择检验变量到Test Variable(s)框中。
3、选择总体标志变量到Grouping Variables框中。
SPSS输出结果:
Levene 检验F统计量值为,对应的概率P值为,小于给定的显著性
水平α=,因此,拒绝两总体方差相等的原假设。
选择方差不等时的t检验的结果进行分析。t统计量值为,对应的双尾概率的
P值为,如果给定显著性水平为α=,由于P值小于,因此,拒绝两
总体均值相等的原假设。即:认为两总体的均值有显著差异。
检验结果表明,高收入和低收入的消费者信心存在显著差异。
第四节 配对样本的t检验
一、两配对样本T检验的目的
利用来自两个总体的配对样本,推断两个总体的均值是否存在显著性差异;
注意:
两配对样本的样本容量应该相等,两组样本观察值的顺序一一对应,不能随意改变;
样本来自的总体服从或近似服从正态分布。
所谓配对,可以是个案在前、后两种状态下某属性的两种不同特征、也可以是对某事物两个不同侧面的描述。
例1:为研究某种减肥茶是否有显著的减肥效果,需要对肥胖人群喝茶前与喝茶后的体重进行分析。
数据搜集时,通常要采用配对的抽样方式,即首先从肥胖人群中随机抽取部分志愿者并记录下他们喝茶的体重。
喝茶一段时间后,重新观测这些肥胖志愿者喝茶后的体重。
这样获得的两组样本就是配对样本。
例2:为分析两种不同促销形式对商品销售额是否产生显著影响,需要分别收集几种商品在不同促销形式下销售额的数据。为保证研究结果的准确性,也应采用配对的抽样方式。
数据搜集时,随机选择几种商品,并分别记录它们在两种不同促销方式下的销售额,这样的两组样本是配对的。
注意,配对样本,两组样本观察值的先后顺序是一一对应的,不能随意更改。如,减肥茶问题中,每对观察值数据都唯一对应一个肥胖者,不能随意改变观察值的先后次序。
配对样本的 t 检验 (数据形式)
M
M
M
M
D1 = x 1i - x 2i
x 2i
x 1i
i
M
M
M
M
D1 = x 12 - x 22
x 22
x 12
2
D1 = x 1n- x 2n
x 2n
x 1n
n
D1 = x 11 - x 21
x 21
x 11
1
差值
样本2
样本1
观察序号
配对样本的 t 检验(检验统计量)
样本差值均值
样本差值标准差
自由度df =nD - 1
统计量
D0:假设的差值
二、两配对样本T检验的实现思路
提出原假设H0:两总体均值不存在显著差异D0=0;
选择检验统计量。
两配对样本T检验是间接通过单样本T检验实现的。配对样本T检验实际上是先求出每对观测值之差值,对差值变量求平均。检验配对变量均值之间差异是否显著,实质是检验差值变量的均值与0之间差异的显著性;
计算样本统计量观测值和概率P值;
根据显著性水平和概率P值进行统计推断
三、两配对样本T检验的SPSS实现
为研究某种减肥茶是否具有明显的减肥效果,某美体健身机构对35名肥胖志愿者进行了减肥跟踪调研。首先将其喝减肥茶以前的体重记录下来,三个月后再依次将这35名志愿者喝茶后的体重记录下来。通过这两组样本数据的对比分析,推断减肥茶是否具有明显的减肥作用。数据文件名为:减肥茶数据.sav
两配对样本T检验的数据组织
分析:这里,体重可以近似认为服从正态分布。从样本数据的获取过程看,这两组样本是配对的,可借助两配对样本t检验的方法。
把一对或若干对检验变量选择
到Paired Variables框
至此,SPSS将自动计算t统计量和对应的概率p值。
SPSS输出结果:
喝茶前、后体重的基本描述统计量
喝茶前后平均体重有差异,但这一差异是否是系统性的,需要进一步进行检验。
喝茶前、后体重的相关系数及显著性检验
喝茶前、后体重的不存在显著的线性相关。
喝茶前、后体重的两配对样本t检验结果
检验结果表明,t检验统计量值为,对应的双尾概率P值接近于0,小于给定的
显著性水平,因此,应拒绝总体上体重差的平均值为0的原假设。
结论:可以认为,喝茶前、后的体重平均值存在显著差异,可以认为该减肥茶具有
显著的减肥效果。
Rejection region does NOT include critical value.
Rejection region does NOT include critical value.
38
In this diagram, do the populations have equal or unequal variances? Unequal.
9
Just take the mean and standard deviation of the difference.
SD is simply the standard deviation. The formula is the computational formula.