40
经济数学—概率论与数理统计教案
第 6 章 统计推断
授课序号 01
教 学 基 本 指 标
教学课题 第 6 章 第 1 节 点估计 课的类型 新知识课
教学方法 讲授、课堂提问、讨论、启发、自学 教学手段 黑板多媒体结合
教学重点 点估计、估计量与估计值的概念、估计量的无偏
性、有效性和一致性的概念、、估计量的相合性、
矩估计法(一阶、二阶距)和最大似然估计法。
教学难点 矩估计法(一阶、二阶距)和最
大似然估计法。
参考教材 《经济数学—概率论与数理统计(慕课版)》 作业布置 课后习题
大纲要求 1.理解参数的点估计、估计量与估计值的概念;了解估计量的无偏性、有效性(最小方差性)
和一致性(相合性)的概念,并会验证估计量的无偏性;会利用大数定律证明估计量的相合性。
2.掌握矩估计法(一阶、二阶距)和最大似然估计法。
教 学 基 本 内 容
一.矩估计法
1.矩估计法的基本思想是替换原理,即用样本矩去替换相应的总体矩,这里的矩可以是原点矩也可以是中
心距。我们知道,矩是由随机变量的分布唯一确定的,而样本来源于总体,由大数定律,样本矩在一定程度上
反映总体矩的特征。
2.矩估计法:用样本矩来估计总体矩的估计方法称为矩估计法.
3.矩估计法的步骤:
设总体 X 的分布中包含 m 个未知参数 1, 2,…, m, 为来自总体 X 的样本,如果总体
的 k 阶 原 点 矩 存 在 , 并 设 , 相 应 的 k 阶 样 本 原 点 矩 为
,以 替代 ,即可得到关于 1, 2,…, m 的方程组
方程组的解 ,称为参数 k 的矩估计量.
4.若代入一组样本观测值 ,则 称为参数 k 的矩估计值.
1 2, , , nX X XL
( )kE X 1 2( ) ( , ,..., )
k
k mE X
1
1 n k
k i
i
A X
n
kA ( )kE X
1 2
1
1
( , ,..., ) , 1, 2,...,
n
k
k m i
i
X k m
n
1 2( , , , ), 1, 2, ,k nX X X k m
L L ( 1, 2, , )k m L
1 2, , , nx x xL 1 2( , , , )k nx x x
L ( 1, 2, , )k m L
41
二.最大似然估计法
1.最大似然估计的步骤:
若总体 X 的分布中含有 k 个未知待估参数 1, 2,…, k,则似然函数为
解似然方程组 ,或者对数似然方程组 ,即可得到参数的最大似然
估计 。
2.定理:若 为参数 的最大似然估计, 为参数 的函数,则 是 的最大似然估计.
三.点估计的评价标准
1. 无偏性:设 是未知参数 的估计量,若 ,则称 为 的无偏估计。
2. 有效性:设 均为参数 的无偏估计量,若 则称 有效。
3. 相合性(一致性):设 为未知参数 的估计量,若对任意的 ,都有 ,即
依概率收敛于参数 ,则称 为 的相合(一致)估计。
4.定理:设 为 的估计量,若 ,则 为 的相合(一致)估计.
四.例题讲解
例 1.设 X 为某零配件供应商每周的发货批次,其分布律为
其中 是未知参数,假设收集了该供应商 8 周的发货批次如下:3,1,3,0,3,1,2,3,求 的矩估计值.
例2.设X为投资者对于某种金融产品的持有时间,其概率密度为 其中未知参数 ,
为来自总体 X 的简单随机样本,求 的矩估计量.
例 3.已知某项银行业务的审批时间 X 在( a , b)上服从均匀分布,其中 a , b 未知,设抽查了 n 位办理该业
务的顾客,他们的审批时间分别为 ,试用矩估计法估计 a , b .
例 4.设袋中放有很多的白球和黑球,已知两种球的比例为 1:9,但不知道哪种颜色的球多,现从中有放回
地抽取三次,每次一球,发现前两次为黑球,第三次为白球,试判断哪种颜色的球多。
例 5.求出例 2 中未知参数 的最大似然估计量.
1 2 1 2
1
( , ,..., ) ( ; , ,... ).
n
k i k
i
L f x
0, 1,2, ,
i
L
i k
L
ln
0, 1,2, ,
i
L
i k
L
1 2
ˆ ˆ ˆ, ,..., k
̂ )g ( ˆ )g ( )g (
1 2
ˆ ˆ( , , , )nX X X L )ˆ(E ̂
21
ˆ,ˆ 1 2ˆ ˆ( ) ( ) , D D 21 ˆˆ 比
̂ 0 ˆlim 1
n
P
̂ ̂
̂ $ ˆlim ( ) , lim ( ) 0
n n
E D
̂
2 2
0 1 2 3
2 (1 ) 1 2
X
P
1
1,,
( )
1.
0,
x
f x x
x
1
1 2, , , nX X XL
1 2, , ..., nX X X
42
例 6. ,其中 是未知参数,设
是样本观测值,求 的最大似然估计.
例 7.某种电子邮箱建议用户设置增强密码以保护账户的安全,假设 p 是该电子邮箱的全体用户中设置增
强密码的比例。现随机抽取了 20 位用户,发现其中有 3 位有增强密码.
(1)求 p 的最大似然估计;
(2)接着再抽 5 位用户,求他们都没有增强密码的概率的最大似然估计.
例 8.设样本 来自正态总体 X ℃ N (, 2),其中, 2 未知,求和 2 的最大似然估计。
例 9.设总体 X 的 k 阶矩 存在,证明: 不论 X 服从什么分布,样本的 k 阶矩
是 的无偏估计。
例 10.已知 , 都是总体方差 的估计量,问哪个估计量更
好?
例 11.设总体 的概率密度为 ,其中 是未知参数, 为来自
总体 X 的简单样本,选择适当常数 c,使得 是 的无偏估计.
例 12.设某种产品的寿命 X 服从指数分布,其概率密度为 ,其中 为未知参数,
是来自总体的样本,设有 的估计量
,
,
问哪一个最优?
例 13.设 是总体 X 的样本均值,则当 作为总体期望 E (X)的估计量时, 是 E (X)的相合估计量。
例 14 . 试证明 是 的
相合估计量.
X设某种元件使用寿命 的概率密度为
2( )2 ,
( )
0 ,
xe x
f x
其它
0
1, , , nx xL
1 2, , , nX X XL
( )kk E X
1
1 n k
k i
i
A X
n
k
2
2
1
1
( )
n
i
i
B X X
n
2 2
1
1
( )
1
n
i
i
S X X
n
2
X 2
2
2
( ) 3
0
x
x
f x
其它
1 2, , ..., nX X X
2
1
n
i
i
c X
2
1
0,
( )
0 0
x
e x
f x
x
1 2 3 4, , ,X X X X
1 1 2 3 4
1 1ˆ ( ) ( )
6 3
X X X X
2 1 2 3 4
1ˆ ( 2 3 4 )
5
X X X X
3 1 2 3 4
1ˆ ( )
4
X X X X
X X X
1~ ( ,2 ), 0 , , nX U X X X K设总体 其中 是未知参数, 是 的样本,
2ˆ=
3
X
43
授课序号 02
教 学 基 本 指 标
教学课题 第 6 章 第 2 节 区间估计 课的类型 新知识课
教学方法 讲授、课堂提问、讨论、启发、自学 教学手段 黑板多媒体结合
教学重点 置信区间、区间估计、单个正态总体的均值和方
差的置信区间、两个正态总体的均值差和方差比
的置信区间。
教学难点 置信区间、区间估计、单个正态
总体的均值和方差的置信区间、
两个正态总体的均值差和方差
比的置信区间。
参考教材 《经济数学—概率论与数理统计(慕课版)》 作业布置 课后习题
大纲要求 1.掌握建立未知参数的(双侧和单侧)置信区间的一般方法;
2.了解区间估计的概念,会求单个正态总体的均值和方差的置信区间,会求两个正态总体的均
值差和方差比的置信区间。
教 学 基 本 内 容
一.区间估计的概念
1.置信区间:设 为总体的未知参数,若对于给定的(0< <1),存在统计量
和 ,使得 ,则称随机区间 为参数 的置信度(或置信水
平)为 1- 的置信区间, 分别称为置信下限和置信上限。
2.枢轴量: 称满足下述三条性质的量 Q 为枢轴量.
(1)是待估参数 和估计量 的函数;
(2)不含其他未知参数;
(3)其分布已知且与未知参数 无关。
3.求置信区间的一般步骤:
(1)根据待估参数构造枢轴量 Q,一般可由未知参数的良好估计量改造得到;
(2)对于给定的置信度 1-,利用枢轴量 Q 的分位点确定常数 a,b,使 ;
(3)将不等式恒等变形为 ,即可得到参数 的置信度为 1- 的置信区间 .
二.正态总体参数的区间估计
单个正态总体的情形:设总体 , 是取自总体 的样本
(1) 已知,均值 的置信区间: 的置信度为 的置信区间为 .
1 1 1 2
ˆ ˆ ( , , , )nX X X L
2 2 1 2
ˆ ˆ ( , , , )nX X X L 1 2ˆ ˆ{ } 1P 1 2ˆ ˆ[ , ]
1 2
ˆ ˆ 和
X
{ } 1P a Q b
1 2
ˆ ˆ{ } 1P 1 2ˆ ˆ[ , ]
2~ ( , )X N 1 2, , , nX X XL X
2 1
2 2
,X u X u
n n
44
(2) 未知,均值 的置信区间: 的置信度为 的置信区间为 .
(3) 未知,方差 的置信区间: 的置信度为 的置信区间为 .
以上关于正态总体参数的区间估计的讨论可以列表 1 和表 2 如下:
四.例题讲解
例 1.设 X1 ,…,Xn 为来自正态总体 X ℃ N (, 2),其中 2 已知, 未知, 试求出 的置信度为 1-
的置信区间。
例 2 .假设投资者在总投资额中,针对某种金融产品的投资比例为 X (% ),其中 X 服从正态分布
,现随机调查了 40 位投资者, 得知他们对该金融产品的投资比例的样本均值为 (%),求
的置信度为 的置信区间.
例 3.为估计某种汉堡的脂肪含量,随机抽取了 10 个这种汉堡,测得脂肪含量(%)如下:
,,,,,,,,,.
假设该种汉堡的脂肪含量(%)服从正态分布,求平均脂肪含量 的置信度为 的置信区间.
例 4.已知某种钢丝的折断力服从正态分布 ,从一批钢丝中任意抽取了 10 根,测得折断力数据
(单位:kg)如下:578,572,570,568,572,570,570,596,584,572,求 和 的置信度为 的置
信区间。
2 1
2 2
( 1) , ( 1)
S S
X t n X t n
n n
2 2 1
2 2
2 2
1
2 2
( 1) ( 1)
,
( 1) ( 1)
n S n S
n n
2( , )N
2( , )N
2
45
授课序号 03
教 学 基 本 指 标
教学课题 第 6 章 第 3 节 假设检验 课的类型 新知识课
教学方法 讲授、课堂提问、讨论、启发、自学 教学手段 黑板多媒体结合
教学重点 显著性检验的基本思想、假设检验的基本步骤、
假设检验可能产生的两类错误、正态总体参数的
假设检验
教学难点 假设检验的基本步骤
参考教材 《经济数学—概率论与数理统计(慕课版)》 作业布置 课后习题
大纲要求 1.理解显著性检验的基本思想,掌握假设检验的基本步骤,了解假设检验可能产生的两类错误。
2.了解单个正态总体均值和方差的假设检验。
教 学 基 本 内 容
一.假设检验的基本思想
1.假设检验的基本思想:假设检验规则的制定有多种方式,其中一种较为通俗易懂,该方式所依据的是
人们在实践中普遍采用的一个原理——实际推断原理,也称小概率原理,即“小概率事件在一次试验中几乎不
会发生”. 按照这一原理,首先需要依据经验或过往的统计数据对总体的分布参数作出假设 ,称为原假设,
其对立面称为备择假设,记为 。然后,在 为真的前提下,构造一个小概率事件,若在一次试验中,小概
率事件居然发生了,就完全有理由拒绝 的正确性,否则就没有充分的理由拒绝 ,从而接受 ,这就是
假设检验的基本思想。
2.拒绝域:在假设检验中,将小概率事件 称为拒绝域或者否定域。
二.假设检验的基本步骤
1. 建立假设
根据题意合理地建立原假设 H0 和备择假设 H1,如 ;
2. 选取检验统计量
选择适当的检验统计量 Q,要求在 H0 为真时,统计量 Q 的分布是已知的;
3. 确定拒绝域
按照显著性水平,由统计量 Q 确定一个合理的拒绝域;
4. 作出判断
由样本观测值,计算出统计量的观测值 q,若 q 落在拒绝域内,则拒绝 H0,否则接受 H0 .
三.假设检验的两类错误
1.原假设 确实成立,而检验的结果是拒绝 ,这类错误称为第一类错误或“弃真”错误;
0H
1H 0H
0H 0H 0H
{| | }U
0 0 1 0: , :H H
0H 0H
46
2.原假设 确实不成立,而检验的结果是接受 ,这类错误称为第二类错误或“取伪”错误.
四.单个正态总体参数的假设检验
设总体 , 是取自总体的一个样本,给定显著性水平为(0< <1),下面介
绍几种常见的检验类型:
1. 已知,关于 的检验
建立假设 ,选取检验统计量 ,按照显著性水平,确定
拒绝域 ,由样本观测值求出统计量的观测值 u ,然后作判断,由于我们选取的检验统计量为
,故称其为 U 检验法.
2. 未知,关于 的检验
首先建立假设 ,选取检验统计量 在 H0 为真时,统计量 T ℃
t(n-1);按照显著性水平,确定拒绝域 .由样本观测值求出统计量的观测值 t,然后作判断,由
于选取的检验统计量为 故该检验法称为 T 检验法.
3. 未知,关于 的检验
检验假设 H0: 2=02,H1: 2℃02,在 H0 为真时,
检验统计量为 ,
按照显著性水平,可得拒绝域
上述检验法选取的检验统计量是 ,称为 2 检验法.
五.单侧检验
设总体 , 是取自总体的一个样本,给定显著性水平为(0< <1),若 2 已
知,检验 是否增大?
首先建立假设 ,或者
0H 0H
2~ ( , )X N 1 2, , , nX X XL
2
0 0 1 0: , :H H
0 ~ (0,1)
X
U N
n
2
U u
0XU
n
2
0 0 1 0: , :H H ,
0
n
S
X
T
2
{ ( 1)}T t n
,0
n
S
X
T
2
2
2 2
2
0
( 1)
~ ( 1)
n S
n
2 2 2 2
1
2 2
{ ( 1) ( 1)}.n n
或
2
2~ ( , )X N 1 2, , , nX X XL
0 0 1 0: , : H H ,: 00 H ,: 01 H
47
选取检验统计量 ,当 为真时, 不应太大,
则 U 偏大时应拒绝 ,故按照显著性水平,构造小概率事件为 ,即拒绝域 .
由样本观测值求出 U 的观测值 u,然后作判断.
六.例题讲解
例 1.设某种特殊类型的集成电路所用硅晶圆片的目标厚度为 245(单位: ),在正常情况下,产品厚
度应该服从正态分布 我们抽取了 50 个硅晶圆片样品,并测定了每个硅晶圆片的厚度,得到了样
品的平均厚度为 ( ),这些数据是否表明实际的硅晶圆片平均厚度与目标值有显著差异?
例 2.设总体 服从正态分布 , 是该总体的样本,对于检验假设
,
已知拒绝域为 ,问此检验犯第一类错误的概率是多少?若 ,则犯第二类错误的概率是多少?
例 3.某消防设备制造商声称,他们生产安装的办公楼自动喷水灭火系统的平均激活温度是 54 ℃.现随机抽
取了该制造商的 9 个系统,经测试得到的平均激活温度为 ℃。如果激活温度服从正态分布,且标准差为
℃,则显著性水平 时,该样本数据是否与制造商的声明相矛盾?
例 4.葡萄酒中除了水和酒精外,占比最多的就是甘油。甘油是酵母发酵的副产品,它有助于提升葡萄酒
的口感和质地,因而经常需要对葡萄酒中的甘油含量进行检测。假设某品牌葡萄酒的甘油含量 X(mg/mL)服
从正态分布,现随机抽查了 5 个样品,测得它们的甘油含量分别为 ,若显著性水平
,问是否有理由认为该品牌葡萄酒的平均甘油含量为 4(mg/mL)?
例 5.某供货商声称,他们提供的金属线的质量非常稳定,其抗拉强度的方差为 9,为了检测其抗拉强度,
在该种金属线中随机地抽出 10 根,测得样本标准差 (kg) ,设该金属线的抗拉强度服从正态分布
,若显著性水平为 =,问是否可以相信该供货商的说法?
例 6.某地区的物价部门对当前市场的大米价格情况进行调查,共调查了 30 个集市上的大米售价,测得它
们的平均价格为 2. 21 元/500 g,已知以往大米平均售价一直稳定在 2 元/500 g 之内.如果该城市大米售价服
从正态分布 ,假定方差不变,能否根据上述数据认为该地区当前的大米售价明显高于往年?
0 ~ (0,1)
X
U N
n
0H
0XU
n
0H { }P U u { }U u
m
2(245, ).N
m
X 2( ,1 )N 1 2 3 4, , ,X X X X
0 1 1 1: 0; : ( 0)H H
1 1
,, ,,
2( , )N
( , )N
( )