一、区间估计的概念
定义 设总体X的未知参数为q,对于给定的a (0<a<1),由样本(X1,X2,…,Xn)确定两个估计量:
使
成立
则用区间
估计参数q,估计对的概率为1-a
称为参数q的估计区间,或叫置信区间;
分别为参数q的置信下限、置信上限;
1-a为估计的置信度(置信概率或叫可靠程度);
a为估计的显著性水平,表示估计错的概率,一般地取a=左右。
返回
一、区间估计的概念
注意:
①比较
与P{a<X<b}=1-a 不同,
参数q不是随机变量,它有真值,而 为随机区间。
要求 以1-a的概率包含其参数q的真值.
②具体求 时,是通过选取一个含有参数q的适当统计量,并确定适当的临界值,从而解出
返回
上页
一、区间估计的概念
③估计的可靠度1-a与精确程度的关系:
估计区间的长度越短,精确度就越高,而可靠度会降低;
反之提高可靠度会导致估计区间变长——精确度降低。
通常给定a(可靠度1-a确定),通过选取适当的统计量,
并且确定适当的“临界值”,使所得估计区间尽可能的短.
即给定可靠度尽可能地提高精确度。
返回
上页
二、单个正态总体参数的区间估计
基本步骤:
1.根据不同的情况和条件,选取适当的统计量:
①其中包含待估计的参数q;
②所选统计量的分布已知;
③尽可能多的包含已知的信息,不含其它未知参数。
2. 确定相应的双侧临界值。
3. 解出置信区间。
复习统计量:
设样本(X1, X2,…,Xn)取自正态总体X~N(m,s2),则有
返回
二、单个正态总体参数的区间估计
1. 已知总体N(m,s2)的方差s2,求m的估计区间
上页
①由样本(X1, X2,…,Xn)
选取U—统计量
②对于给定的a,确定双侧临界值l,
-l
l
1-a
满足P{|U|<l}=1-a,即要找一个概率为1-a的最短区间。
由F(l)=1-a/2可得l=u1-a/2,如a=,F(u1-a/2)=,u1-a/2=
③即
正态分布
临界值
所以m的置信度为1-a的置信区间为
返回
a/2
a/2
二、单个正态总体参数的区间估计
1. 已知总体N(m,s2)的方差s2求m的估计区间
上页
① 选取U—统计量
②对于给定的a,确定双侧临界值u1-a/2
使P{|U|<u1-a/2}=1-a,由F(u1-a/2)=1-a/2可得u1-a/2
-u1-a/2
u1-a/2
1-a
③即
所以m的置信度为1-a的置信区间为
区间中点为
区间半径为
返回
a/2
a/2
例题1
设总体X~N(m,),由样本(x1,x2,…,x9),已知n=9, =
求m的90%的置信区间。
解 ① 选取U—统计量
②对于给定的a=,确定双侧临界值u1-a/2,使P{|U|<u1-a/2}=
查表:F(u1-a/2)=1-a/2= ,可得u1-a/2=,即
上页
m的置信度为90%的置信区间为
代入数值得
即(,)
二、单个正态总体参数的区间估计
2. 未知总体N(m,s2)的方差s2,求m的估计区间
估计1
①由样本(X1, X2,…,Xn)
选取T—统计量
②对于给定的a,确定双侧临界值ta,
-ta
ta
1-a
满足P{|T|<ta}=1-a,即要找一个概率为1-a的最短区间。
由P{|T|>ta}=a查t-分布双侧临界表可得ta,注意自由度为n-1
③即
t(n)分布
临界值
所以m的置信度为1-a的置信区间为
参看t-分布曲线的变化动画、程序
a/2
a/2
例题3
假设人的身高服从正态分布,今从高三毕业班中随机抽查10名女生,测其身高如下:162, , 168, 160, 157, 162, , , , 166(单位:厘米).求高三女生平均身高EX=m的的置信区间。
解 X~N(m,s2),s2未知,求m的置信区间
选T—统计量
1-a=,a=,由 P{|T|<ta}=,即P{|T|>ta}=,查附表6(P319—P320)得ta=(9)=
置信区间为
计算
得m的的置信区间为(,)
二、单个正态总体参数的区间估计
区间估计
3.未知总体N(m,s2)的m,求方差s2的估计区间
①由样本(X1, X2,…,Xn)
选取c2—统计量
②对于给定的a,确定双侧临界值l1,l2
满足P{l1<c2<l2}=1-a,即要找一个概率为1-a的最短区间。
要求P{c2<l1}=P{c2>l2}=a/2,查c2-分布上侧临界表可得
l2=c2a/2(n-1), l1=c21-a/2(n-1)
③即
所以s2的置信度为1-a的置信区间为
l1
l2
1-a
a/2
a/2
例题4
某自动包装机包装洗衣粉,其重量服从正态分布,今随机抽查12袋,测得重量(单位:克)如下:1001, 1004, 1003, 997, 999, 1000, 1004, 1000, 996, 1002, 998, 999.求该包装机包装的洗衣粉重量方差的置信区间。(a=)
解 X~N(m,s2), m未知,求s2的置信区间
选c2—统计量
a=,由P{c2<l1}=P{c2>l2}=a/2=
查c2-分布上侧临界表(附表5P317—P318)可得
l2=(11)=, l1=(11)=
计算(n-1)s2=,置信区间为
二、单个正态总体参数的区间估计
4.已知总体N(m,s2)的m,求方差s2的估计区间
①由样本(X1, X2,…,Xn)
选取c*2—统计量
②对于给定的a,确定双侧临界值l1,l2
满足P{l1<c*2<l2}=1-a,即要找一个概率为1-a的最短区间。
要求P{c*2<l1}=P{c*2>l2}=a/2,查c2-分布上侧临界表可得
l2=c2a/2(n), l1=c21-a/2(n)
③即
所以s2的置信度为1-a的置信区间为
l1
l2
1-a
a/2
a/2
三、*两个正态总体参数的区间估计
next
back
两个样本构成的统计量;U-统计量;T-统计量;F-统计量
设样本(X1, X2,…,Xn1)与(Y1, Y2,…,Yn2)分别取自相互独立的两个正态总体X~N(m1,s12)和Y~N(m2,s22) ,则
(其中s12=s22)
三、*两个正态总体参数的区间估计
next
back
1.已知s12, s22,求m1-m2的置信区间
① 选取U—统计量
②对于给定的a,确定双侧临界值u1-a/2
使P{|U|<u1-a/2}=1-a,由F(u1-a/2)=1-a/2可得u1-a/2
③m1-m2的置信度为1-a的置信区间为
其中
三、*两个正态总体参数的区间估计
next
back
2.未知s12, s22,但s12=s22,求m1-m2的置信区间
① 选取T—统计量
②对于给定的a,确定双侧临界值ta(n1+n2-2)
使P{|T|<ta}=1-a, P{|T|>ta}=a
③m1-m2的置信度为1-a的置信区间为
其中
三、*两个正态总体参数的区间估计
next
back
3.未知m1、m2,求 的置信区间
① 选取F—统计量
③ 的置信度为1-a的置信区间为
②对于给定的a,确定双侧临界值a,b 使
P{a<F<b}=1-a, 且P{F<a}=P{F>b}=a/2
b = fa/2(n1-1,n2-1), a = 1/fa/2(n2-1,n1-1),
四、一般总体(大样本)参数的区间估计
1. 已知总体X的方差s2,求m的估计区间
next
back
由中心极限定理知:当n充分大时,近似地有
① 选取U—统计量
②对于给定的a,确定双侧临界值u1-a/2
使P{|U|<u1-a/2}=1-a,由F(u1-a/2)=1-a/2可得u1-a/2
③即
m的置信度为1-a的置信区间为
四、一般总体(大样本)参数的区间估计
2. 未知总体X的方差s2,求m的估计区间
next
back
当n充分大时,s≈S
① 仍然选取U—统计量
②对于给定的a,确定双侧临界值u1-a/2
使P{|U|<u1-a/2}=1-a,由F(u1-a/2)=1-a/2可得u1-a/2
③即
m的置信度为1-a的置信区间为
第五节* 比率的区间估计
next
back
作业
习题五
P263—P264 A(5—13)
5、6、7、11
标准正态分布
回估计1
next
back
j(x)
0
x
-x
对于X~N(0,1)
j(-x)= j(x),且极大值
j(0)= ≈
正态分布的密度函数曲线
next
back
x
-x
j (x)
对于N(m,s2)
m+x
m-x
s=1
m
s<1
s>1
s=1时平移
关于x=m对称f(m-x)= f(m+x)
极大值
回估计1
正态分布的密度函数曲线
X~N(0,1),F(x)=P{X≤x}=
由j(x)的对称性可知P{X≤-x}=P{X≥x}=1- P{X≤x}
next
back
即F(-x)=1-F(x)
且F(0)=P{X≤0}=1/2=
x
-x
j(x)
x
-x
F(x)
1
注意观察这两种曲线的变化
动画、程序、参看课件
回估计1
标准正态分布双侧临界值
1-a
0
-l
l
a/2
a/2
返回
查附表4
由P{|X|<l}=2F(l)-1=1-a也可得
-u1-a/2
u1-a/2
可得l=u1-a/2
求l使P{|X|<l}=1-a
t(n)分布双侧临界值
next
back
1-a
0
-ta
ta
a/2
a/2
返回
查附表6 由P{|T|>ta}=a
可得ta=ta(n)
概率论与数理统计——第五章 统计估计
河南财经学院——石永生
概率论与数理统计——第五章 统计估计
河南财经学院——石永生