第四章 抽样分布与参数估计
第一节 频率、概率
第二节 概率分布
第三节 抽样分布
1
第一节 频率、概率与概率分布
一、随机事件与概率
(一)随机试验与事件
随机现象的特点是:在条件不变的情况下,一系
列的试验或观测会得到不同的结果,并且在试验
或观测前不能预见何种结果将出现。对随机现象
的试验或观测称为随机试验,它必须满足以下的
性质:
(1)每次试验的可能结果不是唯一的;
(2)每次试验之前不能确定何种结果会出现;
(3)试验可在相同条件下重复进行。
2
例:投掷一粒均匀的六面体骰子,出现的
点数有可能是1、2、3、4、5、6共六种。
这六种结果是基本结果,不可以再分解成
更简单的结果了,所以Ω={1,2,3,4,5
,6}为该试验的样本空间。“出现点数是奇
数”这一事件就不是简单事件,它是由基
本事件{1},{3}和{5}组合而成的。我们通
常用大写字母A,B,C,…来表示随机事
件,例如,设A表示“出现点数是奇数”,
则A={1,3,5};设B表示“出现点数是偶
数”,则B={2,4,6}。
3
(二)概率
1. 概率的定义
概率就是指随机事件发生的可能性,或称为
机率,是对随机事件发生可能性的度量。
随机事件A发生可能性大小称为事件A发生
的概率,记为:P(A)=p。
正确理解和计算随机事件的概率是进行统计
推断和统计决策的基础
按不同的观点和不同情的况,概率有古典概率、
试验概率和主观概率三种不同的解释
4
2. 古典概率
起源于17世纪很流行的赌博输赢的估计。
设事件A是样本空间Ω中的一个随机事件,
事件A的古典概率定义为:
5
例:设一个袋子中装有白球2个,黑球3个。
从中随机摸出1只球,问刚好是白球的概率
有多大?
解:由于摸出的任何1只球都形成一个基本
事件,所以样本点总数为n=5。用A表示摸
出的是白球事件,则A由两个基本点组成,
即A={白球,白球},有利场合数m=2。因此,
刚好摸出白球的概率为P(A)=m/n=2/5=
6
3. 试验概率
古典概率在应用上受到两个条件的限制:一
是随机试验的结果只有有限个,二是这些结
果出现的可能性相同。
如果采用试验概率,就不受上述条件的限制
4. 主观概率
在实际问题中,有些试验是无法在相同的条
件下重复进行。如:股价指数在未来一周内
上升的可能性有多大。只能凭经验进行主观
的估计。
7
2. 概率的基本性质
性质1 1≥P(A)≥0。
性质2 P(Ω)=1。
性质3 若事件A与事件B互不相容,即
AB=Ф,则P(A∪B)=P(A)+P(B)。
推论1 不可能事件的概率为0,即:
P(Ф)=0。
推论2 P( )=1-P(A), 表示A的对
立事件,即它们二者必有一事件发生但
又不能同时发生。
8
第二节 随机变量概率分布
随机变量X是定义在样本空间
Ω={ω1,ω2,…,ωn}上的一个函数,这个函数的取
值随试验的结果不同而变化。这个函数还要求满
足条件:对任意的实数x,X<x是随机事件。如果
随机变量所有可能的取值是有限的,或可排成一
列的,这种随机变量称为离散型随机变量;另一
种情况是随机变量的取值范围是一个区间或整个
数轴,这种随机变量称为连续型随机变量。
1. 离散型随机变量的概率分布
设离散型随机变量X的所有可能取值为x1, x2,
…, xn, …,相应的概率为p(x1),
p(x2),…,p(xn),…。用表格统一表示出来是:
9
X x1 x2 … xn …
P p(x1) p(x2) … p(xn) …
这称为离散型随机变量X的概率分布。
性质:(1) 0≤p(xi)≤1 (i=1,2, …);
(2)
定义: 离散型随机变量X的期望值为
性质:
其中X1,X2都是随机变量,α,β是任意常数。
10
定义: 离散型随机变量X的方差为
方差的平方根σ称为标准差。
方差σ2或标准差σ反映随机变量X相对其期
望值的
离散程度,σ2或σ越小, 说明期望值的代表
性越好;σ2或σ越大,说明期望值的代表性
越差。
性质:对于任意的α,D(αX)=α2 D(X) 成立
11
2. 连续型随机变量的概率分布
设X是., x 是一实数. 记
F(x)=P(X<x)。该函数就是随机变量X的分布
函数。分布函数的导数称为密度函数,记作
p(x )。
性质
(1) p(x)≥0
(2)
(3)
a b
x
P(a≤x<b)
12
定义: 连续型随机变量X的期望值为
方差为
13
例:某大学英语考试成绩服从正态分
布,已知平均成绩为70分,标准差为
10分。求该大学英语成绩在60—75分
的概率。
14
第三节 抽样分布
一、抽样的基本概念
二、抽样分布
(一)重复抽样分布
(二)不重复抽样分布
15
一、抽样的基本概念
抽样涉及的基本概念有:
总体与样本(见第一章)
样本容量与样本个数
总体参数与样本统计量
重复抽样与不重复抽样
这些概念是统计学特有的,体现了统
计学的基本思想与方法。
16
总体和样本(参见第1章)
1.总体:又称全及总体、母体,指所要研究
对象的全体,由许多客观存在的具有某种共
同性质的单位构成。总体单位数用 N 表示。
2.样本:又称子样,来自总体,是从总体中
按随机原则抽选出来的部分,由抽选的单位
构成。样本单位数用 n 表示。
3.总体是唯一的、确定的,而样本是不确定
的、可变的、随机的。
17
样本容量与样本个数
样本容量:一个样本中所包含的单位数,
用n表示。
样本个数:又称样本可能数目,指从一个
总体中所可能抽取的样本的个数。对于有
限总体,样本个数可以计算出来。样本个
数的多少与抽样方法有关。(这个概念只
是对有限总体有意义,对无限总体没有意
义!)
18
总体参数和样本统计量
总体参数:反映总体数量特征的指标。其
数值是唯一的、确定的。
样本统计量:根据样本分布计算的指标。
是随机变量。
19
平均数
标准差、方差
成数
参数
、2
p
统计量
S、 S2
P
总体
20
二、抽样分布
概念:由样本统计量的全部可能取值
和与之相应的概率(频率)组成的分
配数列。(某一统计量所有可能的样
本的取值形成的分布。)
包括以下内容
重置抽样分布
不重置抽样分布
21
重置抽样分布--样本平均数的分布
某班组5个工人的日工资为34、38、42、
46、50元。
= 42
2 = 32
现用重置抽样的方法从5人中随机抽2
个单位构成样本。共有52=25个样本。
如下图。
22
23
样本平均数的分布
24
验证了以下两个结论:
抽样平均数的标准差反映所有的样本
平均数与总体平均数的平均误差,称
为抽样平均误差,用 表示。
25
由概率论知,如果总体是正态分布的,则
样本平均数的抽样分布是如下正态分布
从分布形式看,当总体为非正态分布时,
样本均值的抽样分布随着样本容量的扩大
而趋近于正态分布
26
样本成数的分布
总体成数p是指具有某种特征的单位在总
体中的比重。成数是一个特殊平均数,设
总体单位总数目是N,总体中有该特征的
单位数是N1。设x是0、1变量(总体单位
有该特征,则x取1,否则取0),则有:
27
样本成数的分布
现从总体中抽出n个单位,如果其中有相应
特征的单位数是n1,则样本成数是:
P也是一个随机变量,利用样本平均数的
分布性质结论,即有:
28
不重置抽样分布
样本均值的分布性质:
样本成数的分布性质
29
抽样分布总结
样本平均数的分布 样本成数的分布
重复抽
样
不重复
抽样
30
例1:求样本平均数的概率分布
设某公司1000名职工的人均年奖金为2000元,标准差500
元,随机抽取36人作为样本进行调查,问样本的人均年奖
金在1900~2200元之间的概率有多大?
31
例2: 某地区职工家庭的人均年收入平均
为12000元,标准差为2000元。若知该地
区家庭的人均年收入服从正态分布,现采
用重复抽样从总体中随机抽取25户进行调
查,问出现样本平均数等于或超过12500
元的可能性有多大?
32
例3某商场推销一种洗发水。据统计,本年
度购买此种洗发水的有10万人,其中6万是
女性。如果按不重复随机抽样方法,从购买
者中抽出100人进行调查,问样本中女性比
例超过50%的可能性有多大?
33