统计学
STATISTICS 第 3 章 概率、概率分布与抽样分布
事件及其概率
随机变量及其概率分布
常用的抽样方法
抽样分布
中心极限定理的应用
1
统计学
STATISTICS 学习目标
¨ 事件及其概率
¨ 随机变量及其概率分布
¨ 常用的抽样方法
¨ 抽样分布
¨ 中心极限定理的应用
2
统计学
STATISTICS
事件及其概率
试验、事件和样本空间
事件的概率
概率的性质和运算法则
条件概率与事件的独立性
全概公式与逆概公式
3-3
统计学
STATISTICS
试验、事件和样本空间
3-4
统计学
STATISTICS 试 验
(experiment)
1. 对试验对象进行一次观察或测量的过程
– 掷一颗骰子,观察其出现的点数
– 从一副52张扑克牌中抽取一张,并观察其结果
(纸牌的数字或花色)
2. 试验的特点
– 可以在相同的条件下重复进行
– 每次试验的可能结果可能不止一个,但试验的
所有可能结果在试验之前是确切知道的
– 在试验结束之前,不能确定该次试验的确切结
果
5
统计学
STATISTICS 事件
(event)
1. 事件:试验的每一个可能结果(任何样本
点集合)
– 掷一颗骰子出现的点数为3
– 用大写字母A,B,C,…表示
2. 随机事件(random event):每次试验可能出
现也可能不出现的事件
– 掷一颗骰子可能出现的点数
6
统计学
STATISTICS 事件
(event)
1. 简单事件(simple event) :不能被分解成其他事
件组合的基本事件
– 抛一枚均匀硬币,“出现正面”和“出现反面”
2. 必然事件(certain event):每次试验一定出现的
事件,用表示
– 掷一颗骰子出现的点数小于7
3. 不可能事件(impossible event):每次试验一定
不出现的事件,用表示
– 掷一颗骰子出现的点数大于6
7
统计学
STATISTICS 样本空间与样本点
1. 样本空间(sample Space)
– 一个试验中所有结果的集合,用表示
– 例如:在掷一颗骰子的试验中,样本空
间表示为:{1,2,3,4,5,6}
– 在投掷硬币的试验中,{正面,反面}
2. 样本点( sample point)
– 样本空间中每一个特定的试验结果
– 用符号表示
8
统计学
STATISTICS
事件的概率
3-9
统计学
STATISTICS 事件的概率
(probability)
1. 事件A的概率是一个介于0和1之间的一个值,用
以度量试验完成时事件A发生的可能性大小,
记为P(A)
2. 当试验的次数很多时,概率P(A)可以由所观察
到的事件A发生次数(频数)的比例来逼近
– 在相同条件下,重复进行n次试验,事件A
发生了m次,则事件A发生的概率可以写为
10
统计学
STATISTICS
概率的性质和运算法则
3-11
统计学
STATISTICS 互斥事件及其概率
(mutually exclusive events)
¨ 在试验中,两个事件有一个发生时,另一
个就不能发生,则称事件A与事件B是互斥事
件,(没有公共样本点)
AA
BB
互斥事件的文氏图互斥事件的文氏图(Venn diagram) (Venn diagram)
12
统计学
STATISTICS 互斥事件及其概率
(例题分析)
¨ 【例】在一所城市中随机抽取600个家庭,
用以确定拥有个人电脑的家庭所占的比例。
定义如下事件:
¨ A:600个家庭中恰好有265个家庭拥有电
脑
¨ B:恰好有100个家庭拥有电脑
¨ C:特定户张三家拥有电脑
¨ 说明下列各对事件是否为互斥事件,并
说明你的理由
¨ (1) A与B (2) A与C (3) B与 C
13
统计学
STATISTICS 互斥事件及其概率
(例题分析)
¨ 解:(1) 事件A与B是互斥事件。因为你观
察
¨ 到恰好有265个家庭拥有电脑,就
¨ 不可能恰好有100个家庭拥有电脑
¨ (2) 事件A与C不是互斥事件。因为张三
¨ 也许正是这265个家庭之一,因而事
¨ 件与有可能同时发生
¨ (3) 事件B与C不是互斥事件。理由同
(2) 14
统计学
STATISTICS 互斥事件及其概率
(例题分析)
【例】【例】同时抛掷两枚硬币,并考察其结果。恰好有一枚同时抛掷两枚硬币,并考察其结果。恰好有一枚
正面朝上的概率是多少?正面朝上的概率是多少?
解解:用:用HH表示正面,表示正面,TT表示反面,下标表示反面,下标11和和22表示硬币表示硬币11
和硬币和硬币22。该项试验会有。该项试验会有44个互斥事件之一发生个互斥事件之一发生
(1) (1) 两枚硬币都正面朝上,记为两枚硬币都正面朝上,记为HH11HH22
(2) 1 (2) 1号硬币正面朝上而号硬币正面朝上而22号硬币反面朝上,记为号硬币反面朝上,记为HH11TT22
(3) 1 (3) 1号硬币反面朝上而号硬币反面朝上而22号硬币正面朝上,记为号硬币正面朝上,记为TT11HH22
(4) (4) 两枚硬币都是反面朝上,记为两枚硬币都是反面朝上,记为 TT11TT22
15
统计学
STATISTICS 互斥事件及其概率
(例题分析)
¨ 解:由于每一枚硬币出现正面或出现反面的概率
都是1/2,当抛掷的次数逐渐增大时,上面的4个
简单事件中每一事件发生的相对频数(概率)将近
似等于1/4。因为仅当H1T2或T1H2发生时,才会
恰好有一枚硬币朝上的事件发生,而事件H1T2或
T1H2又为互斥事件,两个事件中一个事件发生或
者另一个事件发生的概率便是1/2(1/4+1/4)。因此,
抛掷两枚硬币,恰好有一枚出现正面的概率等于
H1T2或T1H2发生的概率,也就是两种事件中每个
事件发生的概率之和
16
统计学
STATISTICS 互斥事件的加法规则
(addition law)
¨ 加法规则
1. 若两个事件A与B互斥,则事件A发生或事
件B发生的概率等于这两个事件各自的概
率之和,即
P(A∪B) =P(A)+P(B)
2. 事件A1,A2,…,An两两互斥,则有
P(A1∪A2 ∪…∪An)
=P(A1)+P(A2) +…+P(An)
17
统计学
STATISTICS
互斥事件的加法规则
(例题分析)
解:解:掷一颗骰子出现的点数掷一颗骰子出现的点数((11,,22,,33,,44,,55,,66))共有共有
66个互斥事件,而且每个事件出现的概率都为个互斥事件,而且每个事件出现的概率都为1/6 1/6
根据互斥事件的加法规则,得根据互斥事件的加法规则,得
【例】抛掷一颗骰子,并考察其结果。求出其点
数为1点或2点或3点或4点或5点或6点的概率
18
统计学
STATISTICS 概率的性质
(小结)
1. 非负性
– 对任意事件A,有 P 1
2. 规范性
– 一个事件的概率是一个介于0与1之间的值,即对于
任意事件 A,有0 P 1
3. 必然事件的概率为1;不可能事件的概率为0。即
P ( )=1; P( )=0
4. 可加性
– 若A与B互斥,则P(A∪B) =P(A)+P(B)
– 推广到多个两两互斥事件A1,A2,…,An,有
P( A1∪A2 ∪… ∪An) = P(A1)+P(A2)+…+P(An)
19
统计学
STATISTICS 事件的补及其概率
¨ 事件的补(complement)
¨ 事件A不发生的事件,称为补事件A的补事
件(或称逆事件),记为A 。它是样本空间中所
有不属于事件A的样本点的集合
AA
AA P(A)=1- P(A)
20
统计学
STATISTICS 广义加法公式
广义加法公式
对任意两个随机事件A和B,它们和的
概率为两个事件分别概率的和减去两个事
件交的概率,即
P(A∪B) = P(A) + P(B) - P(A∩B)
两个事件的并两个事件的并 两个事件的交两个事件的交
21
统计学
STATISTICS 广义加法公式
(事件的并或和)
事件A或事件B发生的事件,称为事件A与事
件B的并。它是由属于事件A或事件B的所有样
本点的集合,记为A∪B或A+B
BAA
AA∪BB
22
统计学
STATISTICS 广义加法公式
(事件的交或积)
AA BB
AA∩BB
事件A与事件B同时发生的事件,称为事件A与
事件B的交,它是由属于事件A也属于事件B的所
有公共样本点所组成的集合,记为B∩A 或AB
23
统计学
STATISTICS 广义加法公式
(例题分析)
¨ 解:设 A =员工离职是因为对工资不满意
¨ B =员工离职是因为对工作不满意
¨ 依 题 意 有 : P(A)=; P(B)=;
P(AB)=
¨ P(AB)= P(A)+ P(B)+ P(AB)=+-
=
【【例例】】一一家家计计算算机机软软件件开开发发公公司司的的人人事事部部门门最最近近做做了了一一
项项调调查查,,发发现现在在最最近近两两年年内内离离职职的的公公司司员员工工中中有有40%40%是是
因因为为对对工工资资不不满满意意,,有有30%30%是是因因为为对对工工作作不不满满意意,,有有
15%15%是是因因为为他他们们对对工工资资和和工工作作都都不不满满意意。。求求两两年年内内离离职职
的的员员工工中中,,离离职职原原因因是是因因为为对对工工资资不不满满意意、、或或者者对对工工作作
不满意、或者二者皆有的概率不满意、或者二者皆有的概率
24
统计学
STATISTICS
条件概率与事件的独立性
3-25
统计学
STATISTICS 条件概率
(conditional probability)
¨ 在事件B已经发生的条件下事件A发生的概率,
称为已知事件B时事件A的条件概率,记为
P(A|B)
P(B)
P(AB)P(A|B) =
事件事件BB及其及其
概率概率PP ( (BB))
事件事件 AABB及其概及其概
率率PP ( (AABB))
事件事件AA 事件事件BB 一旦事件一旦事件BB发生发生
26
统计学
STATISTICS 条件概率
(例题分析)
¨ 解:设 A =顾客购买食品, B =顾客购买其他商品
¨ 依题意有:P(A)=;P(B)=;P(AB)=
【【例例】】一一家家超超市市所所作作的的一一项项调调查查表表明明,,有有80%80%的的顾顾客客到到超超市市是是
来来购购买买食食品品,,60%60%的的人人是是来来购购买买其其他他商商品品,,35%35%的的人人既既购购买买食食
品也购买其他商品。求:品也购买其他商品。求:
(1) (1)已知某顾客购买食品的条件下,也购买其他商品的概率已知某顾客购买食品的条件下,也购买其他商品的概率
(2) (2)已知某顾客购买其他的条件下,也购买食品的概率已知某顾客购买其他的条件下,也购买食品的概率
27
统计学
STATISTICS 条件概率
(例题分析)
¨ 【例】一家电脑公司从两个供应商处购买了同一种计算
机配件,质量状况如下表所示
¨
¨ 从这200个配件中任取一个进行检查,求
¨ (1) 取出的一个为正品的概率
¨ (2) 取出的一个为供应商甲的配件的概率
¨ (3) 取出一个为供应商甲的正品的概率
¨ (4) 已知取出一个为供应商甲的配件,它是正品的概率
甲乙两个供应商提供的配件
正品数 次品数 合计
供应商甲 84 6 90
供应商乙 102 8 110
合计 186 14 200
28
统计学
STATISTICS 条件概率
(例题分析)
¨ 解:设 A = 取出的一个为正品
¨ B = 取出的一个为供应商甲供应的配件
¨
¨ (1)
¨ (2)
¨ (3)
¨
¨ (4)
29
统计学
STATISTICS 乘法公式
(multiplicative law)
1. 用来计算两事件交的概率
2. 以条件概率的定义为基础
3. 设A,B为两个事件,若P(B)>0,则
4. P(AB)=P(B)P(A|B)
5. 或
6. P(AB)=P(A)P(B|A)
30
统计学
STATISTICS 乘法公式
(例题分析)
【【例例】】一一家家报报纸纸的的发发行行部部已已知知在在某某社社区区有有75%75%的的
住住户户订订阅阅了了该该报报纸纸的的日日报报,,而而且且还还知知道道某某个个订订阅阅
日日报报的的住住户户订订阅阅其其晚晚报报的的概概率率为为50%50%。。求求某某住住户户
既订阅日报又订阅晚报的概率既订阅日报又订阅晚报的概率
解:解:设设 AA == 某住户订阅了日报某住户订阅了日报
B B == 某个订阅了日报的住户订阅了晚报某个订阅了日报的住户订阅了晚报
依题意有依题意有::PP((AA))==;;PP((BB||AA)= )=
PP((AABB))==PP((AA))· · PP((BB||AA)=×=)=×=
31
统计学
STATISTICS 独立事件与乘法公式
(例题分析)
【例】【例】从一个装有从一个装有33个红球个红球22个白球的盒子里摸球个白球的盒子里摸球
((摸出后球不放回摸出后球不放回)),求连续两次摸中红球的概率,求连续两次摸中红球的概率
解:解:设设 AA == 第第22次摸到红球次摸到红球
B B == 第第11次摸到红球次摸到红球
依题意有依题意有::
PP((BB))=3/5=3/5;;PP((AA||BB)=2/4 )=2/4
PP((AABB))==PP((AA))· · PP((BB||AA)=3/5×2/4=)=3/5×2/4=
32
统计学
STATISTICS 独立事件与乘法公式
(independent events)
1. 若P(A|B)=P(A)或P(B|A)=P(B) ,则称事
件A与B事件独立,或称独立事件
2. 若两个事件相互独立,则这两个事件同
时发生的概率等于它们各自发生的概率
之积,即
¨ P(AB)= P(A)· P(B)
3. 若事件A1,A2,,An相互独立,则
¨ P(A1, A2, , An)= P(A1)· P(A2) ·
· P(An)
33
统计学
STATISTICS 独立事件与乘法公式
(例题分析)
【【例例】】一一个个旅旅游游经经景景点点的的管管理理员员根根据据以以往往的的经经验验得得
知知,,有有80%80%的的游游客客在在古古建建筑筑前前照照相相留留念念。。求求接接下下来来
的两个游客都照相留念的概率的两个游客都照相留念的概率
解:解:设设 AA = = 第一个游客照相留念第一个游客照相留念
B B = = 第二个游客照相留念第二个游客照相留念
两个游客都照相留念是两个事件的交。在没两个游客都照相留念是两个事件的交。在没
有其他信息的情况下,我们可以假定事件有其他信息的情况下,我们可以假定事件AA
和事件和事件BB是相互立的,所以有是相互立的,所以有
P P((AABB))==PP((AA))· · PP((BB)=×=)=×=
34
统计学
STATISTICS 独立事件与乘法公式
(例题分析)
【【例例】】假假定定我我们们是是从从两两个个同同样样装装有有33个个红红球球22个个白白
球球的的盒盒子子摸摸球球。。每每个个盒盒子子里里摸摸11个个。。求求连连续续两两次次摸摸
中红球的概率中红球的概率
解:解:设设 AA == 从第一个盒子里摸到红球从第一个盒子里摸到红球
B B == 从第二个盒子里摸到红球从第二个盒子里摸到红球
依题意有依题意有::PP((AA))=3/5=3/5;;PP((BB||AA)=3/5 )=3/5
PP((AABB))==PP((AA))· · PP((BB||AA)=3/5×3/5=)=3/5×3/5=
35
统计学
STATISTICS
全概公式与逆概公式
3-36
统计学
STATISTICS 全概公式
¨ 全概公式
BB
BB55 BB44
BB11
BB33
完备事件组完备事件组
37
统计学
STATISTICS 全概公式
(例题分析)
【【例例】】假假设设在在nn张张彩彩票票中中只只有有一一张张中中奖奖奖奖券券,,那那么么第第
二个人摸到奖券的概率是多少?二个人摸到奖券的概率是多少?
解:解:设设 AA = = 第二个人摸到奖券,第二个人摸到奖券,B B = = 第一个人摸到奖券第一个人摸到奖券
依题意有依题意有::PP((BB))=1/=1/nn;;PP((BB)=()=(nn-1)/-1)/nn
PP((AA||BB)=0 )=0 PP((AA||BB)=1/)=1/nn-1 -1
38
统计学
STATISTICS 逆概公式
¨ 逆概公式(贝叶斯公式 )
PP((BBii))被称为事件被称为事件BBii的先验概率的先验概率((prior probabilityprior probability))
PP((BBii||AA))被称为事件被称为事件BBii的后验概率的后验概率(posterior probability)(posterior probability)
39
统计学
STATISTICS 逆概公式
(例题分析)
【【例例】】某某考考生生回回答答一一道道四四选选一一的的考考题题,,假假设设他他知知道道正正
确确答答案案的的概概率率为为1/21/2,,而而他他不不知知道道正正确确答答案案时时猜猜对对的的
概概率率应应该该为为1/41/4。。考考试试结结束束后后发发现现他他答答对对了了,,那那么么他他
知道正确答案的概率是多大呢?知道正确答案的概率是多大呢?
解:解:设设 AA == 该考生答对了该考生答对了 ,,B B == 该考生知道正确答案该考生知道正确答案
依题意有依题意有::PP((BB))=1/2=1/2;; PP((BB)=1-1/2 = 1/2 )=1-1/2 = 1/2
PP((AA||BB)=1/4 )=1/4 PP((AA||BB)=1)=1
40
统计学
STATISTICS
随机变量及其概率分布
随机变量
离散型随机变量的概率分布
离散型随机变量的数学期望和方差
几种常用的离散型概率分布
概率密度函数与连续型随机变量
常见的连续型概率分布
3-41
统计学
STATISTICS
随机变量
3-42
统计学
STATISTICS 随机变量
(random variables)
1. 一次试验的结果的数值性描述
2. 一般用 X,Y,Z 来表示
3. 例如: 投掷两枚硬币出现正面的数量
4. 根据取值情况的不同分为离散型随机变
量和连续型随机变量
43
统计学
STATISTICS 离散型随机变量
1. 随机变量 X 取有限个值或所有取值都可以
逐个列举出来 x1 , x2,…
2. 以确定的概率取这些不同的值
3. 离散型随机变量的一些例子
试验 随机变量 可能的取值
抽查100个产品
一家餐馆营业一天
电脑公司一个月的销售
销售一辆汽车
取到次品的个数
顾客数
销售量
顾客性别
0,1,2, …,100
0,1,2, …
0,1, 2,…
男性为0,女性为1
44
统计学
STATISTICS
连续型随机变量
1. 可以取一个或多个区间中任何值
2. 所有可能取值不可以逐个列举出来,而是取
数轴上某一区间内的任意点
3. 连续型随机变量的一些例子
试验 随机变量 可能的取值
抽查一批电子元件
新建一座住宅楼
测量一个产品的长度
使用寿命(小时)
半年后工程完成的百分比
测量误差(cm)
X 0
0 X 100
X 0
45
统计学
STATISTICS
离散型随机变量的概率分
布
3-46
统计学
STATISTICS离散型随机变量的概率分布
1. 列出离散型随机变量X的所有可能取值
2. 列出随机变量取这些值的概率
3. 通常用下面的表格来表示
X = xi x1 ,x2 ,… ,xn
P(X =xi)=pi p1 ,p2 ,… ,pn
4. PP((X X ==xxii)=)=ppii称为离散型随机变量的概率函数称为离散型随机变量的概率函数
ppii0 0 ;;
47
统计学
STATISTICS
离散型随机变量的概率分布
(例题分析)
【例】一部电梯在一周内发生故障的次
数X及相应的概率如下表
故障次数X = xi 0 1 2 3
概率P(X=xi)pi
一部电梯一周发生故障的次数及概率分布一部电梯一周发生故障的次数及概率分布
(1) (1) 确定确定的值的值
(2) (2) 求正好发生两次故障的概率求正好发生两次故障的概率
(3) (3) 求故障次数多于一次的概率求故障次数多于一次的概率
(4) (4) 最多发生一次故障的概率最多发生一次故障的概率
48
统计学
STATISTICS
离散型随机变量的概率分布
(例题分析)
解:(1) 由于+++ =1
所以, =
(2) P(X=2)=
(3) P(X 2)=++=
(4) P(X1)=+=
49
统计学
STATISTICS
离散型随机变量的数学期
望和方差
3-50
统计学
STATISTICS离散型随机变量的数学期望
(expected value)
1. 离散型随机变量X的所有可能取值xi与其取相对
应的概率pi乘积之和
2. 描述离散型随机变量取值的集中程度
3. 记为 或E(X)
4. 计算公式为
51
统计学
STATISTICS 离散型随机变量的方差
(variance)
1. 随机变量X的每一个取值与期望值的离差平
方和的数学期望,记为 2 或D(X)
2. 描述离散型随机变量取值的分散程度
3. 计算公式为
4. 方差的平方根称为标准差,记为 或D(X)
52
统计学
STATISTICS
离散型数学期望和方差
(例题分析)
【【例例】】一一家家电电脑脑配配件件供供应应商商声声称称,,他他所所提提供供的的配配
件件100100个中拥有次品的个数及概率如下表个中拥有次品的个数及概率如下表
次品数X = xi 0 1 2 3
概率P(X=xi)pi
每每100100个配件中的次品数及概率分布个配件中的次品数及概率分布
求该供应商次品数的数学期望和标准差求该供应商次品数的数学期望和标准差
53
统计学
STATISTICS
几种常用的离散型概率分
布
3-54
统计学
STATISTICS 常用离散型概率分布
离散型
概率分布
两点分布 二项分布 泊松分布 超几何分布
55
统计学
STATISTICS 两点分布
1. 一个离散型随机变量X只取0和1两个可能
的值
2. 它们的概率分布为
3.
4. 或
3. 也称0-1分布
56
统计学
STATISTICS
两点分布
(例题分析)
【例】已知一批产品的次品率为p=,合格率
为q=1-p==。并指定废品用1表示,合
格品用0表示。则任取一件为废品或合格品这一
离散型随机变量,其概率分布为
X = xi 0 1
P(X=xi)=pi
00
11
11 xx
PP((xx))
57
统计学
STATISTICS 二项试验
(伯努利试验)
1. 二项分布与伯努利试验有关
2. 贝努里试验满足下列条件
– 一次试验只有两个可能结果,即“成功”和“
失败”
• “成功”是指我们感兴趣的某种特征
– 一次试验“成功”的概率为p ,失败的概率为q
=1- p,且概率p对每次试验都是相同的
– 试验是相互独立的,并可以重复进行n次
– 在n次试验中,“成功”的次数对应一个离散型
随机变量X
58
统计学
STATISTICS 二项分布
(Binomial distribution)
1. 重复进行 n 次试验,出现“成功”的次数
的概率分布称为二项分布,记为X~B(n,
p)
2. 设X为 n 次重复试验中出现成功的次数,
X 取 x 的概率为
59
统计学
STATISTICS 二项分布
1. 对于P(X=x) 0, x =1,2,…,n,有
2. 同样有
3. 当 n = 1 时,二项分布化简为
60
统计学
STATISTICS
二项分布
(例题分析)
【例】【例】已知一批产品的次品率为已知一批产品的次品率为4%4%,从中任意有放回地抽,从中任意有放回地抽
取取55个。求个。求55个产品中:个产品中:
(1) (1) 没有次品的概率是多少?没有次品的概率是多少?
(2) (2) 恰好有恰好有11个次品的概率是多少?个次品的概率是多少?
(3) (3) 有有33个以下次品的概率是多少?个以下次品的概率是多少?
61
统计学
STATISTICS 泊松分布
(Poisson distribution)
1. 1837年法国数学家泊松(,1781—1840)首
次提出
2. 用于描述在一指定时间范围内或在一定的长度、
面积、体积之内每一事件出现次数的分布
3. 泊松分布的例子
– 一定时间段内,某航空公司接到的订票电话数
– 一定时间内,到车站等候公共汽车的人数
– 一定路段内,路面出现大损坏的次数
– 一定时间段内,放射性物质放射的粒子数
– 一匹布上发现的疵点个数
– 一定页数的书刊上出现的错别字个数
62
统计学
STATISTICS 泊松分布
(概率分布函数)
— 给定的时间间隔、长度、面
积、体积内“成功”的平均
数
e =
x —给定的时间间隔、长度、面
积、体积内“成功”的次数
63
统计学
STATISTICS
泊松分布
(例题分析)
【【例例】】假假定定某某航航空空公公司司预预订订票票处处平平均均每每小小时时接接到到4242
次次订订票票电电话话,,那那么么1010分分钟钟内内恰恰好好接接到到66次次电电话话的的概概
率是多少?率是多少?
解:解:设设XX==1010分钟内航空公司预订票处接到的电话次数分钟内航空公司预订票处接到的电话次数
64
统计学
STATISTICS 泊松分布
(作为二项分布的近似)
1. 当试验的次数 n 很大,成功的概率 p 很小
时,可用泊松分布来近似地计算二项分布
的概率,即
2. 实际应用中,当 P,n>20,np5时,
近似效果良好
65
统计学
STATISTICS 超几何分布
1. 采用不重复抽样,各次试验并不独立,成功
的概率也互不相等
2. 总体元素的数目N很小,或样本量n相对于N
来说较大时,样本中“成功”的次数则服从
超几何概率分布
3. 概率分布函数为
66
统计学
STATISTICS
超几何分布
(例题分析)
【【例例】】假假定定有有1010支支股股票票,,其其中中有有33支支购购买买后后可可以以获获利利,,另另外外77
支支购购买买后后将将会会亏亏损损。。如如果果你你打打算算从从1010支支股股票票中中选选择择44支支购购买买,,
但你并不知道哪但你并不知道哪33支是获利的,哪支是获利的,哪77支是亏损的。求:支是亏损的。求:
(1) (1)有有33支能获利的股票都被你选中的概率有多大?支能获利的股票都被你选中的概率有多大?
(2)3 (2)3支可获利的股票中有支可获利的股票中有22支被你选中的概率有多大?支被你选中的概率有多大?
解:解:设设NN==1010,,MM=3=3,,nn=4=4
67
统计学
STATISTICS
概率密度函数
3-68
统计学
STATISTICS连续型随机变量的概率分布
1. 连续型随机变量可以取某一区间或整个
实数轴上的任意一个值
2. 它取任何一个特定的值的概率都等于0
3. 不能列出每一个值及其相应的概率
4. 通常研究它取某一区间值的概率
5. 用概率密度函数的形式和分布函数的形
式来描述
69
统计学
STATISTICS 概率密度函数
1. 设X为一连续型随机变量,x 为任意实数,
X的概率密度函数记为f(x),它满足条件
2. f(x)不是概率
70
统计学
STATISTICS
连续型随机变量的期望和
方差
1. 连续型随机变量的数学期望
2. 方差
71
统计学
STATISTICS
正态分布
3-72
统计学
STATISTICS 正态分布
(normal distribution)
1. 由.高斯(Carl Friedrich Gauss,1777—1855)
作为描述误差相对频数分布的模型而提出
2. 描述连续型随机变量的最重要的分布
3. 许多现象都可以由正态分布来描述
4. 可用于近似离散型随机变量的分布
– 例如: 二项分布
5. 经典统计推断的基础
73
统计学
STATISTICS 概率密度函数
¨f(x) = 随机变量 X 的频数
¨ = 正态随机变量X的均值
¨ = 正态随机变量X的方差
¨ = ; e =
¨x = 随机变量的取值 (- < x < )
74
统计学
STATISTICS 正态分布函数的性质
1. 图形是关于x=对称钟形曲线,且峰值在x= 处
2. 均值和标准差一旦确定,分布的具体形式也惟一确
定,不同参数正态分布构成一个完整的“正态分布族
”
3. 均值可取实数轴上的任意数值,决定正态曲线的具
体位置;标准差决定曲线的“陡峭”或“扁平”程度。
越大,正态曲线扁平;越小,正态曲线越高陡峭
4. 当X的取值向横轴左右两个方向无限延伸时,曲线的
两个尾端也无限渐近横轴,理论上永远不会与之相交
5. 正态随机变量在特定区间上的取值概率由正态曲线下
的面积给出,而且其曲线下的总面积等于1 75
统计学
STATISTICS
标准正态分布
(standardize the normal
distribution)
3. 标准正态分布标准正态分布的概率密度函数的概率密度函数
1. 随机变量具有均值为0,标准差为1的正态分布
2. 任何一个一般的正态分布,可通过下面的线性
变换转化为标准正态分布
4. 标准正态分布标准正态分布的分布函数的分布函数
76
统计学
STATISTICS 正态分布
(例题分析)
【【例例】】定定某某公公司司职职员员每每周周的的加加班班津津贴贴服服从从均均值值为为5050元元、、标标准准
差差为为1010元元的的正正态态分分布布,,那那么么全全公公司司中中有有多多少少比比例例的的职职员员每每周周
的的加加班班津津贴贴会会超超过过7070元元,,又又有有多多少少比比例例的的职职员员每每周周的的加加班班津津
贴在贴在4040元到元到6060元之间呢?元之间呢?
解:解:设设=5=500,, =10=10,,XX~~NN(50,10(50,1022))
77
统计学
STATISTICS
均匀分布
3-78
统计学
STATISTICS 均匀分布
(uniform distribution)
1. 若随机变量X的概率密
度函数为
2. 称X在 [a ,b]上服从
均匀分布,记为
X~U[a,b]
2. 数学期望和方差
79
统计学
STATISTICS 均匀分布
(概率计算)
1. 随机变量X在某取值范围[a ,b]的任一子区间[c ,d]
上取值的概率为
2. 同样有:
80
统计学
STATISTICS 均匀分布
(例题分析)
【【例例】】某某公公共共汽汽车车站站从从早早上上66时时起起每每隔隔1515分分钟钟开开出出一一趟趟班班
车车,,假假定定某某乘乘客客在在66点点以以后后到到达达车车站站的的时时刻刻是是随随机机的的,,所所
以以有有理理由由认认为为他他等等候候乘乘车车的的时时间间长长度度XX服服从从参参数数为为aa=0=0,,
bb=15=15的的均均匀匀分分布布。。试试求求该该乘乘客客等等候候乘乘车车的的时时间间长长度度少少于于55
分钟的概率分钟的概率
解:解:概率密度函数为概率密度函数为
落入区间落入区间[0[0,,15]15]的任一子区间的任一子区间[0[0,,dd]]的概率是的概率是 ,,
等候乘车的时间长度少于等候乘车的时间长度少于55分钟即有分钟即有d d =5=5,因此该事件发生的,因此该事件发生的
概率等于概率等于5/15=1/35/15=1/3
81
统计学
STATISTICS
指数分布
3-82
统计学
STATISTICS 指数分布
(exponential distribution)
1. 若随机变量X的概率密度函数为
2. 称X服从参数为的指
3. 数分布,记为X~E()
2. 数学期望和方差
83
统计学
STATISTICS 指数分布
(概率计算)
1. 随机变量X取小于或等于某一特定值x的概率为
2. 随机变量X落入任一区间(a,b)的概率为
84
统计学
STATISTICS 指数分布
(例题分析)
【【例例】】假假定定某某加加油油站站在在一一辆辆汽汽车车到到达达之之后后等等待待下下一一辆辆汽汽车车到到
达达所所需需要要的的时时间间((单单位位::分分钟钟))服服从从参参数数为为1/51/5的的指指数数分分布布,,如如
果果现现在在正正好好有有一一辆辆汽汽车车刚刚刚刚到到站站加加油油,,试试分分别别求求以以下下几几个个事事
件发生的概率:件发生的概率:
(1) (1)一辆汽车到站前需要等待一辆汽车到站前需要等待55分钟以上分钟以上
(2) (2)一辆汽车到站前需要等待一辆汽车到站前需要等待55~~1010分钟分钟
解:解:
85
统计学
STATISTICS
常用的抽样方法
简单随机抽样简单随机抽样
分层抽样分层抽样
系统抽样系统抽样
整群抽样整群抽样
3-86
统计学
STATISTICS
简单随机抽样
(simple random sampling)
1. 从总体N个单位中随机地抽取n个单位作为样本,使
得每一个容量为样本都有相同的机会(概率)被抽中
2. 抽取元素的具体方法有重复抽样和不重复抽样
3. 特点
– 简单、直观,在抽样框完整时,可直接从中抽取样本
– 用样本统计量对目标量进行估计比较方便
4. 局限性
– 当N很大时,不易构造抽样框
– 抽出的单位很分散,给实施调查增加了困难
– 没有利用其他辅助信息以提高估计的效率
87
统计学
STATISTICS
分层抽样
(stratified sampling)
1. 将总体单位按某种特征或某种规则划分为
不同的层,然后从不同的层中独立、随机
地抽取样本
2. 优点
– 保证样本的结构与总体的结构比较相近,从
而提高估计的精度
– 组织实施调查方便
– 既可以对总体参数进行估计,也可以对各层
的目标量进行估计
88
统计学
STATISTICS
系统抽样
(systematic sampling)
1. 将总体中的所有单位(抽样单位)按一定顺
序排列,在规定的范围内随机地抽取一个
单位作为初始单位,然后按事先规定好的
规则确定其他样本单位
– 先从数字1到k之间随机抽取一个数字r作为
初始单位,以后依次取r+k,r+2k…等单位
2. 优点:操作简便,可提高估计的精度
3. 缺点:对估计量方差的估计比较困难
89
统计学
STATISTICS
整群抽样
(cluster sampling)
1. 将总体中若干个单位合并为组(群),抽样
时直接抽取群,然后对中选群中的所有单
位全部实施调查
2. 特点
– 抽样时只需群的抽样框,可简化工作量
– 调查的地点相对集中,节省调查费用,方便
调查的实施
– 缺点是估计的精度较差
90
统计学
STATISTICS
抽样分布
抽样分布的概念抽样分布的概念
样本均值抽样分布的形式样本均值抽样分布的形式
样本均值抽样分布的特征样本均值抽样分布的特征
中心极限定理中心极限定理
3-91
统计学
STATISTICS
抽样分布的概念
3-92
统计学
STATISTICS
1. 样本统计量的概率分布,是一种理论分布
– 在重复选取容量为n的样本时,由该统计量的所有
可能取值形成的相对频数分布
2. 随机变量是 样本统计量
– 样本均值, 样本比例,样本方差等
3. 结果来自容量相同的所有可能样本
4. 提供了样本统计量长远而稳定的信息,是进行
推断的理论基础,也是抽样推断科学性的重要
依据
抽样分布
(sampling distribution)
93
统计学
STATISTICS
样本均值的抽样分布
3-94
统计学
STATISTICS
1. 在重复选取容量为n的样本时,由样本均
值的所有可能取值形成的相对频数分布
2. 一种理论概率分布
3. 推断总体均值的理论基础
样本均值的抽样分布
95
统计学
STATISTICS 样本均值的抽样分布
(例题分析)
【【例例】】设设一一个个总总体体,,含含有有44个个元元素素((个个体体)) ,,即即总总体体单单位位
数数NN==44。。44 个个个个体体分分别别为为xx11=1=1,,xx22=2=2,,xx33=3=3,,xx44=4=4 。。总总
体的均值、方差及分布如下体的均值、方差及分布如下
总体分布总体分布
11 4422 33
00
.
..
22
.
均值和方差均值和方差
96
统计学
STATISTICS
样本均值的抽样分布
(例题分析)
现现从从总总体体中中抽抽取取nn==22的的简简单单随随机机样样本本,,在在重重复复抽抽
样条件下,共有样条件下,共有4422=16=16个样本。所有样本的结果为个样本。所有样本的结果为
¨3,4¨3,3¨3,2¨3,1¨3
¨2,4¨2,3¨2,2¨2,1¨2
¨4,4¨4,3¨4,2¨4,1¨4
¨1,4
¨4
¨1,3
¨3¨2¨1
¨1,2¨1,1¨1
¨第二个观察值¨第一个
¨观察值
¨所有可能的n = 2 的样本(共16个)
97
统计学
STATISTICS
样本均值的抽样分布
(例题分析)
计算出各样本的均值,如下表。并给出样本均
值的抽样分布
¨¨¨¨¨3
¨¨¨¨¨2
¨¨¨¨¨4
¨
¨4
¨
¨3¨2¨1
¨¨¨1
¨第二个观察值
¨第一
个
¨观察
值
¨16个样本的均值(x)
xx
样本均值的抽样分布样本均值的抽样分布
00
PP ( ( x x ))
98
统计学
STATISTICS
1. 样本均值的数学期望
2. 样本均值的方差
– 重复抽样
– 不重复抽样
样本均值的抽样分布
(数学期望与方差)
99
统计学
STATISTICS 样本均值的抽样分布
(数学期望与方差)
比较及结论:比较及结论:1. 1. 样本均值的均值样本均值的均值((数学期望数学期望) ) 等于总体均值等于总体均值
2. 2. 样本均值的方差等于总体方差的样本均值的方差等于总体方差的1/1/nn
100
统计学
STATISTICS抽样分布与总体分布的关系
总体分布总体分布
正态分布 非正态分布
大样本大样本 小样本小样本
正态分布正态分布 非正态分布
101
统计学
STATISTICS
样本比例的抽样分布
3-102
统计学
STATISTICS
1. 总体(或样本)中具有某种属性的单位与全部单
位总数之比
– 不同性别的人与全部人数之比
– 合格品(或不合格品) 与全部产品总数之比
2. 总体比例可表示为
3. 样本比例可表示为
4.
比例
(proportion)
103
统计学
STATISTICS
1. 在重复选取容量为的样本时,由样本比例
的所有可能取值形成的相对频数分布
2. 一种理论概率分布
3. 当样本量很大时,样本比例的抽样分布可
用正态分布近似
4. 推断总体比例的理论基础
样本比例的抽样分布
104
统计学
STATISTICS
1. 样本比例的数学期望
2. 样本比例的方差
– 重复抽样
– 不重复抽样
样本比例的抽样分布
(数学期望与方差)
105
统计学
STATISTICS
样本方差的抽样分布
3-106
统计学
STATISTICS 样本方差的分布
1. 在重复选取容量为的样本时,由样本方差的
所有可能取值形成的相对频数分布
2. 对于来自正态总体的简单随机样本,则比值
的抽样分布服从自由度为 (n -1) 的2分布,
即
107
统计学
STATISTICS
中心极限定理
3-108
统计学
STATISTICS
中心极限定理
3-109
统计学
STATISTICS 中心极限定理
(central limit theorem)
中心极限定理:设从均值为,方差为 2的
一个任意总体中抽取容量为n的样本,当n充
分大时,样本均值的抽样分布近似服从均值
为μ、方差为σ2/n的正态分布
110
统计学
STATISTICS
中心极限定理
(central limit theorem)
x x 的的分分布布趋趋
于于正正态态分分布布
的过程的过程
111
统计学
STATISTICS 本章小结
¨ 事件及其概率
¨ 随机变量及其概率分布
¨ 常用的抽样方法
¨ 抽样分布
¨ 中心极限定理的应用
112