此处是大标题样稿字样十五
字以内
2
第四章 概率、概率
分布与抽样分布
厦门大学经济学院计统系
游家兴
3
例1:掷铜板
当你掷铜板的时候,结果只有两种可能,正面或者
反面。下图显示掷铜板1000次的结果。
4
掷铜板的人
法国自然主义者布方伯爵(Count Buffon,
1707-1788)把铜板掷了4040次,结果:2048个
正面,或者说正面比例是2048/4040=。
大约1900年时,英国统计学家皮尔逊(Karl
Pearson,1857-1936)很神勇地掷一个铜板
24000次。结果:12012次正面,比例。
南非数学家柯瑞屈(John Kerrich)在第二次
世界大战被德国人关在牢里的时候,掷了铜板
10000次。结果:5067次正面,比例。
5
例2:中两次头彩
1986年时,亚当斯(Adams)第二度赢得新泽
西州彩券,前一次亚当斯赢到了累积奖金390
万美元,这次又赢得了150万美元。
《纽约时报》(1986年2月14日)宣称:同一
个赢得两次大奖的机会,差不是每170亿次中
有一次。
两星期后,《纽约时报》刊登了两位统计学家
的来信,说这是胡说八道。
6
亚当斯在一生中赢两次大奖的机会诚然很小,
但是几乎可以确定:在美国几百万经常买彩券
的人当中,会有人赢得两次头奖。
两位统计学家估计:7年内再有人赢到两次大
奖的机会是一半一半。
果其不然,在1988年5月,汉弗莱斯(Humphri
-es)赢得了他的第二个宾州彩券累积奖金
(总计680万美元)。
7
本章我们首先学习:
什么是概率?
什么是概率分布?
8
第一节 随机事件与概率
一、随机事件与概率
(一)随机试验与事件
随机现象的特点是:
在条件不变的情况下,一系列的试验或
观测会得到不同的结果;
在试验或观测前不能预见何种结果将出
现。
9
对随机现象的试验或观测称为随机试验,它必
须满足以下的性质:
(1)每次试验的可能结果不是唯一的;
(2)每次试验之前不能确定何种结果会出
现;
(3)试验可在相同条件下重复进行。
10
在随机试验中,可能出现也可能不出现的结果,
称之为随机事件,简称事件。
试验的结果可能是一个简单事件,也可能是一
个复杂事件。
简单事件就是不可以再分解的事件,又称
为基本事件。
复杂事件是由简单事件组合而成的事件。
11
基本事件还可称为样本点,设试验有n个基
本事件,分别记为 (i=1,2,…,n)。
集合Ω={ω1 ,ω2 , … ,ωn}称为样本空
间,Ω中的元素就是样本点。
12
例:投掷一粒均匀的六面体骰子,出现的点数
有可能是1、2、3、4、5、6共六种。这六种结
果是基本结果,不可以再分解成更简单的结果
了,所以Ω={1,2,3,4,5,6}为该试验的
样本空间。
“出现点数是奇数”这一事件就不是简单事件,
它是由基本事件{1},{3}和{5}组合而成的。
13
我们通常用大写字母A,B,C,…来表示随机
事件,例如,设A表示“出现点数是奇数”,
则A={1,3,5};设B表示“出现点数是偶数”
,则B={2,4,6}。
14
(二)概率
1.概率的定义
概率是指随机事件发生的可能性,或称为
机率,是对随机事件发生可能性的度量。
概率的古典定义:假设事件A在等可能的n
种方式中可以以m种方式发生,则事件发
生的概率表示为:
p=p(A)=m/n
15
古典概率有两个特点:
1、结果有限,即基本空间中只含有限个元
素。如掷铜板,只能出现“正面朝上”和
“反面朝上”两种结果。
2、各个结果出现的可能性被认为是相同的。
如掷铜板,出现正面或反面的机会被认为
是相等的。
16
概率的古典定义有所缺陷,“等可能”这一词
模糊不清。事实上,这一词看上去与“等概率
”是同义的,那么我们实质上是用概率来定义
自己,形成循环定义。
概率的统计定义:在相同条件下随机试验n次,
某事件A出现m次,则比值m/n称为事件A发生的
频率。随着n的增大,该频率围绕某一常数p上
下波动,且波动的幅度逐渐减小,趋于稳定,
这个频率的稳定值即为该事件的概率,记为:
17
例:设一个袋子中装有白球2个,黑球3个。
(1)从中随机摸出1只球,问刚好是白球的概
率有多大?
解:摸出的任何1只球形成一个基本事件,样本
点总数为n=5。
用A表示摸出的是白球事件,则A由两个基本点
组成,即A={白球,白球},有利场合数m=2。
因此,刚好摸出白球的概率为:
P(A)=m/n=2/5=
18
(2) 从中随机摸出2只球,一问2只球都是白球
的概率有多大? 二问2只球一白一黑的概率有
多大? 三问2只球都是黑球的概率有多大?
解:由于摸出2只球才成一个基本事件,所以
样本点总数为 ,故
P(A)=P(2只球都是白球)=1/ =1/10
P(B)=P(2只球一白一黑)=2×3/10=6/10
P(C)=P(2只球都是黑球)=3/10
19
2. 概率的基本性质
性质1 1≥P(A)≥0。
性质2 P(Ω)=1。
性质3 若事件A与事件B互不相容,即
AB=Ф,则P(A∪B)=P(A)+P(B)。
20
例,从一副纸牌中抽牌一次(抽完放回),
如果E1为事件“抽到A”,E2为事件“抽到
K”,则:
P(E1)=4/52=1/13
P(E2)=4/52=1/13
因为不可能同时抽到A和K,所以它们是互
不相容的,则抽到A或K的概率为:
21
重新定义,E1为事件“抽到A”,E2为事件
“抽到黑桃”,因为有可能抽到黑桃A,所
以E1和E2不是互不相容的,那么抽到A或黑
桃的概率为:
22
推论1:不可能事件的概率为0,即:
P(Ф)=0
推论2 :P( )=1-P(A), 表示A的对立事件,
即它们二者必有一事件发生但又不能同时
发生。
3. 事件的独立性
定义:对事件A与B,若p(AB)=p(A)p(B),则称
它们是统计独立的,简称相互独立,即两个事
件中不论哪一个事件发生与否都不影响另一个
事件发生的概率。
23
例:已知袋中有6只红球, 4只白球。从袋中有
放回地取两次球,每次都取1球。设 表示第i
次取到红球。那么,
因为
也就是说,B1,B2相互独立。
题目将有放回改为无放回,则B1和B2相互独立
吗?
24
第二节 随机变量及概率分布
随机变量是指随机事件的量的表现。
例如:投掷骰子,点数1、2、3、4、5、6
是可能出现的随机变量。
随机变量的概率分布是一个函数,它把随机变
量的每一个值与一个实数(概率)相对应。
概率分布反映了随机变量的取值或随机事
件中各种结果的分布状况和分布特征。
25
离散型随机变量
当随机变量所有可能取值的集合只包含有限个
元素时,就称为离散型随机变量。
设离散型随机变量X的所有可能取值为x1,x2,
…,xn, …,相应的概率为p(x1),p(x2),…, p
(xn),…。用表格统一表示出来是:
26
如:
骰子各个点数的概率分布表
27
离散型概率分布的性质
(1) 0≤p(xi)≤1 (i=1,2, …)
(2)
28
随机变量的期望值
随机变量的期望值(E)也称为平均值,是随
机变量分布的集中趋势,即分布的中心位置。
离散型随机变量的期望值:
性质:
其中X1,X2都是随机变量,α,β是任意常数。
29
有这样的一个投资项目(如下表),试问它的
预期回报是多少?
该投资项目的期望收益率是%。
例题
30
随机变量的方差
定义:离散型随机变量X的方差为
方差的平方根σ称为标准差。
方差σ2或标准差σ反映随机变量X相对其期望值
的离散程度,σ2或σ越小, 说明期望值的代表性
越好;σ2或σ越大,说明期望值的代表性越差。
性质:对于任意常数a,σ2(ax)=a2σ2(x)成立。
31
二项分布
二项分布是离散型随机变量的一个重要的概率
分布。
在一些问题中,我们只对试验中某事件A是否
出现感兴趣,如调查消费者对某种品牌是否喜
欢,调查某地区住户是否脱贫等等。
32
这些例子所具有的共同性质概括如下:
试验包含了n个相同的试验;
每个试验只有两个可能的结果;
每一次试验出现“是”或“否”的概率是相
同的。
试验是互相独立的。
通常称具有上述特征的n次重复试验为n次贝努
里试验,简称贝努里试验(Bernoulli trials)。
33
以Bk表示n重贝努里试验中事件A正好出现k次
这一事件,则:
(k=0,1,2,…,n)
34
连续型随机变量
当一个随机变量可能取值的集合为无穷不可数
集合时,就称为连续型随机变量。
由于连续型随机变量可以取某一区间或整个实
数轴上的任意一个值,无法一一列举。一般用
概率密度函数来表示连续型随机变量的概率分
布。
35
概率密度函数反映概率分布在某一区间的密集
程度。
它不直接给出随机变量取某一特定值的概率值,
而通过密度函数图下相应给定区间的面积表示
连续型随机变量在那一区间取值的概率。
36
概率密度函数
设p(x)为概率密度函数,它是分布函数的导数,
满足下述两个条件:
(1) p(x)≥0
(2)
37
连续型随机变量的概率是计算随机变量落在某
区域的可能性,也即通过对密度函数进行积分
获得相应的概率值。
如计算随机变量X落在[a, b]区间内的概率:
a b
x
P(a≤x≤b)
概率密度曲线
38
如:
a b
x
39
例子
一个连续型随机变量只在[0, 4]范围内取值,
其概率密度函数为 ,a是常数。
计算a;
求p(1<X<2)
解:根据 ,可知 ,
进一步, 求积分:
40
0 1 2 3 4
1/4
1/2
3/4
1
P(X)
X
意味着整个三角形的面积为1
p(1<X<2),求点X落入1至2区间的概
率,即求梯形(阴影部分)的面积:
41
课堂练习
设随机变量X的概率密度函数服从:
(1)已知P(X>1)=7/8,求θ 的值;
(2)求随机变量落入[,1]区间的概率。
42
随机变量的期望值与方差
定义: 连续型随机变
量X的期望值为
方差为
性质:
43
离散型与连续型随机变量的区别
44
正态分布
正态分布是最重要的一种连续型随机变量分布。
如果连续型随机变量X的密度函数为:
则称该变量X服从均值为μ,方差为σ2的正态分布,记为X~N(μ
,σ22)。
45
如果一个正态分布的μ=0,σ=1,则称该正态分
布为标准正态分布,相应的随机变量称为标准
正态随机变量,用Z表示,即Z~N(0,1),相应
的分布密度函数为
46
一般正态分布与标准正态分布的关系:
若随机变量X服从正态分布N (μ,σ2),则随机
变量
Z =
服从标准正态分布,即Z~N(0,1)。
47
-3-3
%
%
%
00-1-1 11-2-2 22 33
z z值值 概率 概率
例:p(-1<Z<1)表示变量Z落入(-1,1)的概率,等于
48
3σ准则
3σ准则在产品质量控制中有着重要的应用。由
标准正态分布表可求得:
当 时,有:
这说明,X的取值几乎全部集中在[-3,3]
区间内,超过这个范围的可能不到%。
49
这些结论推广到一般正态分布,即
,
有:
显然, 的概率很小,因此可以认为X
的值几乎一定落在区间 内,这在
统计学上称做“3σ准则”。
50
例题:课本P85第17题
解题步骤:
1、算出均值;
2、算出标准差;
3、计算两个标准差的变动区间:
[[均值均值-2-2个标准差,均值个标准差,均值+2+2个标准差个标准差]]
4、判断。
51
学会查正态分布概率表 P305 ;
学会运用正态分布的对称性进行分割计算;
学会将正态分布化为标准正态分布,再计算其
概率。
例如:求p(1<Z<)?
解:原式=×[p(<Z<)-p(-1<Z<1)]
=×()
=
52
例1:某大学英语考试成绩服从正态分布,已
知平均成绩为70分,标准差为10分。求该大学
英语成绩在60—75分的概率。
计算步骤:1、先转化为标准正态分布;
2、查表计算。
53
例2:高考标准分计算
第一步,标准化获得Z值:
Z=(原始分-原始分的平均分)/原始分
的标准差
第二步,将Z值转化为标准分:
标准分T=500+100×Z
如,某省高考人数100000人,一考生高考标准
分为800,那他在全省能排第几?
THANKS