一. 连续型随机变量的概率密度
若对于随机变量 X 的分布函数,存在非负
函数 f(x),使得对于任意实数 x 有:
则称 X 为连续型变量,f (x)为 X 的概率密度函数
第四节 连续型随机变量及其概率密度
1.定义
注:
连续型随机变量与离散型随机变量的区别
▲
离散型:
连续型:
[证]:
让 “交”往 方向 “挤”
证法1
证法2
当
时,
两边取极限:
这个结论的意义:
2.由此可知连续型随机量X在某区间上取值的概率只与区间长度有关,而与区间是闭,开,半开半闭无关,
即有:
(不可能的事件的概率为0),但概率
为零的事不一定是不可能事件.
▲
1. 从积分的几何意义上说,当底边缩为一点时,曲边梯形面积退化为零.
2. 概率密度函数的性质
这两条性质是判定
一个函数 f(x)是否为某
随机变量X 的概率密度
函数的充要条件.
f (x)
x
o
面积为1
性质1
性质2
几何
意义:
性质3
物理
意义:
性质4
若
在点
处连续,则有:
故 X 的密度 f (x) 在 x 这一点的值,恰好是
X落在区间 上的概率与区间长度
之比的极限. 这里,如果把概率理解为质量, f (x)相当于线密度,故称 f (x)为概率密度函数。
不计高阶
无穷小
(相当于积分中值定理 )
注:
这表示落在区间 上的概率近似等于 ,称 为概率微分。
的值的大小直接影响关系到概率的大小,所以
的确描述了连续型随机变量的概率分布
的情况。
但要注意的是:密度函数
f (x)在某点处 a 的高度,
并不反映X 取值的概率.
但是,这个高度越大,
则 X 取 a 附近的值的概
率就越大. 也可以说,
在某点密度曲线的高度
反映了概率集中在该点
附近的程度.
f (x)
x
o
在连续型
随机型变量理论中所
的作用与
在离散型随机变量理
论中所起的作用相类似
证明:函数
是一个连续型随机变量的概率密度函数.
一般只需验证f(x)性质中的这两条即可.
例1.
证明:
(1).
显然,
(2).
某电子计算机在毁坏前运行的总时间(单位:小
时)是一个连续型随机变量,其密度函数为:
(2).这台计算机在毁坏前能运行 50 到 150 小
时的概率.
(3).运行时间少于100小时的概率.
例2.
求:
(1).
解:
(1)
(2) 50 到 150 小时
少于100小时
(3)
(1)
(2)
一般称:
则 称 X 为服从参数 的 指数分布.
(3)
若 X 具有概率密度:
f (x)确定了
分布函数F(x),
f (x)是F(x)的
导函数,
F(x)是f (x)的一个原函数
定义:
二 . 连续型随机变量的分布函数
若定义在
上的可积函数
满足:
则称
为连续型随机变量的分布函数
注: 可以验证 F(x) 具备了分布函数的性质:
F(x)是不减的函数; F(x) , F(x)是
右连续的。
设有函数 F(x)
F(x)能否成为某个连续随机变量 的分布函数.
函数 F(x) 在 上下降,即
不满足性质(1).
或者:
故:F(x)不能是某个连续随机变量的分布函数.
例3
问:
即不满足性质(2).
解:
注意到:
解:
它是一个变上限的广义分
(2)
(1) X的分布函数
例4.
(1)
求:
综合上述得:
(2).
解:
求 : F(x)
设连续型随机变量 X 的密度函数为 f (x)
例5.
当
时,
当
即得所求的分布函数为:
当
时,
设随机变量X的分布函数为
求X取值在区间 (,)的概率;
(2) 求X的概率密度.
(1) P(<X<)=F()--F()
= =
(2) f(x)=
例6.
解:
注意到F(x)在1处导数不存在,根据改变被积函数在个别点处的值不影响积分结果的性质,可以在
没意义的点处,任意规定 的值.
三. 几种常见的连续型随机变量的分布
若连续型随机变量 X 具有概率密度 f (x)为:
1. 均匀分布
则称 X 在区间 (a, b)上服从均匀分布 (或等概率分布)
注:
▲
易证
满足:
0
若抽取其概率的背景,f(x)是一种 的
函数
的图形:
▲
X 落在区间 (a, b) 中任意等长度的子区间的可能性是相同的,即它落在子区间的概率只依赖于子区间的长度而与子区间的位置无关.
服从均匀分布的随机变量具有如下性质:
▲
[证]:
即 X 落在 (c, d ) 内的概率只与 (c, d) 的长度有关, 而与(c, d) 在 (a,b) 中的位置无关.
均匀分布常见于下列情形:
比如: 在数值计算中,由于四舍五 入,小数点后某一位小数引入的误差;公交线路上两辆公共汽车前后通过某汽车停车站的时间,即乘客的候车时间等.
由分布函数定义可得:若X 服从均匀分布,则X 的分布函数为:
图形:
▲
某公共汽车站从上午7时起,每15分钟来一班
车,即 7:00,7:15,7:30, 7:45 等时刻有汽车
到达此站,如果乘客到达此站时间 X 是7:00
到 7:30 之间的均匀随机变量
(1) 乘客候车时间少于 5 分钟的概率
(2) 乘客候车时间超过10分钟的概率
例7.
试求:
解:
X ~ U ( 0, 30 )
设以7:00为起点0,以分为单位
为使候车时间X 少于 5 分钟,
乘客必须在 7:10 到 7:15 之间,或在7:25 到 7:30
之间到达车站.
从上午7时起,每15分钟来一班车,即7:00,7:15,7:30
等时刻有汽车到达汽站
故所求概率为:
依题意,
候车时间超过10分钟,则乘客必须在7:00到7:05或
7:15到7:20之间到达车间
2. 指数分布
若连续型随机变量 X 具有概率密度 f (x)为:
注:
▲
易证
满足:
为常数
其中
则称 X 为服从参数 的指数分布
其密度函数图
形请见教材
P56,关于分
布函数的图形
请自行完成。
由分布函数定义可得:若X 服从指数分布,则X 的分布函数为:
▲
▲
指数分布的性质(无记忆性)
若X 服从指数分布,则:
对任意的
有:
若设X是某一元件的寿命,则上式表明:元件
对它已使用过 小时没有记忆。
正态分布是应用最广泛的一种连续型分布.
正态分布在十九世纪前叶由数学家高斯加以推广,所以通常也称为高斯分布.
德莫佛
数学家德莫佛最早发现了二项分布的一个近似公式,这一公式被认为是正态分布的首次露面.
3. 正态分布
高斯
不知你们是否注意到街头的一种赌博活动? 用一个钉板作赌具。
街头
请看
高
尔
顿
钉
板
试
验
值得一提的是:
虽然很少有人会
去关心小球下落
位置的规律性,
人们可能不相信
它是有规律的。
而一旦试验次数
增多并且注意观
察的话,就会发
现,最后得出的
竟是一条优美的
曲线,这条曲线
就近似我们将要
介绍的正态分布
的密度曲线。
(1). 正态分布的定义
若随机变量 X 的概率密度为:
记作 :
f (x) 所确定的曲线叫作正态曲线.
和 都是常数, 任意, >0,
则 称 X 服从参数为 和 的正态分布.
其中:
(2). 正态分布 的图形特点
正态分布的密度曲线是一条关于 对称的钟形曲线,特点是“两头小,中间大,左右对称”
决定了图形的中心位置, 决定了图形
中峰的陡峭程度.
正态分布 的图形特点
由密度函数的表达式,分析正态分布的图形特点
即整个概率密度曲线都在 x 轴的上方.
(3)
▲
显然:
以μ为对称轴,并在 处达到最
大值:
▲
令: x=μ+c, x=μ-c (c>0)
f (μ+c ) = f (μ-c)
且 f (μ+c) ≤f (μ), f (μ-c)≤f (μ)
证明:
分别代入 可得:
以μ为对称轴,并在 处
达到最大值
故得:
▲
这说明:曲线 f (x)向左右伸展时,越来越贴近 x
轴。即 f (x)以 x 轴为渐近线。
因为当 x→ ∞时,f (x) → 0
f (x)以 x 轴为渐近线
(对 f (x)求导即可求得)
为 f (x)的两个拐点的横坐标
x = μ σ
▲
(4).
正态分布的分布函数
由分布函数定义得出正态分布,若
则 分布函数是
其图形为:
正态分布由它的两个参数μ和σ唯一确定, 当μ和σ不同时,对应的是不同的正态分布。
标准正态分布
下面介绍一种最重要的正态分布—
(5).
标准正态分布
其密度函数和分布函数常用 和 表示:
的正态分布为标准正态分布.
称
其图形为:
▲
密度函数
分布函数
(一般正态分布与标准正态分布的关系)
引理:
证明:
作一个线性变换
标准正态分布的重要性
▲
任何一个一般的正态分布都可以通过线性变换
转化为标准正态分布.
由此可得: 若
▲
即证得:
则其分布函数
注:
根据引理,只要将标准正态分布的分布函数制成表,就可以解决一般正态分布的概率计算问题。而现已编制了 的表,可供查用。请见教材P439附表2
教材P439附表2为标准正态分布函数数值表,借助于附表2 ,可以查表计算一般正态分布的概率问题。
关于正态分布表
▲
表中给出的是 时,
Φ(x)的值.
当 时有:
~ N(0,1)
注:
若 X~N (0,1),
◆
则有:
若
◆
则有:
◆
对任意区间
则有:
由标准正态分布的查表计算可以求得,
这说明:X 的取值几乎全部集中在 [ -3, 3 ] 区间
内,超出这个范围的可能性仅占不到 %
当X~N(0,1)时,
P( |X| 1) = 2 (1)- 1 =
P( |X| 2) = 2 (2)- 1 =
P( |X| 3) = 2 (3)- 1 =
(6)
3
原则
将上述结论推广到一般的正态分布,有:
时,
可以认为:
Y 的取值几乎全部集中在
区间内。这在统计学上称作“3 准则”
(三倍标准差原则)
下图是用某大学男大学生的身高的数据画出的频率直方图:
红线
是拟
合的
正态
密度
曲线
可见,某大学男大学生的身高应服从正态分布。
人的身高高低不等,但中等身材的占大多数,特高和特矮的只是少数,而且较高和较矮的人数大致相近,这从一个方面反映了服从正态分布的随机变量的特点。
除了前面介绍的身高外,在正常条件下年降雨量;各种产品的质量指标,如零件的尺寸;纤维的强度和张力;农作物的产量,如小麦的穗长、株高;测量误差,如射击目标的水平或垂直偏差;信号噪声等等,都服从或近似服从正态分布.
已知自动车床生产的零件的长度X(毫米)服从正
态分布
,如果规定零件的长度在
毫米之间为合格品.
求:生产零件是合格品的概率
解:
例1.
所求的概率为:
查附表2
例2.
从旅馆到飞机场沿 A 路走(路程断,交通拥挤)
所需时间(分钟)
沿 B 路走(路程
长,阻塞少)所需时间(分钟)
若现在只有 30分钟.
问:分别选择哪一条路为好?
解:
依题意,选择所需时间超过规定时间的概率较
小的路线为好.
当只有30分钟可用时:
A 路:
B 路:
结论:此时应选择A路
液体的温度X
(以℃计)是一个随机变量,且
将一温度调节器放置在贮存着某种液体的
容器内,调节器调整在
例3.
(1) 若
, 求 X 小于89的概率.
(2) 若要求保持液体的温度至少为80的概率
不低于,问 d 至少为多少?
解:
(2) 按题意需求d满足:
反查正态分布表,由于表中无的
的值
故采用如下方法处理:
查表可知:
由此可得:
故得:
现
公共汽车车门的高度是按男子与车门顶头
碰头机会在以下来设计的.设男子身高X~N(170,62)
设车门高度为 h cm
P(X≥ h)≤
或 P(X< h)≥ ,
的最小的 h
例4.
问:应如何确定车门高度
解:
按设计要求即求满足:
因为:X~N(170,62),
故:
查表得:
所以:
即: h = 170 + 184
结论: 设计车门
高度为 184 厘米
时,可使男子与
车门碰头机会不
超过.
P(X < h )
求满足
的最小的 h .
所以:
1. 定义
则 称点 为标准正态分布的上
分位点.
2. 图形:
面 积 为
四. 关于 分位点的概念
0
以 点右侧面积总和 它就是所有比 大的概率.
单侧
分位点
注:
比如:
反过来可以验证:
▲
用整块面积减去点 以后的那块面积
附表2上可查的从 到 的那块面积
从正态分布表上如何求 的值:
▲
对于给定的
则:
点
概率
所对应的
值
又比如:
( 同样可以验证:
则称 为标准正态分布的
双侧 分位点.
图形:
两小面积相加之和 =
又比如:
3.
双侧 分位点的定义
若
0
比如:
注意: 在后续的统计学中还将介绍
分布,
分布,
分布
的上 分位点的概念
*