前面我们介绍了随机变量的数学期望和方差. 对于二维随机变量(X,Y),反映两个分量X与Y之间关系的数字特征中,最重要的,就是本讲要讨论的
协方差和相关系数
§4-3 协方差、相关系数和矩
一.协方差与相关系数的概念
1.定义
设二维随机变量(X,Y),它的分量的数学期望为E(X), E(Y),若E[(X-E(X))(Y-E(Y))]存在,则称它为X,Y的协方差,记为
Cov (X,Y), 即
Cov(X, Y ) = E[(X-E(X))(Y-E(Y))]
2. 计算
(1) 若二维离散型随机变量(X, Y)的联合分布律为
且C o v(X,Y)存在, 则
(2) 若二维连续型随机变量(X,Y)的联合概率密度为 f(x , y ), 且C o v (X, Y)存在,则
(3) Cov(X,Y)=E(XY)-E(X)E(Y)
(证明如下)
Cov(X,Y)=E(XY) -E(X)E(Y)
可见,若X与Y 独立, Cov(X,Y)= 0 .
即
Cov(X,Y)=E{[ X-E(X)][Y-E(Y) ]}
=E(XY)-E(X)E(Y)-E(Y)E(X)+E(X)E(Y)
=E(XY)-E(X)E(Y)
=E{XY-XE(Y)-YE(X)+E(X)E(Y) }
3.简单性质
(5) Cov(X1+X2,Y)= Cov(X1,Y) + Cov(X2,Y)
(2) Cov(X, Y)= Cov(Y,X)
(4) Cov(aX, bY) = ab Cov(X,Y) a,b是常数
(6) 若X,Y 的协方差Cov(X,Y)存在,则
E(XY)=E(X)E(Y)+Cov(X,Y)
(3) Cov(X, X)=D(X)
⑴ Cov(X, a)= 0
(5) 随机变量和的方差与协方差的关系
D(X+Y)= D(X)+D(Y)+ 2Cov(X,Y)
若X1, X2, …, Xn两两独立,,上式化为
例1: 设(X,Y)在圆域
上服从均匀分布,求Cov(X, Y) 。
简解:经过计算可得
E(X)=0, E(Y)=0, Cov(X, Y)=0
例如:
协方差的大小在一定程度上反映了X和Y相互间的关系,但它还受X与Y本身度量单位的影响. 例如:
Cov(kX, kY)=k2Cov(X,Y)
为了克服这一缺点,对协方差进行标准化,这就引入了相关系数 .
二、相关系数
为随机变量X和Y的相关系数 .
1 定义:若二维随机变量(X, Y )的分量的方差D(X), D(Y)都存在,且D(X)>0, D(Y)>0, 则称
在不致引起混淆时,记 为 .
2 定义
若XY =0, 则称X, Y不相关。
例2: 设(X,Y)在圆域
上服从均匀分布,判断X,Y是否不相关。
(答:不相关)
提示:
例3 设(X, Y)服从二维正态分布
求X和Y的相关系数
X和Y不相关 =0
(见书 p132 例2)
例5:设XN(0,4), Y(2), XY =1/2, 求E(X+Y)2
(自己计算)
例4:设XU[0,2], Y=cos(X), 求XY
答案:
3. 随机变量X, Y 独立与X, Y 不相关的关系
(1) 假设XY 存在,若X, Y相互独立, 则XY=0, 即X, Y不相关。
反之,若X, Y不相关, 那么X, Y不一定独立。
(2) 特别,若 (X, Y)服从二维正态分布
则有X, Y 相互独立 = 0 X, Y不相关。
考虑以X的线性函数a+bX来近似Y,近似的误差为
e=E[Y-(a+bX)]2= E(Y2) + b2E(X2) +a2-2bE(XY )
+2abE(X)-2aE(Y)
求a,b使e最小
2 相关系数的性质:
问: 相关系数的大小如何?是否 ?
令
解得
将a0,b0代入e,用a0+b 0X来近似Y,则最小误差为
存在常数a, b(b≠0),
使P{Y=a+bX}=1,
即
Y与X之间以概率1有线性关系;
XY = 1 的充要条件是 P(Y=a+bX)=1(b>0);
XY = -1的充要条件是 P(Y=a+bX)=1(b<0) 。
3. 相关系数的意义
若| |的值越接近于1, e越小, X与Y之间越近似有线性关系;我们说X与Y的线性相关程度越高。
为 的严格减函数,它是用来刻划X, Y线性相关程度的一个量。
用a0+b 0X来近似Y,误差e= D(Y)(1- )
若| |的值越接近于0, e越大,越不能认为X与Y之间有近似线性关系;我们说X与Y的线性相关程度越弱。
Y与X之间以概率1有严格线性关系;
e= D(Y)(1- )
当XY =0时, X, Y之间的关系较复杂;可能X,Y相互独立;可能(X,Y)在平面上的某个区域内服从均匀分布;可能X,Y之间有某种非线性的函数关系。
四.矩
设二维随机变量(X,Y), k , l 为非负整数。
若E(Xk )存在,则称它为X的k阶原点矩,记作mk, 即mk =E(Xk )
若E(X-E(X))k存在,则称它为X的k阶中心矩,记作k, 即 k = E(X-E(X))k
若E(X k Y l )存在,则称它为X和Y的(k , l )阶混合矩,记作m k l, 即mkl=E(X k Y l );
若E[(X-E(X))k(Y-E(Y))l ]存在,则称它为X和Y的 (k , l )阶混合中心矩,记作k l , 即
k l = E[(X-E(X))k(Y-E(Y))l ]。
关于矩有下述结论:设k为正整数,
(1) 若E(X k )存在,则对小于k的一切非负整数l,E(X l )存在.
(2) 原点矩与中心矩可相互表示.
(3) 显然, X的数学期望E(X)是X的一阶原点矩, X的方差D(X)是X的二阶中心矩, X和Y的协方差 Cov(X,Y)是X和Y的二阶混合中心矩.
(第四章到此结束)
作业:17, 21, 25, 26, 27, 29, 32
下一次课我们要讲完第五章;
并且也要讲第四,五章的习题课
(下面先让我们学习第五章的大数定律)
学号 姓名
(测验3)
做第三章的作业 第19题
做完后,交给你班的课代表,再由课代表统一交给老师
学号 姓名
(测验3)
做第三章的作业 第7题
做完后,交给你班的课代表,再由课代表统一交给老师
学号 姓名
(测验3)
做第三章的作业 第17题
做完后,交给你班的课代表,再由课代表统一交给老师