11
((BayesBayes,,ThomasThomas))(1702(1702──1761) 1761)
贝叶斯是英国数学家贝叶斯是英国数学家.年生于伦敦;年生于伦敦;17611761年年44月月1717日卒于日卒于
坦布里奇韦尔斯坦布里奇韦尔斯..
贝叶斯是一位自学成才的数学家贝叶斯是一位自学成才的数学家..曾助理宗教事务,后来长期担曾助理宗教事务,后来长期担
任坦布里奇韦尔斯地方教堂的牧师任坦布里奇韦尔斯地方教堂的牧师.年,贝叶斯被选为英国皇年,贝叶斯被选为英国皇
家学会会员家学会会员..
如今在概率、数理统计学中以贝叶斯姓氏命名的有贝叶斯公式、如今在概率、数理统计学中以贝叶斯姓氏命名的有贝叶斯公式、
贝叶斯风险、贝叶斯决策函数、贝叶斯决策规则、贝叶斯估计量、贝叶斯风险、贝叶斯决策函数、贝叶斯决策规则、贝叶斯估计量、
贝叶斯方法、贝叶斯统计等等贝叶斯方法、贝叶斯统计等等..
22
贝叶斯方法(Bayesian approach(Bayesian approach ))
贝叶斯方法是基于贝叶斯定理而发展起来用于系统地阐述解决统计问题的贝叶斯方法是基于贝叶斯定理而发展起来用于系统地阐述解决统计问题的
方法方法(Samuel Kotz(Samuel Kotz和吴喜之和吴喜之,2000),2000)。。
贝叶斯推断的基本方法是将关于未知参数的先验信息与样本信息综合,再贝叶斯推断的基本方法是将关于未知参数的先验信息与样本信息综合,再
根据贝叶斯定理,得出后验信息,然后根据后验信息去推断未知参数根据贝叶斯定理,得出后验信息,然后根据后验信息去推断未知参数((茆诗松茆诗松
和王静龙等和王静龙等,1998,1998年年))。。
““贝叶斯提出了一种归纳推理的理论贝叶斯提出了一种归纳推理的理论((贝叶斯定理贝叶斯定理)),以后被一些统计学者,以后被一些统计学者
发展为一种系统的统计推断方法,称为贝叶斯方法发展为一种系统的统计推断方法,称为贝叶斯方法..””────摘自摘自《《中国大百科全中国大百科全
书书》》(数学卷)(数学卷)
33
第一章先验分布与后验分布
统计学有两个主要学派统计学有两个主要学派::频率学派与贝叶斯学派频率学派与贝叶斯学派..它们之间有异同它们之间有异同,,贝叶斯统贝叶斯统
计是在与经典统计的争论中发展起来计是在与经典统计的争论中发展起来,,主要的争论有主要的争论有::
1. 1.未知参数可否作为随机变量未知参数可否作为随机变量??
2. 2.事件的概率是否一定的频率解释事件的概率是否一定的频率解释??
3. 3.概率是否可用经验来确定概率是否可用经验来确定??
………………..
§ § 先介绍三种信息的概念先介绍三种信息的概念
经典统计学派规定统计推断使用两种信息经典统计学派规定统计推断使用两种信息::
总体信息总体信息 样本信息样本信息
而而贝叶斯学派认为是三种信息贝叶斯学派认为是三种信息::
总体信息总体信息 样本信息样本信息 先验信息先验信息
44
总体信息
即总体分布或总体所属分布族给我们的信息。即总体分布或总体所属分布族给我们的信息。 譬如,譬如,““总体是总体是
正态分布正态分布””就给我们带来很多信息:密度函数是一条钟形曲线;一就给我们带来很多信息:密度函数是一条钟形曲线;一
切一阶距都存在;有关正态变量(服从正态分布随机变量)的一些切一阶距都存在;有关正态变量(服从正态分布随机变量)的一些
事件的概率可以计算;由正态分布可以导出分布,分布和分布等重事件的概率可以计算;由正态分布可以导出分布,分布和分布等重
要分布,还有许多成熟的点估计、区间估计和假设检验方法可供我要分布,还有许多成熟的点估计、区间估计和假设检验方法可供我
们选用。总体信息是很重要的信息,为了获得此信息,往往耗资巨们选用。总体信息是很重要的信息,为了获得此信息,往往耗资巨
大。大。
55
样本信息
从总体中抽取的样本给我们提供的信息从总体中抽取的样本给我们提供的信息。。
这是最这是最““新鲜新鲜””的信息,并且愈多愈好。人们希望对样的信息,并且愈多愈好。人们希望对样
本的加工和处理对总体的某些特征作出较为精确的统计推本的加工和处理对总体的某些特征作出较为精确的统计推
断。没有样本就没有统计学可言。这是大家都理解的事实。断。没有样本就没有统计学可言。这是大家都理解的事实。
66
基于上述两种信息进行的统计推断称为经典统基于上述两种信息进行的统计推断称为经典统
计学,它的基本观点是把数据(样本)看成是具计学,它的基本观点是把数据(样本)看成是具
有一定概率分布的总体,所研究的对象是这个总有一定概率分布的总体,所研究的对象是这个总
体而不局限于数据本身。这方面最早的工作是高体而不局限于数据本身。这方面最早的工作是高
斯斯(Gauss,~1855(Gauss,~1855))和勒让德和勒让德
((Legendre,~1833Legendre,~1833))的误差分析,正态的误差分析,正态
分布和最小二乘法。从十九世纪末到二十世纪上分布和最小二乘法。从十九世纪末到二十世纪上
半叶,经皮尔逊半叶,经皮尔逊((Pearson,~1936Pearson,~1936))、费、费
歇歇((Fisher,~1962Fisher,~1962))奈曼奈曼
((.))等人的杰出工作创立了经典统计等人的杰出工作创立了经典统计
学。随着经典统计学的持续发展与广泛的应用,学。随着经典统计学的持续发展与广泛的应用,
它本身的缺陷也逐渐暴露出来了。它本身的缺陷也逐渐暴露出来了。
77
先验信息
即在抽样之前有关统计问题的一些信息,一般说来,即在抽样之前有关统计问题的一些信息,一般说来,
先验信息主要先验信息主要来源于经验和历史资料来源于经验和历史资料。。
例例11:有一英国妇女,对奶茶能辨别出先倒进茶还:有一英国妇女,对奶茶能辨别出先倒进茶还
是先倒进奶,做十次试验她都正确说出。是先倒进奶,做十次试验她都正确说出。
某学生第一次看到他的数学老师,即有反应:老师30岁
到40之间,极可能35岁左右(左右可理解为正负3岁,极可
能可理解为90%的可能).
P(32≤X≤38)=
88
99
三种信息
基于上述三种信息(总体信息、样本信息和基于上述三种信息(总体信息、样本信息和
先验信息)进行的统计推断被称为贝叶斯统计学。先验信息)进行的统计推断被称为贝叶斯统计学。
它与经典统计学的主要差别在于是否利用先验信它与经典统计学的主要差别在于是否利用先验信
息。息。贝叶斯统计学派把任意一个未知参数都看成贝叶斯统计学派把任意一个未知参数都看成
随机变量,应用一个概率分布去描述它的未知状随机变量,应用一个概率分布去描述它的未知状
况,该分布称为先验分布。况,该分布称为先验分布。
1010
贝叶斯的信息处理路径
1111
后验分布是三种信息的综合后验分布是三种信息的综合,,先验分布反应人们在先验分布反应人们在
抽样前对参数的认识抽样前对参数的认识,,后验分布反应人们在抽样后后验分布反应人们在抽样后
对参数的认识对参数的认识
BayesBayes统计推断原则统计推断原则::对参数对参数 所作任何推断所作任何推断((参参
数估计数估计,,假设检验等假设检验等))都必须建立在后验分布基础都必须建立在后验分布基础
上上..
1212
共轭分布法共轭分布法
后验分布和先验分布是同一个类型后验分布和先验分布是同一个类型
1313
定义:定义:设是总体分布中的参数(或参数向量),是的先验密度函数,设是总体分布中的参数(或参数向量),是的先验密度函数,
假如由抽样信息算得的后验密度函数与有相同的密度函数形式,则假如由抽样信息算得的后验密度函数与有相同的密度函数形式,则
称是的(自然)共轭先验分布。称是的(自然)共轭先验分布。
应该着重指出,共轭先验分布是对某一分布中的参数而言的。应该着重指出,共轭先验分布是对某一分布中的参数而言的。
如正态均值、正态方差、泊松均值等。离开指定参数及其所在的分如正态均值、正态方差、泊松均值等。离开指定参数及其所在的分
布去谈论共轭先验分布是没有意义的。布去谈论共轭先验分布是没有意义的。
1414
正态均值(方差已知)的共轭先验分布是正态分布正态均值(方差已知)的共轭先验分布是正态分布
1515
1616
1717
常用共轭先验分布
1818
共轭先验分布的优点
1919
贝叶斯估计在抽样推断中的应用
贝叶斯估计法也是一种需要利用与调贝叶斯估计法也是一种需要利用与调
查变量相关的辅助变量(先验信息)进行查变量相关的辅助变量(先验信息)进行
估计的方法,但其方法和思路与其他方法估计的方法,但其方法和思路与其他方法
相比有自己的特色。贝叶斯估计法的基本相比有自己的特色。贝叶斯估计法的基本
思路是,要对某一指标或目标进行估计,思路是,要对某一指标或目标进行估计,
则总体以前该指标的水平,即先验指标与则总体以前该指标的水平,即先验指标与
目前欲估计的指标(即目标量)也称后验目前欲估计的指标(即目标量)也称后验
指标有关,可以利用先验指标对后验指标指标有关,可以利用先验指标对后验指标
进行估计。进行估计。
2020
设,欲对总体均值设,欲对总体均值 进行估计,根据该总体以往的资料有进行估计,根据该总体以往的资料有
该指标的平均数该指标的平均数 和方差和方差 ,现从总体,现从总体NN中抽出容量为中抽出容量为nn的的
样本,计算得样本平均数样本,计算得样本平均数 和该平均数的方差和该平均数的方差 ,则总,则总
体均值的贝叶斯估计法的估计量为:体均值的贝叶斯估计法的估计量为:
2121
其中:其中:
估计量的方差为:估计量的方差为:
2222
显然显然 是相关的同一指标的两个取值水是相关的同一指标的两个取值水
平,则上式的平,则上式的 可以看做是以方差的倒数可以看做是以方差的倒数
和和 为权数的加权算术平均,实际上此方差的为权数的加权算术平均,实际上此方差的
倒数是估计精度的倒数,即方差的值越大,其倒数是估计精度的倒数,即方差的值越大,其
倒数便越小,则相应平均数作为估计的精度就倒数便越小,则相应平均数作为估计的精度就
越低,通俗的讲是该平均数的代表性越差;反越低,通俗的讲是该平均数的代表性越差;反
之,方差越小,其倒数越大,相应平均数的估之,方差越小,其倒数越大,相应平均数的估
计精度越高。计精度越高。
2323
贝叶斯估计量方差的意义是先验指贝叶斯估计量方差的意义是先验指
标和抽样指标精度之和的倒数。而以标和抽样指标精度之和的倒数。而以
上估计式有非常直观的含义:贝叶斯上估计式有非常直观的含义:贝叶斯
估计量的精度为先验指标精度与抽样估计量的精度为先验指标精度与抽样
指标精度之和,这意味着贝叶斯估计指标精度之和,这意味着贝叶斯估计
量的精度要高于量的精度要高于 中任何一个作中任何一个作
为估计量的估计精度,即:为估计量的估计精度,即:
2424
例如,某市有居民家庭共例如,某市有居民家庭共
9767097670户,根据上年的统计,居民人户,根据上年的统计,居民人
均月货币收入为均月货币收入为25802580元,其方差为元,其方差为
,现从该总体中随机抽出,现从该总体中随机抽出
100100户,调查目前居民人均收入水平户,调查目前居民人均收入水平
情况,有关调查结果和计算见表情况,有关调查结果和计算见表.
2525
2626
2727
2828
2929
3030
3131
3232
3333
3434
3535
3636
3737