现代信息决策方法
2-5 贝叶斯决策
第三节 风险型决策
常用的风险型决策方法:
(一)最大可能法
(二)期望值决策
(三)决策树决策
(四)贝叶斯决策
(五)效用决策
设不确定型决策问题的状态 出现的概
率为 (或 )连续时记为 。
已知 的不确定型决策是风险型决策。
进行风险决策最常用的数学方法是Bayes(又
称期望值)分析法。
(一)贝叶斯决策
根据已有信息和经验估计出的概率(分布)
叫做先验概率(分布)。
为提高先验概率分布的准确性和客观性,人
们常设计一些抽样调查,质量检验等方法,
借以收集新信息来修正先验概率分布。被修
正后得到的概率分布叫做后验概率分布。
贝叶斯决策
风险型决策的基本方法是将状态变量看成随机
变量,用先验状态分布表示状态变量的概率分布,
用期望值准则计算方案的满意程度。但是在实际
生活中,先验概率分布往往与实际情况存在误差。
为了提高决策质量,需要通过市场调查,
来收集有关状态变量的补充信息,对先验
分布进行修正,然后用后验状态分布来决
策,这就是贝叶斯决策。
贝叶斯决策
设有完备事件组{θj}(j=1, 2, …, n),满
足:
则对任一随机事件H,有全概率公式:
有关的概率公式
贝叶斯公式:
有关的概率公式
为事件 的先验概率,而称 为事件 的后验概率.
后验概率
先验概率
包含的意义?
(二)贝叶斯决策的基本方法
设风险型决策问题的状态变量为 ,通过市场调查分析所
获得补充信息用已发生的随机事件
为信息值。信息值的可靠程度用在状态变量
或已取值的随机变量
的条件下,信息值 的条件分布用 表示,在离散的
情况下, 个值 取 个值
则条件分布矩阵
表示,称 或
取
称为贝叶斯决策的似然分布矩阵。此矩阵完整的描述了在不同状态值
的条件下,信息值 的可靠程度 。
基本方法:首先,利用市场调查获取补充信息
贝叶斯决策的基本方法
或 ,去
修正状态变量 的先验分布,即依据似然分布矩阵所提供的
充分信息,用贝叶斯公式求出在信息值 或 发生的条件下,
状态变量 的条件分布 。经过修正的状态变量 的
分布,称为后验分布,后验分布能够更准确地表示状态变量
概率分布的实际情况。 其次,利用后验分布对风险型决策问题
做出决策分析,并测算信息的价值和比较信息的成本,从而提
高决策的科学性和效益性。贝叶斯决策的关键在于依据似然分布
用贝叶斯公式求出后验分布。贝叶斯决策的基本步骤如下:
1.验前分析
依据统计数据和资料,按照自身的经验和判断,应用
状态分析方法测算和估计状态变量的先验分布,并计算
各可行方案在不同自然状态下的条件结果值,利用这些
信息,根据某种决策准则,对各可行方案进行评价和选
择,找出最满意的方案,称之为验前分析。
考虑是否进行市场调查和补充收集新信息,决策
分析人员要对补充信息可能给企业带来的效益和补充
信息所花费的成本进行权衡分析,比较分析补充信息
的价值和成本,称为预验分析。
如果获取补充的费用很小,甚至可以忽略不计,
本步骤可以省略,直接进行调查和收集信息,并依据
所获得的补充信息转入下步骤。
2.预验分析
• 经过预验分析,决策分析人员做出补充信息的决定,
并通过市场调查和分析补充信息,为验后分析做准备。
•验后分析的关键是利用补充信息修正先验分布,得到
更加符合市场实际的后验分布。然后,利用后验分布进
行决策分析,选出最满意的可行方案。
•验后分析和预验分析都是通过贝叶斯公式修正先验分
布,不同之处在于,预验分析是依据可能的调查结果,
侧重于判断是否补充信息,验后分析是根据实际调查结
果,侧重于选出最满意的方案。
3.验后分析
社会经济实际中的决策问题,情况都比较复杂,
可适当地将决策分析的全过程划分为若干阶段,每一
个阶段都包括先验分析、预验分析和后验分析等步骤。
这样多阶段互相连接,前阶段决策结果是后阶段决策
的条件,形成决策分析全过程,称之为序贯决策。序
贯决策属于多阶段决策。
4.序贯分析
)、中(
例1 某工厂计划生产一种新产品,产品的销售情况有好
)、和差( )三种,据以往的经验 ,估计
三种情况的概率分布和利润如下表所示。
为进一步摸清市场对这种产品的需求情况,工厂通过调
查和咨询等方式得到一份市场调查表。销售情况也有好
( )、中( )、差( )三种,其概率列在下表中。
似然矩阵
先验概率
假定得到市场调查表的费用为万元,试问:
(1)补充信息(市场调查表)价值多少?
(2)如何决策可以使利润期望值最大?
如何,都要生产,最大期望收益值为 万元。
中 、坏 ,状态 的先验概率为
产方案 、不生产方案 ,产品市场有三种状态,即好 、
于是,
由风险型决策的期望值准则得到验前最满意方案:无论市场结果
解:第一步,验前分析。该厂生产新产品有两种方案,即生
第二步,预测分析。要计算调查后的各个时期值,必须计算
概 率 和后验概率 。计算概率 ,可把先
验概率 和条件概率 代入全概率公式,求得
计算后验概率 ,用贝叶斯公式
将上述有关概率值代入贝叶斯公式得下表
后验概率
矩阵
由以上可以求得:当市场调查为 时,每个方案
的期望收益为:
最大期望收益值
当 时
最大期望收益值
当 时
最大期望收益值
市场调查表这个补充信息的费用是 万元,因此取得补充信
该企业通过市场调查所得的期望收益值
由上可知,补充信息的价值是 (万元),取得
取得最大利润期望值的最优策略是进行市场调查,如果调
息是值得的。
查结果是新产品销路好或中等,则进行生产,否则就不生产。
• 综上所述,如果市场调查费用不超过万元,
就应该进行市场调查,从而使企业新产品开发决策
取得较好的经济效益。如果市场调查费用超过
万元,就不应该进行市场调查。
•该企业进行市场调查,如果销路好,就应该选择
生产;
•如果销路情况中等,也应该生产;如果销路差,
就选择不生产。
•看课本P40例3,实验课带课本
第三步,验后分析。
从理论上分析,可以利用补充信息来修正先验概
率,使决策的准确度提高,从而提高决策的科学
性和效益性。如果获得情报后收益比花费的代价
大,那么获取情报就是正确的决策,如果收益抵
不上代价,那么显然,就不必做试验了。
(三)贝叶斯决策分析的信息价值
(1)信息价值的意义
设 为补充信息值,若存在状态值 ,使得条件概率
或者当状态值 ≠ 时,总有
所以下面将分析如何在进行试验或抽样前来估计情报价
值的问题。
1.完全情报的价值
通常,将能够提供状态变量真实情况的补充信息称为完全信
息,即在获得补充情报后就完全消除了风险情况,把这种情况称
为完全情报,掌握了完全情报,风险决策就转化为确定型决策。
则称信息值 为完全信息值。
设决策问题的收益函数为 ,其中 为行动方案, 为
状态变量, 为完全信息值,掌握了 的最满意行动方案为
其收益值为 ,验前最满意行动方案 的收益
值为 ,掌握了完全信息值 前后收益值的增加量.
称为在状态变量为 时的完全信息值 的价值。
如果补充信息值 对每一个状态值 都是完全信息值,则完
全信息值 对状态 的期望收益值称为完全信息价值的期望值
简称完全信息价值,可表示为 。
2.完全信息价值的计算
从上面的公式可以看出,完全信息价值 ,实际上是掌
得到。即
握完全信息与未掌握完全信息时,决策者期望收益值的增加量。
值 的完全信息价值 ,可以通过下式对 求数学期望
如果咨询公司预测市场畅销,那么是否应该生产?如果预测
为滞销,是否应该进行生产?
握该产品的销售情况,可以聘请某咨询公司进行市场调查和分
析,它对产品畅销预测的准确率为,滞销预测的准确率为
。
例2 某厂生产某种产品,若市场畅销,可以获得利润15
000元,若市场滞销,将亏损5 000元。根据以往的市场调查情
况,该产品畅销的概率为,滞销的概率为。为了准确地掌
解:第一步,验前分析。先验分布如下表所示
先 验 分 布 表
所以应该进行生产。
每种方案的期望收益:
其中 , , 为畅销, 为滞销。
现在用 和 分别表示咨询公司提供畅销和滞销这两个情
预 测 似 然 分 布 表
报,根据给定的条件,其概率分布如表所示。
第二步,预测分析
当 发生时,
当 发生时,
计算后验概率
后验分布表和预测为 情况下的后验分布决策表如下两表
后 验 分 布 表
情况下的后验分布决策表
当 发生时,
这是最优行动为 ,生产。
当 发生时,
这时最优行动是 ,不生产。
如果预测准确度很高,预测畅销,则100%畅销;预测滞销,则
这时
,
,
100%滞销。
高 。 是完全情报 的价值。
选择行动 ,这时要损失 元。因此掌握此情报的收益提
这时收益为 ;如果决策者无此情报,那么就会按先验分布而
果 是完全情报,决策者掌握了就会选择行动 ,即不生产,
在这种情况下,补充的情报使不确定问题变成确定问题。如
本例的 (元)
在完全情报情况下进行决策,完全情报的价值的期望值称为
完全情报价值,可表示为 。
如果 是完全情报,决策者掌握它选择行动 ,收益为
。未掌握它按先验分布决策也是 ,收益也是 。因此掌握
此完全情报的收益是 (元)。
四、Bayes决策的应用
例1 (多行为问题,又称报童问题或破产销售问题)。
第一百货商场过去200天关于B商品的日销售量记录见表
1。B商品的进价为200元/件,售价为500元/件。如果当
天销售不完,余下的将全部报废。求B商品的最佳日订
货量a*及相应的期望收益金额EMV*和完全情报价值EVPI。
i 1 2 3 4 5
(件) 5 6 7 8 9
天数 20 40 80 30 30
表1 B商品的销售量记录