第三章 主观概率和效用理论
内容提要
1、随机性决策问题的特点及分析方法;
2、效用理论
3、主观概率
4、贝叶斯分析
学完本章后,你应该能够:
⑴掌握随机性决策问题的基本特点,并知道对其进行分析的步骤;
⑵根据效用理论建立效用函数;
⑶知道如何估计主观概率;
⑷根据期望效用进行方案的选择。
引言
我们已经看到,预期值评价模型能够对带有风险的决策过程进行有效地指导,特别是在中小型企业多次反复进行决策时,更是如此。预期值是管理人员在多次作出相同或相似决策时,可望取得的“平均”利润值。因此,在有风险的条件下作出有关资金预算的各种决策时,管理人员最好能用预期值评价模型作为有效的辅助工具。
假如要你作出一个有风险的决策,而且这个决策只能作一次。假定你面临着下述选择,并且只有一次机会进行选择:你可以稳拿25美元;或者按照弹硬币的结果行事,如果硬币正面向上你就可以赢150美元,如果背面向上,你就要赔50美元。你喜欢哪种办法呢?认真地想一想。
许多人,可能包括你在内,宁愿稳拿25美元,尽管弹硬币结果的预期值是它的双倍,即()(150)+()(-50)=50美元。
这是否说明这些人很荒唐呢?否,他们只不过表达了自己的感觉,宁愿只拿到25美元而不愿冒输掉50美元的风险,尽管有相等的机会可以赢得150美元。
如果人们宁愿稳拿这25美元是合理的话,那么,预期值评价模型就必然有毛病。这个结论是不正确的!
问题:如何对此予以合理的解释?
预期值只是在适当反映决策者的偏向时,才是个有用的评价模型。在涉及重复多次或利害关系较少的各种类似的选择条件下,决策者可能认为自己的偏向与结果的简单预期相符。但当他要作出利害关系较大的决策,并且只能作一次时,他就会希望避开可能的不幸结果,虽然实际上他取胜的希望很大。如果是这样,我们就说他讨厌风险。
在作决策时,大多数人是讨厌风险的,至少在某些决策情况下是如此。当然由于性格差别,每个人讨厌风险的程度会有很大不同。实际上,有少数人是喜欢冒大风险的。例如,一般人乐于稳拿25美元,而他们却情愿冒险,因为他们认为也许运气好,能赢得150美元。实践表明,这样的人属于少数。管理人员要作出的真正重要决策,往往是一次性的,而且利害攸关。所以管理人员在作许多重大的一次性决策时往往不是借助于简单的预期值评价模型。
讨论与思考:
同学们可以测试一下自己是一个喜欢冒险的人还是讨厌风险的人。或者在某些情况下,你比较倾向于冒险;而在另外一些情况下,你又倾向于保守。
既然预期值评价模型不适合利害攸关的一次性决策,那么,管理人员就应该掌握其它的评价模型
——期望效用评价模型
在介绍效用函数和主观概率的知识之前,我们先简单地介绍一些有关随机性决策分析的知识。
第一节 随机性决策分析
一、随机性决策分析问题的基本特点
随机性决策分析问题的基本特点,是后果的不确定性和后果的效用。
每个随机性决策问题都包含两个方面,即决策人采取的行动(简称决策)和自然状态(简称状态)。
在生产问题中,决策人的决策是生产或不生产某种产品,如果生产,应生产多少件,状态是该产品的市场需求量。
在带伞问题中,决策人的决策是带伞或不带伞,状态是下雨或不下雨。
1、后果的不确定性
状态不能由决策人控制,而且在事先决策还不能对它准确预测。由于状态的不确定性,故不论决策人采取什么行动,都可能产生各种不同的后果。
例如,带伞问题共有两种决策和四种后果,即:带伞遇雨和带伞不遇雨;不带伞遇雨和不带伞不遇雨。生产问题的情况更复杂一些,决策人能采用的决策有许多种,例如,他可以不生产,也可以生产一万件、五万件或十万件。这种产品在市场上的销售可能有三种情况,即畅销、滞销或销路一般,它们是这个问题的状态。由于这个问题的决策有四,而状态有三种,因此能产生十种可能的后果(不生产只有一种后果)。因为出现什么状态是不确定的,所以,决策人作出某种决策以后会出现什么后果也是不确定的。后果的这种不确定性是随机性决策问题的主要特征之一。
2、后果的效用
效用是后果价值的量化。由于下述两个原因相同的结果对不同的决策人会产生不同的效用:
⑴对风险的不同态度。由于在不确定情况下,无论决策人采取什么决策,他都会遇到他事先不能完全预料的后果,因此,他要承担一定的风险。而各决策人对风险的态度往往是不相同的。
⑵不同的偏好。即使在没有风险的情况下,不同的决策人对各种后果也有不同的偏好。所以在进行定量的分析之前,必须确定所有后果的效用。只有这样,人们才能比较各种决策的优劣,并从其中选择他们所最喜爱的那个决策。
以上两点,即后果对决策人的不确定性(它又是由状态的不确定性所引起的)和对所有后果赋予效用,是决策分析中的两个关键问题。在决策分析中,状态的不确定性主要用主观概率来表示,而研究后果的效用则有效用理论。
结论
二、随机性决策问题的基本分析方法和步骤
制定决策有各种各样的办法,在许多情况下人们往往是根据自己的经验或直觉去作判断和决定。例如,出门是否带伞,在没有听到天气预报时,每个人将根据自己的经验去作决定。但是,对于一些复杂的问题,例如制定产品的生产计划,只凭经验往往不可能作出正确决定,需要采用一种合乎逻辑的方法去帮助人们思考,这种方法是使用决策人自己判断的概率和主观估计的效用函数,去制定决策。
1、随机性决策问题的基本分析方法
2、决策分析的基本步骤
第一步,构成决策问题。这一步要为决策问题提供决策(即产生方案或行动)和标定目标。
第二步,确定各种决策可能的后果并设定各种后果发生的概率。
第三步,确定决策人的偏好,并对效用赋值。
第四步,评价和比较决策。这一步的目的是在以上三步的基础上选择决策人最满意的决策。评价决策的依据是计算各种决策的期望效用。根据Von Neumann-Morgenstern的效用理论,可以选择期望效用最大的决策作为决策人最满意的决策。
以上步骤并不是一成不变的,例如为了分析的方便,有时可把第三步放在第二步之前进行。如果决策人对于分析的结果感到不够满意,则需要收集新的信息,并把这种新信息运用到决策分析中去。这个问题我们将在贝叶斯分析中介绍。
第二节 效用理论和价值的主观表现
效用理论是获取对价值的主观表现的一种手段。有些条件结果的预期值并不考虑每个条件结果对决策者的实际价值如何。所以必须有方法把条件结果转换成衡量价值或效用的尺度。
问题:
让我们想一下,这件事应当怎样来做?
重新考虑第二章介绍过的三种赌赛和图2-2中决策树所画出的情况。条件结果以美元计。怎样才能将它们转换为效用尺度呢?最优和最劣条件结果分别是“赢20美元”和“输10美元”。一开始,先指定赢20美元这个条件结果的效用是1,输10美元这个条件结果的效用是0。然后,对其他每一个条件结果,根据其与赢20美元和输10美元的对照情况,指定其效用分别介于1和0之间。这样,我们对赢10美元所定的效用数就会比对赢2美元的效用数大,因为两者之间我们更倾向于前者。
我们可以根据本人对于事物的反应来规定效用数。例如,你认为赢14美元与赢20美元的高兴程度几乎一样,那么,就可以将条件结果赢14美元的效用数定为。同样,你认为赢20美元才真正高兴,而输10美元实在令人不快。如果你不赚不赔,从感情来说就介于前面两种感情的正中,于是就可以给赢或输0元一个的效用数。你可以不断指定各个效用数值,推敲自己的想法,直到你对回答感到满意为止。但是不管你对该问题想了多长时间,想得多么细致,由于这个过程是从个人偏见出发的,你仍会对它不满意。
一、建立效用函数
效用是后果价值的量化,效用通常用效用值来衡量。效用值U是对实际货币值的一种效用度量的标准,它是实际货币值的函数,并且因人而异。若用M表示实际的货币值,则效用值可以记作U(M)。
同实际的货币值不同,效用值大小是一个相对数字,规定如果一个决策者对可能出现的两种结局认为无差别的话,则认为两者的效用值相同,可以此为准则来计算每个人对不同货币值的效用值。
1、第一种方法的步骤如下:
建立效用函数有两种方法
图3-2 效用函数
-8
-6
-4
-2
0
2
4
6
8
10
12
14
16
18
20
美元
0
0
(20,)
效用
对风险持中立态度者的效用曲线
避风险持者的效用曲线
冒风险者的效用曲线
以赌赛为例来说明如何建立效用函数
现在来一个简单的赌赛—— 弹硬币,正面朝上,你就赢20美元,背面朝上,你就输10美元。硬币只弹一回,立即定输赢。你也可以不参加这个赌赛而代之以稳拿一笔固定的金额。假设让你在稳拿该赌赛的预期值和参加弹硬币二者之间作出选择。赌赛的预期值是()(20美元)+()(-10美元)=5美元。你愿意采取那种办法呢?请仔细想一想。
如果经过仔细考虑后,你决定稳拿这5美元的预期值。但这笔钱没有付给你,却又向你提出类似的问题。而这一回稳拿的钱数只有2美元,或者按照弹硬币的结果来定。假定你仍旧愿意稳拿2美元,因为你确实不想有的可能去输掉10美元。那么,下一个问题就是:你是否宁可赔1美元而不去弹硬币呢?假定你的答复是宁可承担该赌赛的结果,却不愿为了避免赌赛而白赔这1美元。
经过再次质询之后,假定你最终同意:如果让你稳拿一笔钱,你就愿意拿这笔钱而不参加赌赛,但是不愿意为了不弹硬币而白赔钱。这样一来,在稳拿的钱为0美元时,你对于是否参加弹硬币是无所谓的。这就是说,你愿意不输不赢地走开或接受弹硬币的结果。正好在这一点上,你表示无所谓。于是,你对是稳拿0美元还是参加图3-1所示的赌赛都无所谓。
P=
P=
20美元()
-10美元()
图3-1 赌赛
现在可以利用这个信息给“赢或输0美元”(不赚不赔)的结果指定一个效用数(赢20美元的效用数为1,赔10美元的效用数为0)。图3-1括弧内示出这些效用数。
在前面的分析中,我们曾经用机会点的条件结果预期值来代替决策树中的机会点。现在我们计算与机会点的条件结果有关的效用数的预期值,结果得出()()+()()=。与从前几乎完全相同,我们可以令为该机会点的效用数。由于我们对不赚不赔和这种风险情况都无所谓,所以也可以给0美元指定一个的效用数,并记为U(0)=。表3-1概括了这一程序。
表3-1 对U(0美元)=的估计
你是否既不想稳拿也不想稳赔,还是参加图3-1弹硬币?
你宁愿白赔1美元,还是按图3-1弹硬币?
你宁愿稳拿2美元,还是按图3-1弹硬币?
你宁愿稳拿5美元,还是按图3-1弹硬币?
问题
无所谓
弹硬币
稳拿2美元
稳拿5美元
回答
0美元的效用数等于
-1美元的效用数小于
2美元的效用数大于
5美元的效用数大于
含义
现在可以在得0美元与赢20美元以及在赔10美元与得0美元之间,设置一些机会均等()的赌赛,继续进行这一程序。例如,让你说出,为了不参加“正面朝上就赚20美元、背面朝上不赚不赔”的赌赛,你希望稳拿到手的最低钱数。请仔细想想这个问题。
如果仔细想想这个问题,你就会对自己这样说:“好吧!我宁愿稳拿15美元,或者拿10美元也行。但是如果只能稳拿5美元,那我宁可去弹硬币,因为那样做,我得到的钱数总是在5至10美元之间。如果只能稳拿6美元或7美元,甚至8美元,那我还是情愿去弹硬币。但如果能稳拿到9美元,那我想我是会拿这笔钱的。总之,我要求能稳拿的钱数至少是在8至9美元之间,可能更接近于8美元,例如说美元吧”。
于是,我们给美元指定这样的效用数,它等于这个新赌赛的效用数预期值,即()()+()()=,并记为U()=。
现在假定我们问一个类似的问题:在赔10美元与不赚不赔二者之间弹硬币。这次,你回答说,你愿意最多白赔美元而不参加弹硬币。注意,为了避开赔10美元的可能性,你宁愿白付出大于弹硬币的预期金额值。这个赌赛的效用数预期值是,我们把这个数作为白赔美元的效用数,记为U()=。
按照上述的方法,我们可以假设各种各样的赌赛(20美元与美元之间,美元与0美元之间,0美元与美元之间,美元与-10美元之间),就可以继续进行这一过程,从而得出更多的效用数。
2、第二种方法的步骤:
假定让你在稳拿5美元或是参加一个效果为“赢20美元”或“赔10美元”的赌赛二者之间进行选择。如果赢20美元的概率是,你说你还是愿意稳拿这5美元。现在假定有的机会赢20美元,只有的机会赔10美元。那么,你可能愿意参加赌赛。我们要求的是赢20美元的概率达到这种程度,才使你对稳拿5美元和参加赌赛都无所谓。为了帮助你求得这个概率,就应该明确地问你类似上述的问题。另外,你向自己提问题,可能更容易求得这个概率。
经过深思熟虑之后,假定你说,如果赢20美元这一结果的可能性至少是2比1时才愿意参加赌赛。这样,赢20美元的概率必须在左右,你才对稳拿5美元或参加赌赛都无所谓。因此,我们得出U(5美元)=
二、作为评价模型的效用函数
为决策者建立效用函数的目的是用它作为评价模型。在决策树方法中,我们用条件结果的预期值来代替条件结果的机会点。这样,实际上就默认决策者对机会点和条件结果预期值都无所谓。如前所述,这个假设只是在决策者对风险持中立态度时才适合,但很多人对风险往往是讨厌的。
效用数是根据下列程序来指定的。考虑一个已知其条件结果效用数的机会点或赌赛。求出某一结果,使决策者对接受该结果与该机会点都无所谓。然后给这个结果指定一个效用数,该数等于条件结果的效用数的预期值。某个结果可能不是条件结果的预期值,但按照我们建立效用函数的规则,它的效用数应该是条件结果的效用数的预期值。
这个结果表明,与其使用条件结果预期值,还不如利用与这些结果有关的效用数预期值来评价各种备选方案。这个评价模型等同于简单预期值模型,只是它引进了效用函数U,而U对每个决策者都是不同的。这种模型的缺点是它需要较多的信息,因为,我们必须与决策者互相协商以取得U的估值。另外,对不同的决策者,结果也会不同,所以没有单一的答案。
有的人可能反对利用这种模型,由于模型中包括有主观判断,不如简单预期值模型客观。但正如我们强调过的那样,选择一个评价模型的真正准则是它能否很好地反映了决策者心中的真实偏向。由于预期效用模型明确地将这些偏向结合进去,从这条准则来看,它就是优秀的模型。注意,如果决策者确实对风险持中立态度,并且愿意按条件结果预期值来办事,那么,这种态度也会作为效用函数的特殊情况反映出来。这种效用函数就是图3-2所示的直线。
赌赛的例子
重新考虑在三种赌赛中进行选择的问题。分析该问题用的决策树,如图3-3所示。但此时,有关结果的效用函数值示于结果右边的括弧内。这些值都是从早先建立的效用函数中得出的,见图3-4。
选赌赛A1
选赌赛A2
选赌赛A3
正面P=
反面P=
正面P=
正面P=
正面P=
正面P=
反面P=
反面P=
反面P=
反面P=
10美元
-2美元
2美元
-1美元
20美元
-5美元
5美元
-10美元
()
()
()
()
()
()
()
()
效用U(Oi )
-10
10
20
-6
-2
2
6
图3-4 为赌赛选择问题估计的效用数
现在按照在个机会点取预期值的办法,沿这个决策树“反推”。但不是取条件结果的预期值,而是取这些条件结果的效用数的预期值。完成上述计算后,得出图3-5所示的结果。
选赌赛A1
选赌赛A2
选赌赛A3
图3-5 效用数的分析结果
这个结果对A1来说是一样的,因为按照条件结果模型的预期值,A1也是优先被考虑的。但是利用条件结果的预期值时,其值为美元的A3要比其值为美元的A2优先。而按照预期效用模型,A2要比A3优先。从图3-3的决策树中可以看出A2的风险很小,虽然你只能赢2美元,但最坏情况下也不过只赔1美元。而A3则有可能赔5美元或10美元之多。这些负的结果在很大程度上影响了效用函数,所以“较安全”的方案A2现在要比A3更为优先。
太平洋石油公司的例子
现在再一次考虑该公司的油母页岩问题。假定我们能够见到该公司负责作出这项决定的决策者,他会向你说,对于投资较少的决策,本公司是愿意根据条件结果的预期值来作出决策的。但是,对于像油母页岩发展战略这样重大的决策来说,可能要蚀本达5亿美元之巨,这是个严重的后果。所以,他同意回答有关赌赛的几个问题。最后,我们替他画出图3-6所示的效用曲线。
图3-6 太平洋石油公司的效用函数
效用U(Oi )
-500
100
200
-400
-300
-200
0
300
400
500
你也许会问,为什么要采用这位决策者的效用函数呢?我们真正要的是该公司的效用函数,如果存在着这种函数的话。但是,我们也许可以假定这位决策者在作出反应时,并不反映他个人讨厌风险的心情。更确切地说,他反映了自己对公司在风险情况下应如何作出反应的看法。假如是这样,那么他作出的反应,就可作为我们取得该公司的效用函数最佳近似值的基础。总而言之,真正作决策的并不是太平洋石油公司,而是这位决策者。
现在用相应的效用函数来代替公司决策树中的条件结果,见图3-7。反推该树后得出最初只搞研究战略的预期效用函数值为,研究与发展相结合战略为,全力发展战略为。其他的机会点和决策点上的这些结果和预期效用函数值见图3-7。
注意,在利用效用函数值时,这三种战略的优劣顺序情况与计算条件结果预期值时完全一样。相当于这些效用值的肯定利润(可从图3-6求出)为:最初只搞研究战略是2934万美元,最初研究与发展战略是6948万美元,而全力发展战略则赔7827万美元。此外,这些肯定利润均小于相应的条件结果预期值。
只搞研究
研究与发展相结合
无突破p=
突破p=
无突破p=0.7
突破p=0.3
变为研究与发展相结合
变为全力发展
继续研究与发展相结合
变为全力发展
全力发展
()
()
()
()
()
()
()
()
图3-7太平洋石油公司附有效用数的初始决策树
非货币结果的例子
除货币以外的其他结果也可以建立效用函数,了解这一点是重要的。例如,假定一个小学校长打算决定是否继续执行目前为三年级举办的阅读计划,还是采用一种按照新方法编的新阅读计划来教授阅读课。
学生的学科成绩可以通过考试,按百分制来评定。这位校长坚信,如果继续执行目前的计划,三年级学生的考试成绩将为50分左右。新课程计划的成绩有好有坏。只要真正取得成功,一个班的读书分数一般要比目前实行的计划多10分左右。但在某些情况下,却几乎没有效果。在少数情况下,所得的结果却糟得很。由于教师未能根据新教材修改教学方法,学生成绩实际上下降达15分之多。在了解师生情况以后,这位校长估计新教学计划可能效果的概率如下:
分数降低到35分
分数不变
分数提高到60分
概率
阅读计划的效果
问题:这位校长是否采用这个计划呢?
第三节 先验信息和主观概率
在太平洋石油公司的例子里,我们应用了低价、现价、高价和禁运以及技术突破的各种概率。现在我们讨论如何从主观估计求得这些概率。为了建立效用函数,决策者必须明确地提供信息,说明自己的偏向。在某些实际情况下,还可能需要决策者提供他对未来事件发生概率的主观估计。
概率论是研究随机事件的数量规律性的理论。人们通常通过随机试验去观察随机事件。所谓随机试验,是指不能事先准确地预言它的结果,但在相同条件下可以重复进行的试验。概率的概念通常是以“相对出现频率”的形式建立起来的。
一、主观概率和客观概率
1.客观概率
把一个事件的概率定义为该事件在一长串随机试验内出现的相对频率,这就叫客观概率,因为它同我们在实际世界内能够观察到的现象有关。
假如给你看一块硬币,让你说出弹它时正面朝上的概率。你就会假定它是公正硬币,指出该概率为。这样得出的概率可以称作客观概率。
在现实中,由于下述两个原因,有许多决策问题不允许人们去进行随机试验。
2.主观概率
首先,某些决策问题需要对尚未发生,又具有某种不确定性的事件进行预测。这些事件不允许人们在相同条件下重复进行试验。例如在前面列举的带伞问题和生产问题,都是这种情况。未来的天气和将要在市场上销售的商品,都不可能事先在相同条件下重复作试验,因此,不能用随机试验去确定他们的概率。
此外,有些决策问题在理论上虽然可以进行随机试验,但由于各种原因,实际上也无法进行。例如有关洲际导弹发射的决策问题,将涉及导弹命中的概率。这种概率虽然原则上能通过在相同条件下的重复试验去确定,但由于发射一枚洲际导弹的费用十分昂贵,事实上也不可能多次重复发射。
既然许多决策问题的概率不能通过随机试验去确定,那就只能由决策人根据他们自己对事件的了解去设定。这样设定的概率反映了决策人对事件掌握的知识所建立起来的信念,称为主观概率,以区别于通过随机试验所确定的客观概率。
主观概率论是进行决策分析的依据。这是因为客观概率论者要求在相同条件下从现象的重复性,去得到他们认为有意义的推论。如前所述,许多决策问题,根本无法进行重复试验,而主观概率论者在接受到任何分量的先验信息时,都能对决策问题进行逻辑推理。当然,主观概率论者要能比较正确地设定主观概率,仍有赖于对事件作周密的观察,去获得先验信息,这种信息并不是主观臆造的。而且先验信息愈丰富,则设置的主观概率愈正确。
决策人在作出主观估计的依据,是他所获得的先验信息。所谓先验信息,是指进行贝叶斯分析时,在通过试验收集有关状态的新信息之前,决策人所掌握的信息。由状态的先验信息所确定的概率分布,称为先验分布,它是进行贝叶斯分析的基础。
二、先验信息
三、主观概率的估计
重新考虑太平洋石油公司的例子,它可以帮助我们讨论主观概率的估计问题。
由于决定该公司油母页岩发展计划的最终利润(或亏损)时,近期原油价格是个重要因素。假定经理打算估计一下近期价格,公司又没有合适的预测模型来作这些估计(虽然许多石油公司实际上是有这种模型的)。
想想,这时这位经理应该怎样做?
这位经理决定在本单位内寻找对这方面知识最丰富的人员(可能是采购人员)。他不是简单地要求这个人提出各种价格下原油的销售概率,而是力图帮助这位采购人员去决定这些估计值。
经理首先应保证自己的提问没有含糊不清之处。他要求采购人员在假定不存在石油禁运,并假定目前油母页岩加工技术不会出现突破,对五年后各种原油价格的概率作出估计。于是,他们开始对话。
经理可能希望向采购人员简单说明一个事件后,就要求对方估计出该事件的概率。他可能问道:“假定现在原油价格为每桶44美元,五年后降为40美元的概率是多少?”采购人员可能觉得难以回答,他也许会说:“可能性极小。”但他不能说得更精确了。
1.概率转盘
为了帮助采购人员,经理可以利用有黑白两个扇形区的圆盘,即概率转盘(此盘由美国Stanford大学Howard教授提供)。圆盘划分为两个扇形区,分别为黑色和白色。圆盘中心有一根可旋转的指针,它有时位于黑区内,有时位于白区内;黑区的大小可以任意调节,见图。
图 概率转盘
经理可以在黑白区占圆盘一半时开始提问。他可以问采购人员是愿意打赌5年内石油价格会降到每桶40美元以下,还是愿意打赌指针在旋转后将停在黑区内。假定采购人员说:“想来打赌指针停在黑区内的把握性大些。”于是,经理就将黑区缩小为圆盘的四分之一。这时,采购人员再次认为宁可打赌指针将停在黑扇形区内。经理再把黑扇区减为圆盘的八分之一()。
这时,假定采购人员犹豫了一下说,“现在我可确实不愿意在指针上打赌了。另一方面,我也确实不愿意打赌每桶石油价格会降到40美元以下。我基本上对参加这两种方式的打赌大体上都无所谓。”于是,经理就把石油价格降为每桶40美元以下的概率为。这段对话可归纳为表。
表 用概率转盘估计主观概率
愿意就 P(价格 40美元) <
指针打赌
愿意就 P(价格 40美元) <
指针打赌
无所谓 P(价格 40美元) =
转盘外形 回答 含义
情况:你可以打赌,石油价格在5年内将为40美元以下;或者打赌,指针将落在概率转盘的黑色
其次,假定经理向采购人员询问油价高于48美元的概率。后者在黑区占圆盘一半时,马上就表示两种打赌对于他已无所谓。于是,在油价降至40美元以下的概率为,涨至48美元以上的概率为时,油价介于40与48美元之间的概率就是-(+)=。
2.区间法
除了概率转盘之外,经理还可以利用逐步细分法帮助采购人员得出结论。他可以把事件的不确定量的区间Ξ划分为两部分,例如,把五年后原油最低价格设为40美元,最高价格设为80美元。我们把这个区间划分为40美元到48美元和48美元到80美元。
然后询问采购人员:他认为5年后原油的价格处在哪个部分的可能性大?最后改变区间的划分点,减小可能性在的那个部分,直到他认为5年后的价格处在两个部分中是等可能的为止。
概率估计的用途
管理人员所需细节的数量取决于如何利用这些结果。本例中,假定经理知道这些结果是用来画决策树的,为减少机会分支的数量,他只选用三个估计价格。
第一个估计价格大致与目前价格相等,即每桶44美元。采购人员估计,五年内实际价格介于40与48美元之间的概率是。于是,经理就取目前价格44美元为这个价格范围内的代表值,算出原油为该价格时每种油母页岩开发战略的利润和亏损。这些结果已知不发生禁运的概率约为。
其次,经理估计油价降到40美元以下的概率为,并选一个有代表性的价格(例如每桶为36美元),算出每种方案的结果。最后,油价高于48美元的概率为,并算出某一代表性价格(例如56美元)下各种方案的结果。
这些概率是假定不发生石油禁运的情况下估算的。现在假定经理向外部的专家咨询,估出石油禁运的概率为。这样,他就能用联合概率公式将他的各种价格的估计概率修改如下:
以上是目前太平洋石油公司所采用的概率(见第二章表)。
第四节 贝叶斯决策
所谓贝叶斯决策是贝叶斯公式在决策中的应用。通俗地说,贝叶斯决策是当决策者对自己依靠先验信息所得到的先验概率(或主观概率)而做出的决策不满意时,他可以通过收集更多的信息来修正自己原来所做的概率估计来重新做出更为满意的决策。
一、贝叶斯公式
贝叶斯公式是由英国数学家贝叶斯提出的,设A1 , A2 ,……,An是一个完备的事件组,则对任一事件B有
公式的推导,因有
只要将()式代入()左端后,移项即得式()。
式()中, P(A1 )是先验概率, P(B| Ai )是由样本获取的信息, P( Ai | B )则是先验概率经样本信息修正后得到的后验概率。当然对后验概率如果继续抽取样本并根据新的信息再次修正的话,则原有的后验概率当作先验概率,而再次修正后的概率成了后验概率。
二、用一个简单的例子来解释贝叶斯决策(参见P301)
假定有两个外观完全相同的盒子,盒的内壁分别标记A1和A2,盒A1内盛8个白球2个黑球,盒A2内盛8个黑球2个白球,任取一个盒子让你猜此盒是A1还是A2。因两个盒子外观完全相同,所以你只能判定属A1和A2的机会相等,有P(A1)=P(A2)=,这就是先验概率。
若让你从指定的盒子中随机摸出一个球来,当摸到的为黑球时,你会倾向于该盒子是A2 ,摸到为白球时,会倾向于该盒子为A1 。这是因为把B当作摸到黑球的事件,则有P(B| A1 )= , P(B| A2 )=,这是样本提供的信息。当摸球后再判定盒子是A1或A2 ,即求后验概率P( A1 | B )和P( A2 | B ) 。由式()可计算得到P( A1| B )= ,P( A2 | B )= 。
本章小结
效用函数和主观概率是帮助现代管理人员作决策的有效工具。应该在概念上弄清楚条件结果预期值并非用于在风险下作决策的唯一评价模型。简单预期值模型并不考虑决策者对风险的态度。决策者可能很讨厌冒风险,希望避开一切可能产生不幸结果的任何机会。
可以替讨厌冒风险的决策者建立一个效用函数,可以用效用函数值代替相应的条件结果值。可以把效用数编成表格形式或决策树,计算出它的预期值,并据以排列各个备选方案的优劣顺序。大多数人都不愿冒风险,所以与一个方案的预期效用函数值有关的结果值一般要比条件结果的预期值小。
同样,主观概率也是根据决策者的判断作出的。即使在不能从历史资料或预测模型求出“客观”概率时,这些概率也可作为决策的根据。
求效用函数与求主观概率的办法是类似的。在求效用函数时可用下列任一方法:
⑴列出一个机会各半的赌赛的条件结果,要求决策者说出一个稳拿的结果,他对于接受该结果或接受赌赛结果都无所谓。
⑵列出一个稳拿的结果以及一个赌赛的条件结果,要求决策者找出该条件结果的概率,使他对这个稳拿的结果和接受该赌赛的结果都无所谓。
为了得出主观概率可用下列任一方法:
⑴指出一个事件,要求对方确定出圆盘的某一块面积,使他打赌该事件将发生或打赌指针将停留在圆盘的那一块面积内的把握性都一样。
⑵要求决策者将结果值的一个区间分成更小的区间,每个区间的发生概率均相等。
问题特征
在分析有风险、费用高和有潜在报酬的非重复性决策时,效用函数和主观概率是很有用的。决策的非重复性对效用函数的使用特别重要,因为,重复性决策可以用简单预期值作为适用的评价模型。
信息要求
用效用函数和主观概率分析问题时,所要求的信息基本上与用决策树所需的一样。管理人员必须得到下列信息:
⑴各种备选方案和它们与未来可能事件的关系;
⑵每一未来事件发生时,选择每一备选方案的结果;
⑶每个事件的发生概率;
⑷决策者的效用函数近似值。
由于求主观概率的过程很费时间,所以必须通过初步分析尽量缩小决策树的规模。此外,管理人员可能愿意用简单预期值进行初步分析。对许多实际问题,从这些分析中就可以明显地得出最优方案。回想一下,太平洋石油公司的决定并未因引用效用函数值而改变。如果有两个或更多的备选方案,根据预期值模型来看,它们彼此十分“接近”的话,就需要用效用函数进行分析。
不要盲目采用定量辅助方法。如果用比较简单的方法能够同样解决问题的话,为什么还要采用需要收集昂贵信息的方法呢?管理人员对利用定量辅助方法的效益与所需信息的费用应该经常权衡比较。
结果分析
可以用分析所得的预期效用函数对各个备选方案进行排队。此外,根据效用函数还可以估出对应于备选方案预期效用值的结果值。这个值就是决策者宁可不选择备选方案而确实愿意稳拿的最小数目。还必须指出,备选方案的这个值,事实上不会出现,而备选方案的任一条件结果就是该决策的结果。
应该作出敏感性分析,以保证在估计效用函数和求出主观概率时的微小误差,不致影响决策。例如,可以用稍微更加讨厌风险的效用函数进行第二次分析。同样,可以改变主观概率的各种估计数来研究它们对备选方案优劣顺序的影响。
最后,决策者如果对自己的决策不满意,他还可以通过贝叶斯分析来修正自己的决策。
我们在上一节中经常说预期值评价模型非常有用,可以帮助我们鉴定很多决策,但现在我们却在此决策中得出了与它相矛盾的结果,你认为应如何解释这矛盾?
有兴趣的同学可以去图书馆查找一些关于风险管理的书籍。
实际上,在上一章中,我们已经接触了有关随机性决策问题,只是没有正式提出这个概念而已。例如,在天气晴雨不定的情况下,出门是否要带伞?在市场需求难于准确预测的情况下,是否应生产一定数量的某种新产品?如此等等。
所谓“公正”硬币就是指正面朝上或反面朝上的概率都相等的硬币.
假如现在给你一个大头钉,让你说出投掷后钉落地时尖头朝上的概率。你很可能从来没有做过长时间连续投掷大头钉的试验,并观察“钉尖朝上”的相对频率。而且,你可能既不了解别人从事这一试验的情况,又缺乏根据物理学定律建立预测模型所需的数据和技巧。但你现在必须作出回答。经过思考以后,假定你说:“我认为大头钉落下时,钉尖朝上的可能要比朝下大。实际上,根据我对物体下落时着地情况的了解,我会说钉尖朝上的可能为朝下的两倍左右。所以,我估计掷一次时钉尖朝上的概率约为。
假如现在给你一个大头钉,让你说出投掷后钉落地时尖头朝上的概率。你很可能从来没有做过长时间连续投掷大头钉的试验,并观察“钉尖朝上”的相对频率。而且,你可能既不了解别人从事这一试验的情况,又缺乏根据物理学定律建立预测模型所需的数据和技巧。但你现在必须作出回答。经过思考以后,假定你说:“我认为大头钉落下时,钉尖朝上的可能要比朝下大。实际上,根据我对物体下落时着地情况的了解,我会说钉尖朝上的可能为朝下的两倍左右。所以,我估计掷一次时钉尖朝上的概率约为。由于这个估计没有任何历史经验或精确分析作为根据,我们就把叫作主观概率。一般来说,在管理人员要作出的决策之中,主观概率的作用远比客观概率为大。
从这个意义看,主观概率论者不能也不应当否定实践的观点是认识论的第一和基本观点。因此,需要把主观概率和主观唯心论加以区别。