博弈论与经营管理
银行业员工培训教程
1
开场白:从电影“美丽心灵”谈起
2
授课目录
初晓博弈理论的概念
知识;
认识繁复纷乱的社会
现象;
分析经营管理的实践
案例;
和谐错综复杂的人际
关系;
提高思维决策的能力
水平。
3
初晓博弈理论的概念知识
著名经济学家保罗.萨
缪尔森:
要想在现代社会做
一个有文化的人,你
必须对博弈论有一个
大致了解。
保罗.萨缪尔森
4
选择
两条路在树林里分
叉,
而我选择人迹罕至
的那一条,
从此一切变了样。
5
坦白? 抵赖?
6
囚徒困境
检察官说,“由于你们的偷盗罪已有确凿的
证据,所以可以判你们一年刑期。但是,
我可以和你做个交易。如果你单独坦白杀
人的罪行,我只判你三个月的监禁,但你
的同伙要被判十年刑。如果你拒不坦白,
而被同伙检举,那么你就将被判十年刑,
他只判三个月的监禁。但是,如果你们两
人都坦白交代,那么,你们都要被判5年刑。
”
7
问题
选择有几种、结局有几种?
结局和谁有关?
如果你,如何选择?
为什么这么选择;如何考虑的?
8
问题矩阵式研究
乙
甲
坦白 抵赖
坦
白
5
5
10
3/12
抵
赖
3/12
10
1
1
9
问题
在考虑这个问题时思考问题的基础是什么?
追求个人利益的最大化
理性思考
10
博弈论的背景资料
汉语:“游戏”; game在英语的意思是人
们遵循一定规则下的活动,进行的目的是
使自己“赢”。奥林匹克运动叫Olympic
Game 。在英语中,game有竞赛的意思,进
行game是很认真的,不同于汉语游戏的概
念。在汉语中,游戏有儿戏的味道。因此,
将关于game的理论,即game theory 翻译
成博弈论或者对策论。
11
望文生义说“博弈”
“博彩” “弈秋”
12
背景
博弈论开创者为冯.
诺意曼与摩根思坦,他
们1944年出版了《博弈
论与经济行为》冯.诺
意曼是著名的数学家,
对计算机的发明做出了
巨大贡献,博弈论在冯.
诺意曼在世时还未对经
济学产生广泛影响,因
其去世未获诺贝尔经济
学奖。
13
均衡
均衡是经济学中的重要概念。
均衡即是平衡的意思,英文是:equilibrium 。
在经济学中,均衡意即相关量处于稳定值。在供
求关系中,某一商品市场如果在某一价格下,想
以此价格买此商品的人均能买到,而想卖的人均
能将商品卖出去。此时我们就说,该商品的供求
达到了均衡。此时的价格可称之为均衡价格,产
量称之均衡产量。均衡分析是经济学中的重要分析。
14
纳什均衡
在对方策略确定的情
况下,每个参与者的
策略都是最好的,此
时没有人愿意先改变
自己的策略。
15
纳什均衡通俗解释
我国研究纳什均衡的专家谢识予博士在
《纳什均衡论》中用通俗的话表达纳什均
衡含义:给定你的策略,我的策略是最好
的策略;给定我的策略,你的策略也是你
的最好的策略。这就是说:
双方在对方的策略给定的
策略下不愿意调整自己的
策略。这里的策略包括混
合策略。
16
博弈的三要素
即局中人,又称当事人、参与者等等的集
合;
策略集合;
以及每一对局中人所做的选择和赢得集合,
所谓赢得是指如果一个特定的策略关系被
选择,每一局中人所得到的效用。所有的
博弈问题都会遇到这三个要素。
17
夫妻博弈
有些博弈的纳什均衡点不止一个。如下述
“夫妻博弈”中有两个纳什均衡点。
丈夫和妻子商量晚上的活动。丈夫喜欢看
拳击,而妻子喜欢欣赏歌剧。但两人都喜
欢希望在一起过夜晚。
18
夫妻博弈矩阵式研究
丈夫
妻
子
歌剧 拳击
歌
剧
2
1
0
0
拳
击
-1
-1
1
2
19
“智猪”游戏
大猪
小猪
抢食
大猪
小
猪
主动 等待
主
动
1
5
-1
9
等
待
4
4
0
0
成本:2
9:1
7:3
6:4
20
博弈的类型
合作博弈:研究人们达成合作时如何分配合作得到的收益,
即收益分配问题。
非合作博弈:研究人们在利益相互影响的局势中如何选决
策使自己的收益最大,即策略选择问题。
完全信息不完全信息博弈:参与者对所有参与者的策略空
间及策略组合下的支付有充了解称为完全信息;反之,则
称为不完全信息。
静态博弈和动态博弈
静态博弈:指参与者同时采取行动,或者尽管有先后顺序,
但后行动者不知道先行动者的策略。
动态博弈:指双方的的行动有先后顺序并且后行动者可以
知道先行动者的策略。
21
知识和公共知识
知识是人对真的信念。
知识是人们对自然中某个事实的认识,我
们说某人拥有某种知识,意指某人知道某
个事实。
22
知识的三要素
第一,人们了解的事实对象要是真的,假
的事实不能成为知识。人们可能相信虚假
的东西,但他们不能构成相信他们的人的
知识。
第二,某个人要知道这个真的事实。
第三,人们要相信他所知道的事实。
23
公共知识的表达式
假定一个人群由A、B 两个人构成,A、B均
知道一件事实F,F是A、B 的知识,但此时
F还不是他们的公共知识。当A、B 双方均
知道F,并且他们各自都知道对方知道自己
知道知道F……此时我们说,F成了A、B间
的公共知识。
24
博弈者的公共知识
对博弈来说,“参与者是理性的”是起码
的公共知识要求。
参与者知道对方是理性的,同时知道对方
知道自己知道对方是理性的,等等。参与
者知道自己是理性的,他知道自己知道自
己是理性的……同时参与者知道对方知道
自己知道自己是理性的。
25
博弈论的理论假定
人是理性的。所谓理性的人是指行动者具
有推理能力,在具体策略选择时的目的是
使自己的利益最大化。博弈论研究的理性
的人之间任何进行策略选择的。
(狭义相对论的理论假定:物理定律在所有参考系中不变;
在所有参考系中光速保持常数)
26
帽子游戏
红色的还是白色的?
人数不限。4人为宜。
道具:帽子:红色、白色数顶。
27
帽子游戏(一)
一顶红帽子
培训师说:你们其中至少一位头戴的是红
色的帽子
第一次问:你们知道你们头戴的帽子的颜
色吗?
28
帽子游戏(二)
两顶红帽子
培训师说:你们其中至少一位头戴的是红色的帽
子
第一次问:你们知道你们头戴的帽子的颜色吗?
第二次问:你们知道你们头戴的帽子的颜色吗?
29
帽子游戏(三)
四顶红帽子
30
游戏程序
每个人可以看到其他人戴的帽子的颜色,但是看不到自己
帽子的颜色。
培训师说:你们其中至少一位头戴的是红色的帽子。
第一次问:你们知道你们头戴的帽子的颜色吗?
大家说:不知道!
第二次问:你们知道你们头戴的帽子的颜色吗?
大家说:不知道!
第三次问:你们知道你们头戴的帽子的颜色吗?
大家说:不知道!
第四次问:你们知道你们头戴的帽子的颜色吗?
大家说:知道了!
31
游戏分析
公共知识:“至少一位头戴的是红色的帽子”
当培训师第一次问时,由于每个人面对的其他3个
人都是红色的帽子,每个人当然不能肯定自己头
上的帽子是什么颜色,于是均回答“不知道”。
此时,如果只有1个人戴红色的帽子,那么这个人
因面对3个白色的帽子,他肯定知道自己的帽子颜
色。因此,当4个人均回答“不知道”时意味着
“至少二位头戴的是红色的帽子。”,而且这也
是公共知识。
依次类推。
32
认识繁复纷乱的社会现象
33
政治
加勒比海危机
撤?
留?
34
军事
华容道
大路?
小道?
35
教育
减负?
增负?
36
环境
发展?
治理?
37
生活
剧场失火
左门?
右门?
38
策略思考
“博弈论”其实就是一种策略思考,通过策略
推估,寻求自己的最大胜算或利益,从而
在竞争中获胜。
39
《艾克斯罗德游戏》
Game的规则
甲、乙小组均举红桃的,甲、乙小组各记3分;
甲小组举红桃、乙小组举黑桃的,甲小组记0分、
乙小组记5分。反之相同;
甲、乙小组均举黑桃的,甲、乙小组各记1分。
第三局开始改变记分办法,记小组分的同时,并
记大组分数。
团队的分数是所有团队成员分数的总和,分数高
的是冠军。
40
《艾克斯罗德游戏》讨论(一)
你们一开始是怎么考虑要出红/黑牌的?
第一局结束,你们比分落后/领先的情况下,
你们打算怎么出?
第二局结束,改变Game的规则时,你们是
如何研究出牌策略的,如何进行小组之间
的沟通的?
41
《艾克斯罗德游戏》讨论(二)
你们谈判主要内容是什么?达成了哪些协
议?
你们回到了小组之后,小组成员是按照你
们达成的协议出下面的牌吗?
你对这个分数满意吗?如果下一次再做,你
会怎么出牌?
42
《艾克斯罗德游戏》讨论(三)
你觉得这个游戏困难的地方在哪里?
在整个游戏过程中,你们团结吗?你们是怎
么解决意见冲突的?
在这个游戏中,你觉得信任与合作是怎样
的?与现实中的状况相比怎么样?
要想真的双赢困难吗?
43
《艾克斯罗德游戏》介绍(一)
美国科学院院士、著名的行为分析和国际
关系专家罗伯特.艾克斯罗德搞了一场关于
重复“囚犯困境”的游戏。
目的是研究无限次的对局游戏中:
人为什么要合作?
人什么时候是合作的,什么时候又是不合
作?
如何使别人与你合作?
44
《艾克斯罗德游戏》介绍(二)
在《艾克斯罗德游戏》开始之前,他设定
了两个前提:
每个人都是自私的;
没有权威干预个人决策。也就是说,个人
可以完全按照自己利益最大化的企图进行
决策。
45
《艾克斯罗德游戏》介绍(三)
艾克斯罗德位邀请了来自经济界、心理学、
社会学、政治学和数学领域的14位专家参
与这一游戏。
每个参与者每一步都要写出个体选择合作
与不合作的程序。
46
零和博弈
零和博弈概念
竞赛规则:“赢”与“输”;“1”与“—
1”;
“ 1+(—1)=0 ”
零和博弈的基本内容:游戏者有输有赢。
但整个游戏的总成绩永远为零。
47
零和博弈的代价
在社会资源稀缺的情况下,需求丰富多样的人们
总是追求自身利益最大化。
由于人的欲望是无限的,而行为能力和自然资源
又是有限的,人们创造的财富不可能无限制地满
足所有人的需要,每人都在尽可能地得到更多的
利益。
当两个或更多的人都想获得同一资源时,竞争就
发生了。人、利益团体及相互之间就你一招、我
一式地进行“零和博弈”。也称”零和游戏”。
48
分析经营管理的实践案例
49
诚信之道
当一个社会缺乏信用、蔑视契约时,是难
以建立人与人之间的互信基础的。所以从
建立对信用和契约神圣的认知,并用强制
措施加以保障。
50
诚信的选择
道德乎?
策略乎?
51
社会学家和经济学家的争辩
社会学家云:诚信是人在较低层次的需求得
到适当满足之后自然出现的一种较高层次
的需求;诚信带给人的满足感会超过逐利
带来的满足感 。
经济学家云:人们在重复博弈、反复切磋过
程中谋求长期的、稳定的物质利益的一种
策略选择。
52
诚信案例
假定A 是一名生产商,B 是一名销售商,AB 双方互
为博弈对手,会出现以下4种博弈的可能性:
双方都讲诚信,A 按约交货,B 按约付款,各得
其所,每人都得到的效用都是10;
A 诚信而B不诚信,A 交了货而B 不付款,那麽B
可以获得自己最大的利益,得15,而A 吃亏了,
得-10;
A 不诚信而B诚信,即A 收了钱而不发货,则A 的
利益实现了最大化,得15,而B 得-10;
A B 双方互不信任,也互不守信,生意泡汤了,
各自的效用都为0。
53
矩阵分析
生产方
销
售
方
诚信 不诚信
诚
信
10
10
-10
15
不
诚
信
15
-10
0
0
交
易
54
案例研讨
自身利益最大化:
对方讲诚信,自己不讲诚信
合理结果:
都不讲诚信
双赢:
都讲诚信
55
诚信缺失的案例
安然
安达信
丑闻
56
背景
安达信是全球五大会计事务所之一。它代
理着美国23000家上市公司的审计业务,占
美国上市公司总数的17%。2002年安达信却
因为假帐问题被美国国会、司法部、证券
交易委员会调查,接下来包括福特汽车、
默克制药、联邦快递、德尔塔航空公司在
内的36家大客户与安达信解除了合同。
57
共赢案利
中银消费信贷卡
58
背景
中银消费信贷记录卡是中国银行消费信贷
业务中一创新产品,是为客户提供贷款购
物且具无抵押、零首付、减免息等优点的
消费记录凭证。它依附于中国银行长城信
用卡或长城电子借记卡,由北京市商业信
息资询中心监制,北京资和信咨询公司负
责发行管理。
59
经营分析
得到 付出 基础
客户 免减息;无首付;无抵押;
信用循环;便捷
年费 诚信
银行 收益、人气 信用卡平台 诚信
商户 收益、人气 贴息 诚信
中介 收益、人气 管理 诚信
60
和谐错综复杂的人际关系
61
双赢或不交易原则
要想别人考虑你的利益,首先你要充分考
虑对方的利益,但是要记住,不要与那些
只考虑自己利益的长期交易。
62
分享或共享原则
与其另立炉灶,不如借用或共用。
一个人的力量是有限的,所以在日常的经
营管理中,经理人要善于利用外部资源,
即分享和共享原则。利用外部资源时,首
先要保证对方的利益,这是前提,然后再
考虑自己的利益,达到双赢。
63
杠杆原则
给你一个支点,去拨动整个团队。
这个杠杆原则其实就是激励原则。经理人要在团
队中建立起一套行之有效的激励体系,通过它能
奖优罚劣,多劳多得。只要建立起这套体系,团
队的执行力肯定会有一个质的提高。
64
共同进步的原则
帮助上司进步! 帮助下属进步!
65
为人处世之道
《尚书》:有容,德乃大
《论语》:己所不欲,勿施于人
《周易》 :地势坤,君子以厚德载物
《菜根谭》:天地本宽,而鄙者自隘
人云:得饶人处且饶人
弘一大师: 精明者,不使人无所容
《论语》:己欲立而立人,己欲达而达人
66
提高思维决策的能力水平
67
系统思维和双赢策略
“商场如战场”企业在商战中的恶性竞争不仅
仅损害的是企业的利益,更可怕的是往往
将一个行业做“烂”。
“双赢”是一种相互的妥协,也是一种良性的
竞争,它可以帮助我们实现共同利益的最
大化。也就是说,它可以使我们都能分到
“蛋糕”,而且可以使我们一起“把蛋糕做大”。
68
行业自律 道德约束
组织形式: 中介组织;行会;保险公司
每个博弈者建立各自的“圈子”——A与B
的生意可能只是一次性的,但是,A却要长
期与B所在“圈子”打交道,这样,通过
“圈子”,A与B的一次性博弈就转化为A与
B所在“圈子”的重复博弈。同时,“圈子
”还有另一重作用,就是传递信息,是
“双盲”博弈变成“透明”博弈,提高合
作的可能性 。
69
制度保证 政府监管
保险制度 ; 信用制度
健全法制,完善有关规章制度,让不遵守
游戏规则的投机取巧者、坑蒙拐骗者和背
信弃义者受到应有的惩罚。
法律旨在使合作利益能够顺利实现,旨在
促进繁荣,而并非为了威吓百姓。我国最
早文献《尚书.吕刑篇》曾明确地指出:典
狱非讫于威,唯讫于富。
摆脱恶性竞争,建立规则。
70
信息披露 社会监督
解决诚信也有简单的方法,那就是建立个人信用
体系,让个人的诚信记录成为共享的信息。在一
个信息化时代,这很容易做到,例如将毕业生的
信用在网上公布,将银行信用记录联网等等。信
息的共享可以将交易或交往变成无限连续的博弈
信用的机会成本。
每个博弈者建立并公开自己的信用记录——一次
失信留下的污点会被记录在案、保存下去,影响
今后一系列博弈的结果。这样就使一次性博弈变
成了长期的重复博弈中的一环。
71
企业制衡 策略思维
不要期望完全的公平。
将一项大的合作行动分为几次小的、连续
的合作。比如:贸易、谈判都要分步进行,
以促使对方采取合作态度。
增大未来的影响力:下一步的重要性;增
大合作的收益。
不要奢望做永远的赢家。
无论在竞技游戏中,还是在生存竞争中,策
略在其中有着举足轻重的影响和作用。
72
决策法则一
向前展望,倒后推理
73
决策法则二
唯一优势,首先选择
400 800
0 500
2
3
2 3
《新闻周刊》
《
时
代》
$
74
决策法则三
劣势策略,逐一剔除
3 7 15
9 8 10
拦截带球跑 拦截传球 闪击四分卫
守方的策略
攻
方
的
策
略
带球跑
传 球
75
决策法则四
别无选择,寻找均衡
1 2 3 4
1
2
3
4
《
时
代》
的
价
格
《新闻周刊》的价格
《时代》的回应
《新闻周刊》
的回应
$
76
建立良好的企业文化
供
应
商
零
售
商
社
会 员工
客户
股东
77
结束语:学点博弈论 心灵更美丽
博弈——无处不在的策略游戏;
博弈——大千世界的生存法则;
博弈——竞争社会的现代意识。
78
79