管 理 博 弈 论
课程目标
1.介绍博弈论的基本概念、方法等理论知识
。
2.侧重从管理应用视角,启发学生运用博弈
论的基本知识分析现实问题。
3.通过大量的案例,帮助学生对基本理论知
识的掌握和理解。
4.侧重课程训练,旨在促进学生形成运用课
程知识的能力。
� 管理博弈论体系框架
广
义
管
理
博
弈
论
狭义博弈论
合作博弈论
非合作博弈论
完全信息静态博弈
完全信息动态博弈
不完全信息静态博弈
不完全信息动态博弈
博弈论
(单目标)
非对称信息博弈
论
(信息经济学)
(契约设计理论)
管理激励与约束
机制设计理论
(多目标)
逆向选择模型
道德风险模型
隐蔽行动模型
隐蔽信息模型
进化博弈论(进化论+博弈论+有限理性)
量子博弈论(量子论+博弈论+实验)
博弈链理论(系统科学+组织理论+博弈论)
完全信息静态博弈
完全信息动态博弈
不完全信息静态博弈
不完全信息动态博弈
个体管理问题
公共道德问题
群体管理问题
隐蔽违规问题
合作博弈论
非合作博弈论
合作博弈论
非合作博弈论
合作博弈论
非合作博弈论
本讲主要内容
1. 1 什么是博弈论
1 .2 博弈结构和博弈的分类
1. 3 几类经典博弈模型
1. 4 博弈论历史和发展的简要评述
1. 5 博弈论在我国的应用
1. 6 训练题
什么是博弈论
� 博弈:源于游戏的一种决策思想和方法
� 博弈——源于中国的围棋游戏
� 博弈论——从思想到逻辑,从哲学到科学
围棋
︽
孙
子
兵
法
︾
空城计——《三国演义
》
� 博弈论的概念诠释
� 博弈论:也叫对策论,是研究利益冲突各方在彼此
相互作用下如何做出决策,及有关这种决策的均衡
问题的理论。
� 本质:一种决策方法。
� 目的:在既定博弈规则的
约束下求解均衡并
选择行动。
从游戏到博弈
博弈就是策略对抗,或策略有关键作用的游戏
� 博弈Game ,博弈论Game Theory ,Game 即游戏、竞
技
� 游戏和经济等决策竞争较量的共同特征:规则、结果、
策略选择,策略和利益相互依存,策略的关键作用
游戏——下棋、猜大小
经济——寡头产量决策、市场阻入、投标拍卖
政治、军事——美国和伊拉克、以色列和巴勒斯坦
一个非技术性定义
定义:博弈就是一些个人、队组或其他组织,面对一定
的环境条件,在一定的规则下,同时或先后,一次或多
次,从各自允许选择的行为或策略中进行选择并加以实
施,各自取得相应结果的过程。
四个核心方面
博弈的参加者(Player)——博弈方
各博弈方的策略(Strategies)或行动(Actions)
博弈的次序(Order)
博弈方的得益(Payoffs)
� 博弈的六要素
� 博弈的分类
� 生活中的博弈
� 情侣之战
� 讨价还价的胜算
� 大家的事情由谁管?——修路纠纷
博弈无时不在、无处不在
� 朝核六方会谈,博弈中开花结
果
博弈结构和博弈分类
博弈中的博弈方
博弈中的策略
博弈中的得益
博弈的过程
博弈的信息结构
博弈方的能力和理性
博弈的分类和博弈理论的结构
博弈中的博弈方
博弈方:独立决策、独立承担博弈结果的个
人或组织
� 博弈规则面前博弈方之间平等,不因博弈
方之间权利、地位的差异而改变
� 博弈方数量对博弈结果和分析有影响
� 根据博弈方数量分单人博弈、两人博弈、
多人博弈等。最常见的是两人博弈,单人
博弈是退化的博弈
一、单人博弈——只有一个博弈方的博弈
例一:单人迷宫
入口
A B
出口(奖金M)
A,1
B,1
右 左
右 左
M
0
0
扩展形
例二:运输路线
-7000 -16000
-10000 -10000
好天气(75%) 坏天气(25%)
自 然
商
人
水 路
陆 路
运输路线得益矩阵
0
1
-7000 -10000 -16000 -10000
运输路线扩展形
好天气
(75%)
坏天气
(25%)
单人博弈实质
个体最优化问题
二、两人博弈
� 两人博弈即有两个博弈方的博弈
� 两人博弈最常见,研究最多,是最基本和有用
的博弈类型
� 囚徒困境、猜硬币、齐威王田忌赛马等都是两
人博弈
� 两人博弈有多种可能性,博弈方的利益方向可
能一致,也可以不一致
三、多人博弈
� 三个博弈方之间的博弈
� 可能存在“破坏者”:其策略选择对自身的利益
并没有影响,但却会对其他博弈方的利益产生
很大的,有时甚至是决定性的影响。申办奥运
会是典型例子。
� 多人博弈的表示有时与两人博弈不同,需要多
个得益矩阵,或者只能用描述法
博弈中的策略
策略:博弈中各博弈方的选择内容
� 策略有定性定量、简单复杂之分
� 不同博弈方之间不仅可选策略不同,而且可
选策略数量也可不同
� 有限博弈:每个博弈方的策略数都是有限的
� 无限博弈:至少有某些博弈方的策略有无限
多个
博弈中的得益
得益:各博弈方从博弈中所获得的利益
� 得益对应博弈的结果,也就是各博弈方策
略的组合
� 得益是各博弈方追求的根本目标及行为和
判断的主要依据
� 根据得益的博弈分类:零和博弈、常和博
弈、变和博弈
� 零和博弈:也称“严格竞争博弈”。博弈方之间
利益始终对立,偏好通常不同
—猜硬币,田忌赛马,石头-剪刀-布
� 常和博弈:博弈方之间利益的总和为常数。博
弈方之间的利益是对立的且是竞争关系
—分配固定数额的奖金、利润,遗产官司
� 变和博弈:零和博弈和常和博弈以外的所有博
弈。合作利益存在,博弈效率问题的重要性。
—囚徒困境、产量博弈等
博弈的过程
博弈过程:博弈方选择、行为的次序,包括
是否多次重复选择、行为。
� 博弈过程对博弈结果也有重要影响。
� 根据博弈的过程,博弈可分为静态博弈、
动态博弈、重复博弈。
静态博弈:所有博弈方同时或可看作同时选择
策略的博弈
—田忌赛马、猜硬币
动态博弈:各博弈方的选择和行动又先后次序
且后选择、后行动的博弈方在自己选择、行
动之前可以看到其他博弈方的选择和行动
—弈棋、市场进入、领导——追随型市场
结构
重复博弈:同一个博弈反复进行所构成的博
弈,提供了实现更有效略博弈结果的新可能
—长期客户、长期合同、信誉问题
� 有限次重复博弈
� 无限次重复博弈
博弈的信息结构
� 完全信息博弈:各博弈方都完全了解所有博弈
方各种情况下的得益
� 不完全信息博弈:至少部分博弈方不完全了解
其他博弈方得益的情况的博弈,也称为“不对
称信息博弈”
� 完美信息博弈:每个轮到行为的博弈方对博弈
的进程完全了解的博弈
� 不完美信息博弈:至少某些博弈方在轮到行动
时不完全了解此前全部博弈的进程的博弈
博弈方的能力和理性
完全理性和有限理性
� 完全理性:有完美的分析判断能力和不会犯选择行为
的错误
� 有限理性:博弈方的判断选择能力有缺陷
个体理性和集体理性
� 个体理性:一个体利益最大为目标
� 集体理性:追求集体利益最大化
� 合作博弈:允许存在有约束力协议的博弈
� 非合作博弈:不允许存在有约束力协议的博弈
博弈的分类和博弈理论的结构
� 非合作博弈和合作博弈
� 非合作博弈范围内:完全理性博弈和有限理性
博弈(进化博弈)
� 静态博弈,动态博弈,重复博弈
� 完全信息静态博弈,不完全信息静态博弈,完
全且完美信息动态博弈,完全但不完美信息动
态博弈,不完全信息动态博弈
� 零和博弈和非零和博弈,单人博弈和多人博弈
几个经典博弈模型
囚徒的困境
赌胜博弈
田忌赛马
囚徒的困境
� 囚徒的困境是图克(Tucker )1950 年提
出的
� 该博弈是博弈论最经典、著名的博弈
� 该博弈本身讲的是一个法律刑侦或犯罪学
方面的问题,但可以扩展到许多经济问题
,以及各种社会问题,可以揭示市场经济
的根本缺陷
一、基本模型
-5, -5 0, -8
-8, 0 -1, -1
坦 白 不坦白
坦 白
不坦白
两个罪犯的得益矩阵
囚徒 2
囚
徒
1
囚徒1:坦白
囚徒2:坦白
二、双寡头削价竞争
100 ,100 20 ,105
150 ,20 70 ,70
高 价 低 价
高 价
低 价
寡头2
寡
头
1
双寡头的得益矩阵
政府组织协调的
必要性和重要性
寡头1:低价(70)
寡头2:低价(70)
赌胜博弈
� 赌博、竞技等构成的博弈问题,在经济中
也有许多应用,赌胜博弈也是一类重要的
博弈问题,对经济竞争和合作也有很大启
示
� 赌胜博弈的特点是一方得等于另一方失,
不可能双赢,属于“零和博弈”
齐
威
王
田
忌
田忌赛马
齐
威
王
田
忌
3,-3 1,-1 1,-1 1,-1 -1,1 1,-1
1,-1 3,-3 1,-1 1,-1 1,-1 -1,1
1,-1 -1,1 3,-3 1,-1 1,-1 1,-1
-1,1 1,-1, 1,-1 3,-3 1,-1 1,-1
1,-1 1,-1 1,-1 -1,1 3,-3 1,-1
1,-1 1,-1 -1,1 1,-1 1,-1 3,-3
上中下
上下中
中上下
中下上
下上中
下中上
上
中
下 上
下
中 中
上
下 中
下
上 下
上
中 下
中
上
田 忌
齐
威
王
得益矩阵
取胜关键:不让对方猜到自己策略,尽可能猜出对方策略
二、猜硬币博弈
-1, 1 1, -1
1, -1 -1, 1
正 面 反 面
猜硬币方
盖
硬
币
方
正 面
反 面
三、石头、剪子、布
0, 0 1, -1 -1, 1
-1, 1
1, -1
0, 0 1, -1
-1, 1 0, 0
石 头 剪 子 布
博弈方2
石 头
剪 子
布
博
弈
方
1
� 房地产价格博弈
政府导向:站在以居住需求为主的购房者一方,提高居住需求,
抑制投机需求,进而促进房地产市场的健康稳定发展
。
日期:1944 年6月6日 —1944 年8月25 日
地点:法国诺曼底
参战方:盟国(美、英、加、法、波)、纳粹德
国
盟军目标:成功实行渡海登陆计划
� 战争博弈-诺曼底登陆
博弈论历史和发展简述
博弈论的早期研究
博弈论的形成
博弈论的成长和发展
博弈论的成熟及与主流经济
学的融合
博弈论的早期研究
� 博弈论历史没有公认答案
� 对具有策略依存特点决策问题的研究可上溯
到18 世纪初甚至更早
� 博弈论真正的发展在本世纪
� 博弈论总体上仍然是发展中的学科
� 2000 年前我国古代的“齐威王田忌赛马”
� 1500 年前巴比伦犹太教法典“婚姻合同问题”等
。
� 1838 年古诺寡头模型。
� 1883 年伯特兰德寡头竞争模型。
� 1913 年齐默罗象棋博弈定理 、“逆推归纳法”
� 1921-1927 年波雷尔混合策略的第一个现代
表述,有数种策略两人博弈的极小化极大解
� 1928 年诺伊曼和摩根斯坦扩展形博弈定义,
证明有限策略两人零和博弈有确定结果
博弈论的形成
冯.诺伊曼和摩根斯坦《博弈论和经济行为》
Theory of Games and Economic Behavior
1944
� 引进扩展形(extensive form )表示和正规形
(normal form )或称策略形(strategy
form )、矩阵形(matrix form )表示
� 提出稳定集(stable sets)解概念
� 正式提出创造博弈论一般理论的主意
� 给出博弈论研究的一般框架、概念术语和表述
方法
北京理工大学现代组织管理研究中心
冯•诺伊曼和《博弈论与经济行为》
2008-3-30
博弈论的成长和发展
一、第一个研究高潮,本世纪40 年代末和50 年代初
� 1950 年纳什提出“纳什均衡”(Nash equilibrium )概
念和证明纳什定理,发展非合作博弈的基础理论。
� 1950 年Melvin Dresher 和Merrill Flood在兰德公司
(美国空军)“囚徒的困境”(Prison’s dilemma)博
弈实验,(Howard Raiffa )独立进行这个博弈实验
;
� 1952-1953 年期间(L. S. Shapley)和(D. B.
Gillies)提出“核”(Core )作为合作博弈的一般解概
念
� Shapley提出了合作博弈的“Shapley值”(Shapley
value)概念等。
� 奥曼(R. J. Aumann )“40 年代末50 年代初是博弈论
历史上令人振奋的时期,原理已经破茧而出,正在试
飞它们的双翅,活跃着一批巨人。”
� 第一次荣获诺贝尔经济学奖
纳什 海萨尼
1994 年诺贝尔经济学奖获得者
(博弈论在经济学中的应用)
泽尔滕
二、50 年代中后期一直到70 年代博弈论发展的青年期
� 1954-1955 年提出了“微分博弈”(Differential
games )的概念。
� 奥曼则在1959 年提出了“强均衡”(Strong
equilibrium)的概念。
� “重复博弈”(Repeated games )也是在50 年代末开
始研究的,这自然引出了关于重复博弈的“民间定理”
(Folk theorem )。
� 1960 年(Thomas C. Schelling )引进了“焦点”(
Focal point)的概念。
� 博弈论在进化生物学(Evolutionary Biology)中的
公开应用也是在60 年代初出现的。
� 塞尔腾(Selten)1965 提出“子博弈完美纳什均衡
”(subgame perfect Nash equilibrium)
� 1975 年提出的“颤抖手均衡”(Trembling hand
perfect equilibrium)
� 海萨尼(Harsanyi )1967-1968 三篇构造不完全信息
博弈理论的系列论文,“贝叶斯纳什均衡”(Bayesian
Nash equilibrium )。
� 海萨尼1973 年提出关于“混合策略”的不完全信息解
释,以及“严格纳什均衡”(Strict Nash equilibrium)
。
� 70 年代“进化博弈论”(Evolutionary game theory
)的重要发展,(John Maynard Smith )1972 年
引进“进化稳定策略”( Evolutionarily stable
strategy,ESS)等。
� “共同知识”(Common knowledge )的重要性,因
为奥曼1976 年的文章引起广泛的重视。
三、40 年代末到70 年代末是博弈论发展的重要阶段
� 这个时期博弈理论仍然没有成熟,理论体系还比较乱
,概念和分析方法很不统一,在经济学中的作用和影
响还比较有限,但这个时期博弈论研究的繁荣和进展
却是非常显著的。
� 对这一阶段博弈论研究的迅速发展,除了理论发展自
身规律的作用以外,全球政治、军事、经济特定环境
条件的影响(战争和冷战时期的军事对抗和威慑策略
研究的需要,经济竞争、国际经济竞争的加剧),以
及经济学理论发展本身的需要等,都起了重要的作用
。正是因为有了这一阶段博弈论研究的繁荣发展,才
有80 、90 年代博弈论的成熟和对经济学的博弈论革命
。
博弈论的成熟及与主流经济学的融
合
一、80 、90 年代是博弈论走向成熟的时期
� 1981 (Elon Kohlberg) “顺推归纳法”(Forward
induction)
� 克瑞泼斯(David M. kreps )和威尔孙(Robert
Wilson)1982 年提出“序列均衡”(Sequential
equilibria)
� 1982 年斯密(John Maynard Smith )出版了《进化和
博弈论》(<Evolution and the theory of games>
)
� 1984 年由伯恩海姆(B. D. Bernheim)和皮尔斯(D.
G. Pearce)提出“可理性化性”(Rationalizability)
� 海萨尼和塞尔腾1988 年提出了在非合作和合作博弈中
均衡选择的一般理论和标准,
� 1991 年弗得伯格(D. Fudenberg )和泰勒尔(J.
Tirole)首先提出了“完美贝叶斯均衡”(Perfext
Bayesian equilibrium)的概念
二、博弈论和经济学诺贝尔奖
� 1994 :非合作博弈:纳什(Nash )、海萨尼(
Harsanyi)、塞尔顿(Selten)
� 1996 :不对称信息激励理论:莫里斯(Mirrlees)
和维克瑞(Vickrey)
� 2001 :不完全信息市场博弈:阿克罗夫(Akerlof)
(商品市场)、斯潘塞(Spence )(教育市场)、
斯蒂格里兹(Stiglitze)(保险市场)
� 2002 :实验经济学:史密斯(Smith ),心理经济
学:卡尼曼(Kahneman )
� 第二次荣获诺贝尔经济学奖
1996 年诺贝尔经济学获得者
(不对称信息条件下的“经济激励理论”)
维克
里
米尔利斯
2001 年诺贝尔经济学获得者(充满不对称信息市场的分析 )
阿克尔洛
夫
斯彭斯 斯蒂格利
茨
� 第三次荣获诺贝尔经济学奖
� 第四次荣获诺贝尔经济学奖
2005 年诺贝尔经济学获得者
(通过博弈论对冲突和合作领域进行分析)
罗伯特•奥曼 托马斯•谢林
� 第五次荣获诺贝尔经济学奖
2007 年诺贝尔经济学奖获得者 (机制设计理论)
博弈论的应用
� 企业经营者的决策思路和工具。
� 政府的政策和管理思路,与个人、企业和地
方博弈的意识。
� 社会经济问题的理论分析工具,解释经济中
许多低效率现象的根源,找出各种经济问题
的制度性、环境性原因,揭示各种经济行为
和政策的效率意义等。
博弈论助我们走向未来
� 博弈论的理论价值
� 经济学领域中的应用
� 管理学领域中应用
� 博弈论的美中不足
� 完全理性假设
� 信息的不确定性
� 数学模型难以抽象
� 博弈论的实践意义
� 认清实质,究其根本
� 理性决策,加大胜率
小 结
起源与发展
博弈起源-围棋
萌芽-产生-发展-繁荣与成熟
思想到方法,哲学到科学
博弈世界
博弈体现在生活、经济、军事、政治、国际
关系等诸多方面,我们生活在博弈世界里
博弈论点评
博弈论的实践意义
博弈论的美中不足
博弈论的理论价值
初识博弈论
博弈论的概念、实质和目的
博弈的六个要素 、博弈的分类
课堂训练——别人的红包更诱人
� 故事模型1
话说一地主家有两个长工——张三和李四。转眼到了
年关,地主给了张三、李四每人一个红包。两个人都
看到自己红包里装的是1000 元钱,但不知道对方红
包里装的是多少。这时地主发话了:“你们拿的红包里
,每个红包的钱可能是以下两个数字之一:1000 元
和3000 元。现在你们如果愿意跟对方换红包的话,
可以由我来公证,但你们每人要支付100 元公证费给
我。”
问题:故事的结果是怎样的,请用分析博弈过程与结果
。
作业题——诸葛亮三分天下的智慧
� 故事模型2
� 三国时代火烧赤壁一战,孙刘联军打败曹操
,曹操北逃。诸葛亮在曹操归逃的路上布下
三重防范:前有赵云,中有张飞,后有关羽
。然而诸葛亮的军令要求赵云和张飞的主要
任务是防火骚扰,真正捉曹的任务落在关羽
的身上。后来在华容道上,关羽念旧情放走
了曹操。
� 问题:应用博弈论原理分析神机妙算的诸葛
亮为什么间接放走曹操?