博弈论 | GameTheory ¶
约 2819 个字 预计阅读时间 11 分钟
分类 ¶
- 局中人是否允许合作:非合作博弈、合作博弈
- 策略的数目:有限策略博弈 - 无限策略博弈
- 策略选择是否具有概率随机性:纯策略博弈、混合策略博弈
- 策略与时间的关系:静态博弈、动态博弈
- 参与人对问题信息结构的了解程度:完全信息博弈、不完全信息博弈
- 数学模型:矩阵博弈、连续博弈、微分博弈、阵地博弈、凸博弈、随机博弈
问题与基本概念 ¶
局中人 (Players)
策略集(Strategies): 完整性、多样性、不可观察性
赢得函数 / 支付函数 (Payoff function)
信息 (infomation)
action:variable
outcome equilibrium: 均衡 , 所有参与者最优策略组合 rules:players,action&outcome
- 矩阵博弈:研究有限零和博弈的最优策略。
- 理性博弈原则:决策主体追求自身利益最大化。
- 最优策略对极大极小值和极小极大值:通过求解极大极小值和极小极大值来找到最优策略。
- 纳什均衡解的意义:研究解的可能性,包括单个解、多个解或无纯策略解等情况
在众多对策模型中,占有重要地位的是二人有限零和对策,即在对策只有两个局中人,各自的策略集只含有限个策略,每局中两个局中人的得失总和为零(即一个局中人的赢得恰为另一个局中人所输掉的值矩阵对策
。
矩阵——纯策略博弈 ¶
博弈模型
- 局中人
- 策略集
- 局中人
的赢得矩阵:
- 局中人
的赢得矩阵:
共许原则 ¶
双方均无改变策略的意愿
自身利益最大化原则 ¶
自身的赢得值尽可能大
- 问题:不确定对方决策情况下的最优决策
- 准则:从最坏的预期中选则最好的(悲观准则)一种保守而贪心的准则 “做最坏的打算,争取最好的结果”
局中人
最大预期赢得(赢得指自身最小收益) 极大极小值:
局中人
最小预期损失(损失指对手最大收益) 极小极大值:
极大极小值与极小极大值
证明:对于
故
均衡解 ¶
矩阵鞍点
鞍点指的是矩阵中的一个元素,它是所在行的最大值,并且是所在列的最小值
判断鞍点的一个充分条件是:函数在一阶导数为零处(驻点)的黑塞矩阵为不定矩阵。
如果存在
则
矩阵博弈最优纯策略对存在的充要条件是存在鞍点
非常强的条件 证明:
1、必要性
2、充分性
鞍点解的博弈解释:没有一方愿意单方面改变策略,因为单方面改变策略均无法改善自身的赢得值,更多情况下反有损害
性质 ¶
1、无差别性
若
则
2、可交换性
若
矩阵——混合策略博弈 ¶
模型 ¶
混合策略集
局中人
局中人
- 混合策略的取值在多次博弈中可看作概率,一次博弈中可看作偏好。
- 混合策略集是无穷集合,纯策略是混合策略的特例。
- 分析问题时,首先考虑纯策略博弈,当纯策略解不存在时,就考虑混合策略博弈。因此混合策略博弈也可以用
表示。
理性决策
- 局中人
的最大预期赢得: - 局中人
的最小预期损失:
两者关系:
- 混合策略
- 混合局势
均衡解 ¶
- 最优混合策略对
- 最优混合策略存在的充要条件:存在鞍点
- 平衡局势
定理:一定存在混合策略意义下的矩阵博弈均衡解
证明思路:鞍点条件一定有解。
均衡解的性质 ¶
对称博弈性质 ¶
如果博弈问题具有如下对称性:
石头剪刀布问题
解集不变性 ¶
- 赢得矩阵严格单调变换下的解集不变性
博弈 :
- 解集
: 博弈 的均衡解集合。
证明:上述变换只改变了赢得矩阵元素的数值,不改变相对大小关系。
互补松弛性 ¶
如果某条纯策略可能被选择,则该纯策略下对手的最优混合策略下的赢得值必为
如果某条纯策略下对手的最优混合策略的赢得值比
矩阵——均衡解的求解 ¶
互补松弛性定理 ¶
对偶理论 ¶
线性规划解 ¶
双矩阵 ¶
(二人有限非零和博弈)
模型 ¶
- 局中人 I、II
- 策略集
- 局中人 I 的赢得矩阵
- 局中人 II 的赢得矩阵
纯策略 Nash 均衡 ¶
满足以下条件的策略对
没有一个局中人愿意单方面改变策略
例子:囚徒困境——占优策略 Nash 均衡
混合策略 Nash 均衡 ¶
- 赢得函数
- Nash 混合策略均衡点
满足以下条件的策略对
如果纯策略均衡解存在,也是混合策略的均衡解。
Pareto 最优 ¶
允许合作下的博弈问题为多目标优化问题 :
- 目标 1:
- 目标 2:
- Pareto 最优解
: 不存在超优 的策略对。
且至少有一个不等式严格成立。
纯策略 Nash 均衡解
III | 坦白 | 抗拒 |
---|---|---|
坦白 | (-9,-9) Nash 均衡 | (0,-15) |
抗拒 | (-15,0) | (-1,-1)Pareto 最优解 |
严格意义下的解:满足可交换性和无差别性的 Pareto 最优均衡解
Nash 均衡解的充要条件
- 定理 :
是 的 Nash 均衡解的充要条件为 :