jessiezhang LV
发表于 昨天 13:56
Minimax theorem(极小极大定理)是博弈论中的一个重要定理 。
从直观上理解,在二人零和博弈(即一方的收益等于另一方的损失的博弈场景)中 ,每个参与者都试图最小化对手的最大收益 ,同时最大化自己的最小收益 。
该定理表明:在这样的博弈中,存在一个鞍点(saddle point),这个点对应的策略组合使得对于参与者A来说,无论参与者B采取什么策略 ,A采用该策略都能保证自己获得的收益至少是某个值;对于参与者B来说,无论参与者A采取什么策略 ,B采用相应策略都能保证自己的损失最多是某个值 。也就是说 ,存在一组最优策略 ,使得双方的策略达到一种平衡 ,在这种平衡下,双方都没有动机单方面改变自己的策略 。
从数学形式上 ,假设有一个二人零和博弈,收益矩阵为 (A) ,行玩家的策略集合为 (X) ,列玩家的策略集合为 (Y) ,行玩家的收益函数为 (u(x,y)) ( (xin X,yin Y) ),极小极大定理可以表述为 (max_{xin X}min_{yin Y}u(x,y)=min_{yin Y}max_{xin X}u(x,y)) 。等式左边表示行玩家先选择策略 (x) ,然后列玩家根据 (x) 选择策略 (y) 时行玩家能获得的最大最小收益;等式右边表示列玩家先选择策略 (y) ,然后行玩家根据 (y) 选择策略 (x) 时列玩家能保证的最小最大损失 ,二者相等 。
这个定理为分析和求解二人零和博弈提供了理论基础 ,帮助确定博弈中的最优策略和均衡状态 。 |
|