占优战略均衡
在博弈论中,占优战略均衡(Dominant Strategy Equilibrium)是指在一个策略组合中,每个参与者都选择了自己的占优策略,从而形成的均衡状态。以下是更专业的解释:
- 占优策略:对于某个参与者来说,一个策略 ( s_i ) 是占优策略,如果对于所有其他参与者的策略组合 ( s_{-i}),策略 ( s_i ) 都能带来至少与其他策略同样好的结果,且在某些情况下更好。数学上,可以表示为:
u_i(s_i, s_{-i}) \geq u_i(s_i', s_{-i}) \quad \forall s_{-i}, \forall s_i' \neq s_i
其中 ( u_i ) 是参与者 ( i ) 的效用函数。 - 占优战略均衡的形成:当每个参与者都选择了自己的占优策略时,整个博弈达到了占优战略均衡。在这个均衡中,没有参与者有动力去改变自己的策略,因为任何改变只会导致相同或更差的结果。
- 性质:占优战略均衡是纳什均衡的一种特殊形式。所有占优战略均衡都是纳什均衡,但并非所有纳什均衡都是占优战略均衡。占优战略均衡具有更强的稳健性,因为它不依赖于对其他参与者策略的假设。
重复剔除的占优均衡
(Iterated Elimination of Dominated Strategies)是博弈论中的一种分析方法
定义
- 占优策略:如前所述,一个策略被称为占优策略,如果无论其他参与者选择什么策略,该策略总是能带来至少与其他策略同样好的结果,且在某些情况下更好。
- 剔除被支配的策略:在博弈中,如果某个策略被另一个策略支配(即存在一个策略在所有情况下都表现更好),那么可以将这个被支配的策略剔除。这个过程可以反复进行,直到没有更多的被支配策略可以剔除为止。
- 重复剔除的占优均衡:经过多轮剔除后,剩下的策略组合可能形成一个均衡状态。这个均衡状态称为重复剔除的占优均衡。
过程
- 初始博弈:开始时,列出所有参与者的策略和支付矩阵。
- 第一轮剔除:识别并剔除所有被支配的策略。
- 后续轮次:在剔除后,重新评估剩余策略,继续剔除被支配的策略。
- 终止条件:当没有更多的被支配策略可以剔除时,停止过程。
- 均衡识别:最终剩下的策略组合即为可能的均衡策略。
示例
考虑一个简单的博弈,支付矩阵如下:
B1 | B2 | |
---|---|---|
A1 | 3, 2 | 0, 1 |
A2 | 1, 0 | 2, 3 |
-
第一轮剔除:
- 对于参与者 A,策略 A2 在 B1 下的支付(1)低于 A1(3),因此 A2 被支配,可以剔除。
B1 | B2 | |
---|---|---|
A1 | 3, 2 | 0, 1 |
-
第二轮剔除:
- 剩下的策略 A1 在 B2 下的支付(1)低于 B2(3),因此没有进一步的剔除。
纳什均衡
一句话道出本质:
纳什均衡的本质在于每个参与者在给定其他参与者策略的情况下,选择自己的最佳策略,从而没有人有动力单方面改变其策略 。
博弈的基本构成
- 参与者:设有 ( N ) 个参与者,记为 (P_1, P_2, \ldots, P_N )。
- 策略集合:每个参与者 ( P_i ) 有一个策略集合 (S_i ),其中 ( S_i ) 表示参与者 ( P_i ) 可选择的所有策略。
- 收益函数:每个参与者的收益函数 ( u_i ) 依赖于所有参与者的策略选择,定义为:
u_i: S_1 \times S_2 \times \ldots \times S_N \rightarrow \mathbb{R}
其中 ( u_i(s_1, s_2, \ldots, s_N)表示在策略组合 ( (s_1, s_2, \ldots, s_N) )下,参与者 ( P_i ) 的收益。
纳什均衡点的定义
一个策略组合(s_1, s_2, \ldots, s_N) 是纳什均衡,当且仅当对于每个参与者 ( P_i ) 来说,满足以下条件:
u_i(s_1^*, s_2^*, \ldots, s_i^*, \ldots, s_N^*) \geq u_i(s_1^*, s_2^*, \ldots, s_i, \ldots, s_N^*
对于所有( s_i \in S_i )。
图示表示
可以用图示来表示纳什均衡,以下是一个简单的二维博弈示例:
- 策略空间:假设有两个参与者 ( P_1 ) 和 ( P_2 ),每个参与者都有两个策略 ( A ) 和 ( B )。
- 收益矩阵:
( P_2: A ) | ( P_2: B ) | |
---|---|---|
( P_1: A ) | (2, 2) | (0, 3) |
( P_1: B ) | (3, 0) | (1, 1) |
在这个收益矩阵中,元组中的第一个数字表示 ( P_1 ) 的收益,第二个数字表示 ( P_2 ) 的收益。
纳什均衡的例子
在上述收益矩阵中,策略组合 ( (A, A) ) 和 ( (B, B) ) 都是纳什均衡:
- 在 ( (A, A) ) 中,若 ( P_1 ) 改变为 ( B ),收益变为 3,若 ( P_2 ) 改变为 ( B ),收益变为 2,因此没有参与者有动机改变策略。
- 在 ( (B, B) ) 中,若 ( P_1 ) 改变为 ( A ),收益变为 0,若 ( P_2 ) 改变为 ( A ),收益变为 1,因此同样没有参与者有动机改变策略。
欢迎来到这里!
我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。
注册 关于