完全信息静态博弈

占优战略均衡

在博弈论中,占优战略均衡(Dominant Strategy Equilibrium)是指在一个策略组合中,每个参与者都选择了自己的占优策略,从而形成的均衡状态。以下是更专业的解释:

  1. 占优策略:对于某个参与者来说,一个策略 ( s_i ) 是占优策略,如果对于所有其他参与者的策略组合 ( s_{-i}),策略 ( s_i ) 都能带来至少与其他策略同样好的结果,且在某些情况下更好。数学上,可以表示为:
    u_i(s_i, s_{-i}) \geq u_i(s_i', s_{-i}) \quad \forall s_{-i}, \forall s_i' \neq s_i
    其中 ( u_i ) 是参与者 ( i ) 的效用函数。
  2. 占优战略均衡的形成当每个参与者都选择了自己的占优策略时,整个博弈达到了占优战略均衡。在这个均衡中,没有参与者有动力去改变自己的策略,因为任何改变只会导致相同或更差的结果。
  3. 性质:占优战略均衡是纳什均衡的一种特殊形式。所有占优战略均衡都是纳什均衡,但并非所有纳什均衡都是占优战略均衡。占优战略均衡具有更强的稳健性,因为它不依赖于对其他参与者策略的假设。

重复剔除的占优均衡

(Iterated Elimination of Dominated Strategies)是博弈论中的一种分析方法

定义

  1. 占优策略:如前所述,一个策略被称为占优策略,如果无论其他参与者选择什么策略,该策略总是能带来至少与其他策略同样好的结果,且在某些情况下更好。
  2. 剔除被支配的策略:在博弈中,如果某个策略被另一个策略支配(即存在一个策略在所有情况下都表现更好),那么可以将这个被支配的策略剔除。这个过程可以反复进行,直到没有更多的被支配策略可以剔除为止。
  3. 重复剔除的占优均衡:经过多轮剔除后,剩下的策略组合可能形成一个均衡状态。这个均衡状态称为重复剔除的占优均衡。

过程

  1. 初始博弈:开始时,列出所有参与者的策略和支付矩阵。
  2. 第一轮剔除:识别并剔除所有被支配的策略。
  3. 后续轮次:在剔除后,重新评估剩余策略,继续剔除被支配的策略。
  4. 终止条件:当没有更多的被支配策略可以剔除时,停止过程。
  5. 均衡识别:最终剩下的策略组合即为可能的均衡策略。

示例

考虑一个简单的博弈,支付矩阵如下:

B1 B2
A1 3, 2 0, 1
A2 1, 0 2, 3
  • 第一轮剔除

    • 对于参与者 A,策略 A2 在 B1 下的支付(1)低于 A1(3),因此 A2 被支配,可以剔除。
B1 B2
A1 3, 2 0, 1
  • 第二轮剔除

    • 剩下的策略 A1 在 B2 下的支付(1)低于 B2(3),因此没有进一步的剔除。

纳什均衡

一句话道出本质:

纳什均衡的本质在于每个参与者在给定其他参与者策略的情况下,选择自己的最佳策略,从而没有人有动力单方面改变其策略

博弈的基本构成

  1. 参与者:设有 ( N ) 个参与者,记为 (P_1, P_2, \ldots, P_N )。
  2. 策略集合:每个参与者 ( P_i ) 有一个策略集合 (S_i ),其中 ( S_i ) 表示参与者 ( P_i ) 可选择的所有策略。
  3. 收益函数:每个参与者的收益函数 ( u_i ) 依赖于所有参与者的策略选择,定义为:
    u_i: S_1 \times S_2 \times \ldots \times S_N \rightarrow \mathbb{R}
    其中 ( u_i(s_1, s_2, \ldots, s_N)​表示在策略组合 ( (s_1, s_2, \ldots, s_N) )下,参与者 ( P_i ) 的收益。

纳什均衡点的定义

一个策略组合(s_1, s_2, \ldots, s_N) 是纳什均衡,当且仅当对于每个参与者 ( P_i ) 来说,满足以下条件:
u_i(s_1^*, s_2^*, \ldots, s_i^*, \ldots, s_N^*) \geq u_i(s_1^*, s_2^*, \ldots, s_i, \ldots, s_N^*
对于所有( s_i \in S_i )

图示表示

可以用图示来表示纳什均衡,以下是一个简单的二维博弈示例:

  • 策略空间:假设有两个参与者 ( P_1 ) 和 ( P_2 ),每个参与者都有两个策略 ( A ) 和 ( B )。
  • 收益矩阵
( P_2: A ) ( P_2: B )
( P_1: A ) (2, 2) (0, 3)
( P_1: B ) (3, 0) (1, 1)

在这个收益矩阵中,元组中的第一个数字表示 ( P_1 ) 的收益,第二个数字表示 ( P_2 ) 的收益。

纳什均衡的例子

在上述收益矩阵中,策略组合 ( (A, A) ) 和 ( (B, B) ) 都是纳什均衡:

  • 在 ( (A, A) ) 中,若 ( P_1 ) 改变为 ( B ),收益变为 3,若 ( P_2 ) 改变为 ( B ),收益变为 2,因此没有参与者有动机改变策略。
  • 在 ( (B, B) ) 中,若 ( P_1 ) 改变为 ( A ),收益变为 0,若 ( P_2 ) 改变为 ( A ),收益变为 1,因此同样没有参与者有动机改变策略。
  • 算法
    426 引用 • 254 回帖 • 24 关注

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...