纳什均衡

(1 min to read)

甲乙两人进行一个博弈,有A、B两种选择,而他们的组合选择会对应某种收益(双方均知道这些组合选择的后果),而每个人不知道对方如何选择,所以每个人会选择自己期望意义下有最大收益的那个(即对方选A或选B两种情况综合之下)。现在站在甲的角度去考虑,有以下几种情况:

  • 乙选A的时候我选A比B更优,乙选B的时候我选A还是比B更优,那么毫无疑问我会选择A
  • 同理可能选择B完全优于选择A

同样的,站在乙的角度也会出现这两种情况。此时另外一者能够想到对方的选择,而自己只能在这个前提下选择更优的一种当然也可能出现,某种情况下A优,某种情况下B优,这时候就涉及到一种混合策略,假设我有p的概率选择A,(1-p)的概率选择B,为了利益最大化,那么我要使得对方在选A或选B的时候自己期望得到的收益相同,即$pV(A,A) + (1-p)V(B, A) = pV(A, B) + (1-p)V(B,B)$