也许大家都玩过
斗地主,但是玩过
斗地主的人知道自己是在博弈吗?为什么我们要选择叫牌,为什么我们要抢地主,这其实是一种动态性博弈,那么我们来看一下什么是动态性博弈。
在动态博弈中,行动有先后次序,后行动者可以通过观察先行动者的行动获得有关后者的偏好、策略空间等方面的信息,修正自己的判断,正如日常生活中通过观察某人的行为表现来了解其品德一样。自然先行动者知道自己的行为有传递自己特征信息的作用,就会有愈识地选择某种行动来张扬或掩饰自己的真实面目(如好人总想让别人知道自己是好人,坏人则总是设法隐瞒自己是坏人)。当然,在均衡状态下,理性人是不会被愚弄的。
精炼贝叶斯均衡的要点在于当事人要根据所观察到的他人的行为来修正自己有关后者类型的信念《即主观
概率),并据此选择自已的行动。这里,修正的过程使用的是贝叶斯规则。这一点意味着,每个局中人都假定其他局中人选择的是均衡策略。具体来讲,精炼贝叶斯均衡是所有局中人策略和信念的一种结合,它满足如下条件:
(1)给定每个人有关其他人类型信念的情况下,他的策略选择是最优的。
(2)每个人有关他人类型的信念都是使用贝叶斯法则从所观察到的行为中获得的.
用数学的语言来说,精炼贝叶斯均衡是个均衡点。应该强调的是,与其他均衡概念不同,精炼贝叶斯均衡不能仅定义在策略组合上,它必须同时说明局中人的信念,因为最优策略是相对于信念而言的。
来源:网上现金棋牌游戏平台