群体博弈策略研究之一

因为上文的关系,决定重读《合作的进化》研究一下“一报还一报”策略在不同的环境下如何表现。

书中开始的做法是让各种策略两两结对相互PK,最后统计平均分。我设计了一个程序做法略有不同,我用了三个策略,每个策略创建若干实例,然后随机配对PK,最后统计它们的平均分,结果让我大吃一惊。

我用的三个策略分别是:“一报还一报”(普通人),“总是背叛”(坏人),“总是合作”(老好人)。

在 三种策略数量一样的情况下,坏人得分迅速领先,因为它们可以从背叛普通人和老好人上得到特别大的好处。当然,随着PK次数的增加,坏人被普通人识别出来以 后,得分速度开始下降,而普通人由于相互之间的合作而得分上升。不过最后仍然是坏人得分最高。老好人则不出意外地得分垫底。

所以书上后面的章节里也提到了,总是背叛的策略是最为稳定的——即使占不到便宜,它也绝不会吃亏。

为了研究不同数量的影响,我尝试了只用普通人和坏人两种策略,结论与上面基本相同,都是刚开始时坏人领先,但是到后面就很快无法再得到分,而普通人的得分速度是稳定上升。

显然“一报还一报”还是有明显的优势的。

然后我再少量地加入老好人。结果发现,只要有少量的老好人出现,坏人的得分就直线上升——如果普通人和坏人数量相同的,只要老好人的数量达到这个数量的一半,坏人得分就会达到甚至超过普通人。

这说什么?这说明你即使不愿意当一个坏人,也千万不要当一个老好人——那等于是在帮助坏人!

推特上有人说得好:

RT @小党 『通往朝鲜的路,是每一个沉默的人铺就的。』刚看到的一句话。

所以,鲁迅在《死》里说道:

……损着别人的牙眼,却反对报复,主张宽容的人,万勿和他接近。
……我也一个都不宽恕。

正解。

=====

之后的研究计划分两部分:

一是“一报还多报”+“分类报复”策略的研究——这二者合起来就是杨佳策略。而相对的,邓玉娇策略则是标准的“一报还一报”。

二是基于信息传播的博弈。书里提到的所有模型都是基于信息不分享的,我打算加入信息分享机制试试。另外,书里还提到关于偏见的测试结果,我想这个加上信息传播以后结果应该会有不同。

《群体博弈策略研究之一》有4个想法

发表评论

电子邮件地址不会被公开。 必填项已用*标注

This site uses Akismet to reduce spam. Learn how your comment data is processed.