群体博弈策略研究之二

这一次的研究增加了一个策略,叫做“一报还六报”——即一旦被对方背叛一次则要报复六次。

但是如果这个策略的对手只有“一报还一报” 和“总是背叛”的话,结果只能是这个策略与“一报还一报”是一样的——它与“一报还一报”保持合作,与“总是背叛”只合作一次,以后总是背叛。所以还要加 上“分类报复”——对所有的人进行分类,对于来自某个人的背叛报复到所有同类人中去。

按随机两分类试验的结果不出所料:

“一报还一报”的得分与原来相当或略低(因为被随机归入坏人类而被“一报还六报”所背叛),“总是背叛”得分比原来略高(源于“一报还六报”首次合作的贡献),而“一报还六报”的得分比“一报还一报”略低10%左右。

看上去也不坏嘛。

但是相比之下,如果把新增的“一报还六报”换成标准“一报还一报”策略的话,它们的得分可以提高约50%,而坏人的得分却基本没有变化!

再把前面的测试中“一报还一报”换成“总是合作“的老好人。结果是坏人和”一报还六报“的得分都大幅提高,但是老好人却被它们联合吃死光了——得分为负数!

同样的情况下老好人、坏人和“一报还一报”的结果虽然是坏人能有略高一些的得分,“一报还一报”的得分比“一报还六报”略低,但是老好人却在“一报还一报”的帮助下得到相当于“一报还一报”60%的得分成绩。

虽然这个测试算是比较粗糙的——因为没有考虑分类与策略的相关性,虽然不能说同类人就一定是用同一策略,但是毕竟有很大的相关性,随机分类的方式会有一定的结果偏差。

不过结论仍然是明显的:

分类加倍报复对于坏人来说基本没有明显的损失,但是对于其它普通人来说,却带来了三分之一的损失,对于与自己采用同样策略的人则会带来超过三分之一的损失——即使加上相关性分类,也只是使得这种有所减少,但结论还是一样:不能明显增加对坏人的伤害,却对自己人误伤过多。

如果加上老好人的话就更不妙了,它们将面对坏人和分类报复的双重打击。

这就是我为什么反对杨佳式反抗,而支持邓玉娇式反抗的科学依据。

群体博弈策略研究之一

因为上文的关系,决定重读《合作的进化》研究一下“一报还一报”策略在不同的环境下如何表现。

书中开始的做法是让各种策略两两结对相互PK,最后统计平均分。我设计了一个程序做法略有不同,我用了三个策略,每个策略创建若干实例,然后随机配对PK,最后统计它们的平均分,结果让我大吃一惊。

我用的三个策略分别是:“一报还一报”(普通人),“总是背叛”(坏人),“总是合作”(老好人)。

在 三种策略数量一样的情况下,坏人得分迅速领先,因为它们可以从背叛普通人和老好人上得到特别大的好处。当然,随着PK次数的增加,坏人被普通人识别出来以 后,得分速度开始下降,而普通人由于相互之间的合作而得分上升。不过最后仍然是坏人得分最高。老好人则不出意外地得分垫底。

所以书上后面的章节里也提到了,总是背叛的策略是最为稳定的——即使占不到便宜,它也绝不会吃亏。

为了研究不同数量的影响,我尝试了只用普通人和坏人两种策略,结论与上面基本相同,都是刚开始时坏人领先,但是到后面就很快无法再得到分,而普通人的得分速度是稳定上升。

显然“一报还一报”还是有明显的优势的。

然后我再少量地加入老好人。结果发现,只要有少量的老好人出现,坏人的得分就直线上升——如果普通人和坏人数量相同的,只要老好人的数量达到这个数量的一半,坏人得分就会达到甚至超过普通人。

这说什么?这说明你即使不愿意当一个坏人,也千万不要当一个老好人——那等于是在帮助坏人!

推特上有人说得好:

RT @小党 『通往朝鲜的路,是每一个沉默的人铺就的。』刚看到的一句话。

所以,鲁迅在《死》里说道:

……损着别人的牙眼,却反对报复,主张宽容的人,万勿和他接近。
……我也一个都不宽恕。

正解。

=====

之后的研究计划分两部分:

一是“一报还多报”+“分类报复”策略的研究——这二者合起来就是杨佳策略。而相对的,邓玉娇策略则是标准的“一报还一报”。

二是基于信息传播的博弈。书里提到的所有模型都是基于信息不分享的,我打算加入信息分享机制试试。另外,书里还提到关于偏见的测试结果,我想这个加上信息传播以后结果应该会有不同。

不平静的长眠者

(旧文:11月26日)

杨佳已经被执行一周年了,这几天很多人在谈这事。而让我想到的是Emily Brontë在小说《Wuthering Heights》里的最后一句话:

…how anyone could ever imagine unquiet slumbers for the sleepers in that quiet earth.

其实相比一年前(之一之二之三),我的看法已经有所改变,特别是几个月前在陆家嘴派出所碰的壁,让我可以想象杨佳可能曾经有过的遭遇。

当然,主要的观点还是没有变化。这其中包括:反对将他人分类,并把对其中部分人的报复扩大到整类人;反对将杨佳英雄化,将他的行为正义化;尊重每一个个体的人权。

第一点的反对所谓人以群分,参考长平在今年网志年会上的发言:只要我们心里还在把别人分为东德人、西德人,我们心里的柏林墙就还没有倒掉。

第二点是有科学依据的——其实我还是相信科学的,所以即使不谈什么社会达尔文主义丛林法则之类,我还是愿意群体博弈论的研究结论:一报还一报是维持社会稳定的最佳策略。

基 于这一点,我赞同杨佳的报复。我反对的是他把自己对加害于他的几个警察的怨念加诸全体警察,杀死了对他来说本是无辜的那几个人——也许他们对于别人是有辜 的,但是他们对于杨佳并非加害者,而杨佳也不是正义的化身末日的法官,并无权剥夺他们的生命。即便说闸北区公安局是那个加害杨佳的派出所的上级单位,我也 反对这种报复——正如你被人打伤也不能因此把别人老妈打一顿出气一样。

所以,这是一报还一报原则的第一条:报复必须是针对之前加害者,而不是他人。

在这一点上,邓玉娇的做法是符合这一原则的——被杀的邓贵大显然是加害人之一。

其次,无论之前杨佳受过那个派出所多么非人的待遇,也不至于需要用六条人命来回报。倒是那个JessicaMM的遭遇(她妈妈之死与拆迁争议可能有关)需要有关方面还她们家一条人命。还有潘蓉一家虽然不需要人命来还,但钱是少不了……

这是一报还一报原则的第二条:仅限一报,即报复程度不超过加害程度。

这一点邓玉娇同样做得对——按照刑法第20条,反抗强奸致嫌疑人死亡属于正当防卫的范畴。

从这两点来看,杨佳的行为都不能算是一次合格的一报还一报行为,即便是为自己讨说法,这也是超出必要程度的,更不用谈刑法了。这里没有正义——反抗非正义的并不一定就是正义,更不用说英雄了。

之所以强调这两点,因为如果不如此,反而放纵甚至强调报复的转移化和扩大化,那么结果只会造成社会底层受害的人们互相伤害,而真正的加害者高高在上,安然无恙。

至于个体的人权问题。今天的推土有人发了一推:小区里抓到一个偷车贼,众人高喊打死他,此人喊“尊重人权”,被众人哄笑……

对于这个案子,我特别支持的就是对此案审判过程的质疑——虽然最终的结果应该是一样的,但是过程的非正义并不能给受害者带来正义,更不能给杨佳一个公道。此外,他们还欠杨佳的母亲王静梅一个说法。这样的审判只是让某些也需要被审判的人得以逃脱。

一年过去了,在平静和谐的表面之下,六名被害的死者、一名被执行的杨佳、还有那个可能已经被体制所淘汰的伤者,却依然不得安宁。

之所以会这样,只因为现在这个社会的环境比一年前更加坏了。

在四川无数的家长那里,某些人欠着他们数千条人命。在全国无数的结石宝宝家长那里,某些人欠着他们数以万计的孩子的生命和健康。除了一报还一报,我想不到还有什么能够补偿他们。

如 果真的有传说中的新中国,我希望首先成立的就是宪法人权法庭,那些违反宪法侵犯人权的家伙必须付出代价。即使他们逃到地球的任何角落,都要把他们追捕回来 接受人民的审判,让他们享受以色列人民对待纳粹的待遇。那些太子们即使没有直接伤害过人民,也需要追回那些被侵占的人民财富。至于助纣为虐的GFW制造者 们,恭喜你们,监狱里也给你们预留了位子——虽然你们还不够资格坐头等舱。

虽然精英们提出过可行的和平政改路线,其中包括新老划段,放弃对 历史罪行的追究来换取他们的让步。但是,我想精英们似乎是有点naive了,在没有看到末日之前,他们不可能放弃既得的利益进行政改的。即使如精英们所以 预计的,强硬的追究可能将他们逼上专制到底的绝路。然而在他们看来,两条路不过是“等死”与“找死”的区别。所以我是不赞同精英们这个天真的想法。更何况 你们也没有权力代表人民做出这样的决定,真有那么一天,这个决定最终还是要按民主法制的方法来处理。

然而我们暂时还看不到传说现身,那么仅有的就只是一报还一报了。

某些暂时活着的家伙既然不能让长眠者得到安宁,那么唯有让他们活着也不得安宁。

=====

另,最近在根据《合作的进化》一书中关于群体博弈的理论验证一些想法,以研究在更复杂环境中一报还一报的策略的结果。