Chapter 2 经典的囚徒困境
背叛还是合作的难题
“囚徒困境”是关于博弈论流传最广的一个故事,这个困境理论在哲学、伦理学、社会学、政治学,甚至生物学学科中都获得了极为广泛的应用。
关于囚徒困境的版本有很多,大概内容就是两个人面临的艰难选择,简单给大家复述一下:
一个土豪在家中被杀,家里堆放的大量现金和金银珠宝被盗,案情十分恶劣。警方接警以后火速出击,通过调查抓捕了两个小贼,并且从小贼藏匿的地点发现了大量被害人失窃的珠宝。面对确凿的证据,两个小贼拒不承认杀人越货,只说自己偷窃的时候土豪已经死了。这点道行岂能糊弄警察?警察不动声色地将一名小贼转移到了隔壁的审讯室,然后回到原来的审讯室,对留下的犯罪嫌疑人说:“不管你承不承认,反正你盗窃的罪名已经坐实了,所以就算你不认罪,我们也可以判你服刑1年。但是我可以给你一个机会,假如你承认罪行,并且检举揭发你的同伴,那么我可以只关你2个月,让你的同伴坐10年牢;同样,如果你被你的同伴检举揭发,那这10年牢狱你来坐,你的同伴2个月后就可以回家。或者,你们两个都坦白罪行,一人领5年的刑期。你考虑一下吧。”
这下两个犯罪嫌疑人都懵了,这可怎么办啊?到底是坦白从宽还是抗拒从严呢?很显然,最好的策略当然是紧咬牙关、死不认账。这样的话,两个人只需要坐1年班房就可以出去了。但是两个人被隔离审讯,也没法串供,所以问题就来了。他们各自不得不仔细考虑对方会怎么说以及自己的应对策略。
两个人面临的选择是:1.如果对方抵赖,我检举揭发,那我只需要关2个月,所以我会选择背叛;2.如果对方也背叛我,那我更要背叛对方,只有这样才能获得相对短的刑期,也就是两个人都坦白,各坐5年牢,所以我依旧要选择背叛。
通过以上两个选择,我们可以看出,在两个犯罪嫌疑人心中,背叛是最佳的选择。所以,面对相同情况的两个人最后都选择了背叛对方,结果俩人各领了5年徒刑,老老实实坐牢去了。
在这场心理博弈中,背叛属于几种策略中的支配性策略。所以,要想在这场博弈中达到某种平衡,那就只能相互出卖,各打五十大板。
两个犯人的选择以及他们最后各自面临的5年刑期,这种结果就是我们在前边说到的“纳什均衡”,也叫非合作均衡。由此我们可以看出一个悖论:两个囚徒从利己的目的出发,但是最终损人不利己。所以,我们可以得出一个结论,那就是:合作是有利的“利己策略”。
说回“囚徒困境”,这个故事之所以被称为“困境”,主要是因为这场博弈的结果都不怎么好,对于参与这场博弈的两个人来说,不管最终面临哪种结局,都不是一件好事。最终,“双输”的局面其实是他们从自身利益出发的最佳选择。
当我们面临“囚徒困境”时,最好的策略并不是规则中给出的最佳路线,而是取决于对方会采取的策略为双方的合作留有多大的余地。“囚徒困境”之下是不会有独立于对方所实施策略之外的完美策略的,纯粹的利己策略是不现实的,所以也就不存在。
“囚徒困境”是我们社会生活中许多难以抉择处境的抽象概括,涵盖广泛且具有深刻的意义。同行业之间的价格战就是典型的“囚徒困境”。所有企业都会将同行业的其他企业视作对手,多数企业只关心自身利益,而不会去考虑对方。近几年电商平台越做越红火,轰轰烈烈的价格战打得如火如荼。以淘宝和京东为例,在这场价格的博弈中,只要淘宝将京东看作对手,那么不管京东会采取哪种策略,淘宝都会认为自己实施低价策略才能占到更大的便宜。就和之前“囚徒困境”中的两个犯人一样,始终觉得自己坦白是最好的出路。而这样的思路就促使两家同时采取了低价策略。
如果各个企业公司都可以预见这种前景,想必他们都不会再继续低价策略,而是双方合作,并且抬高价格。这样一来,既可以避免价格混战,又能从中获取更大的利润。但是,这种合作往往都面临利益驱动的“囚徒困境”,所以皆大欢喜的双赢也只能是马后炮。
就像那两个困境中的囚徒一样,他们在做出选择的时候,都是选择对自己最有利的策略,而忽略掉对方的利益以及社会效益。从表面上看,似乎这种策略组合是博弈双方都认为最合适的策略。但事实上,最佳策略应该是拒不认罪。两个人都抵赖的话,每人坐一年牢就可以了,这才是双方都能获得的最大利益。但为什么两个囚徒最后都选择了愚蠢的策略呢?因为没有人会主动去修改自己的策略,用以换取更大的利益。因为这种修改调整,或许会给自己带来一些难以承受的风险。
比如,万一对方没有改变策略呢?这不是把自己坑了吗?
而这里的风险不确定性,就是囚徒的困境所在,也是我们都会面临的两难选择。说到这里,肯定有朋友想问:“如果我们在生活中碰到了囚徒困境,应该怎么办呢?这是困境还是绝境?有解吗?”不要着急,这就是我们下一节要说到的内容了。