自由意志跪于规则前:比特币的博弈论软件观
作者:媒体转发 时间:2018-08-16 09:31
比特币的共识问题使用了博弈论的研究,这一点有些人知道有些人不知道。但是博弈论到底给比特币这样新诞生的软件带来了什么,可能很多人都不清楚。博弈论的应用和Proof of Work的实施,无疑是非常天才的一个做法。
说到博弈论,很多人多少都知道一点,还有人从美丽心灵里知道纳什的故事。但是博弈论到底是什么呢?
博弈论,英文叫做Game Theory,是20世纪经济学最伟大的成果之一。它研究在一个两个或者多个个体参与的群体博弈行为中斗争各方是否存在着最合理的行为方案,以及如何找到这个合理的行为方案的数学理论和方法。一般博弈论从囚徒困境和选举游戏开始讲起。

囚徒困境
我们一般学习博弈论的时候都听说过囚徒困境。这里是诸多囚徒困境版本里的一个:有嫌疑犯A,B两个人,因为偷银行被抓起来,单独隔离审查。囚犯互相无法交流。警察给与嫌疑犯招或者不招的选择。
选择的结果如果A,B同时招供,各判刑10年。如果一方招供另外一方不招供,则招供一方无罪释放并且获得巨额奖金。不招供一方枪毙之。如果双方都不招供,双方无罪释放。
这个故事里各种奖励处罚可以调节。常用策略是,无论是A或者B分析如下。如果对方选择招供,那么自己招供的时候判刑10年,不招供的时候枪毙,招供好。如果对方选择不招供,那么自己招供可以无罪释放还拿奖金,自己不招供仅仅无罪释放。所以选择还是招供更好。总的来说,招供比不招供好。
但是两个人如果都这样选择了之后,结果就是各判刑10年。但是如果两个人都选择不招供,双方都会无罪释放。可以想象,这样的设定,按照聪明人做出来的选择,正好满足了警察设定规则的初衷,坏人统统入狱。
从某种角度来看,这既反映了规则设定者的强大,又说明在公共环境下,Trust是多么宝贵的财富。
选举游戏
这里我们讲另外一个非常著名的群体博弈论的例子。假设现在有若干个人,大家一起玩选举游戏。这里的选举不是选某个人干什么,而是大家先上交100块钱进一个奖金池。然后每个人可以自由的从1到100里选一个数字出来。没有人知道别人选了什么。数字可以随便选,可以重复。
等大家都选好了数字之后,我们对这些数字求个平均值。最接近平均值2/3的那个人拿走所有的奖金。如果若干个人平局,就平分奖金。只要这些参与游戏的人都是非常非常聪明的人,这个游戏的最终结果是大家都选1。
理由并不复杂。假设大家都选100的话,那么平均值的2/3小于67,所以任何选了67以上的人机会就不大了。所以聪明人想一想,都不应该选67以上的数字。以此一遍遍自己脑子里类推下去,最终聪明人都会得出自己必须选1的结论。
比特币的共识问题
在这两个例子里,都有一个特点。如果系统本身是聪明的,追逐自己利益最大化的,那么一旦系统的制定者设置好了规则之后,整个系统就不以人的意志为转移的向着某个方向收敛。
比特币的共识问题简单来说就是比特币的账本得到整个比特币网络的确定。它的做法是通过挖矿来实现的。所谓挖矿,学名叫做Proof of Work。其实不是新鲜东西。
简单来说,比特币网络里面的每个节点都可以打包交易记录,成为新区块。但是一个新区块要被整个比特币网络接受,需要大抱的节点解一个很难的数学题。这个数学题在比特币里面是对新区块的头做SHA256密码级别的哈希两次。符合要求的解必须是哈希值前面若干位为0。
熟悉SHA256的人知道这个东西很难做,又没捷径只能硬拼算力。但是这些愿意拼算力的节点都是好节点,努力的做好事,由于它们的努力解题勤奋打包,保证了整个比特币网络的稳定。
共识问题中的博弈论
那么为什么这些节点都自愿的做雷锋烧电打包挖矿呢?其最主要的原因是做好人好事在比特币系统里面给与奖励,奖励一开始是50比特币,每隔4年下降一半。我们现在在第三个4年里,现在做好人打包就只有12.5个比特币了。
大家好像还是没有看出来这里面的博弈论到底在哪里。和囚徒困境以及选举游戏比起来,这个地方的博弈论不明显。我们需要展开说一下。
在比特币系统里,如果51%的节点是好人的话,这个系统就是安全的,因为坏人无法篡改账本。因为比特币是一个互联网上的P2P系统,谁都可以进来,所以我们不能阻止居心叵测的节点混进来干坏事。




