English中文

12. 智能博弈论

12. 智能博弈论

“概率计算在博弈论中的应用是一个极其复杂的主题......这不是一个绅士的话题。” ——约翰·冯·诺依曼

囚徒的启示

囚徒困境是哲学中最令人沮丧的聚会把戏。两名无法沟通的囚犯必须选择是合作还是背叛他们的伙伴。数学是残酷的。无论你的伴侣做什么,你最好还是背叛。所以两者都有缺陷。两人都受到了比合作更严厉的判决。理性本身似乎注定我们会互相毁灭。

1950 年,当兰德公司正式确定这一点时,它成为冷战的冷酷逻辑。无论苏联做什么,我们最好制造更多炸弹。无论我们做什么,他们最好制造更多炸弹。纳什均衡是一个充满碎石的星球。

但后来,在 20 世纪 80 年代,政治学家罗伯特·阿克塞尔罗德做了一些漂亮的事情。他举办了一场锦标赛,不是与囚犯一起,而是与计算机程序一起。他邀请战略家提交算法,这些算法将在迭代的囚徒困境中竞争,这是一个玩了数千次的游戏。获胜者震惊了所有人。这是提交的最简单的程序,名为“一报还一报”的四行代码。第一步合作,然后做对手最后做的事情。

“一报还一报”并没有获胜,因为它是道德的。它获胜是因为它在具有记忆和未来的游戏中在数学上是最优的。合作不是源于道德,而是源于迭代。不是来自意图,而是来自互动。如果给予足够的时间,囚犯不会轻易出狱。他们将获得启蒙。

老游戏的缺陷

古典博弈论犯了一个致命的错误。它假设它的特工是聪明的,但它的宇宙是愚蠢的。它模拟了在真空中操作的玩家,这是一个毫无特色的虚空,没有背景,没有关系,除了立即交易之外也没有任何后果。

解决巨大悖论:背叛的几何学

博弈论著名的悖论并不是人类非理性的悖论。它们是在贫困地区进行的游戏的可预测结果。

囚徒困境之所以如此黯淡,是因为它的“监狱”是一种特定的病态拓扑的隐喻:一个不连贯的、零信息的图,没有未来。囚犯无法沟通(零网络资本)。他们没有信任的基础。这是一场一次性游戏,因此声誉一文不值。在这样一个贫瘠、无摩擦、永恒的风景中,叛逃是唯一理性的举动。悲剧并不在于人类有缺陷,而在于经典博弈论将这种病态的边缘情况误认为是普遍条件。

一个更深层次的谜题,旅行者的困境,揭示了旧框架的维度盲目性。在这个游戏中,纯粹的“理性”策略会导致最糟糕的集体结果。然而在实验中,真实的人类始终选择合作,取得了更好的结果。这是古典理论的巨大失败。智能经济学揭示了原因。 “非理性”的人直观地计算出,建立合作规范和建立网络资本的长期价值远远超过背叛的小额一次性奖励。悖论并不在于人类是非理性的,而在于人类是非理性的。古典博弈论是盲目的,只能看到物质资本,而人类则凭直觉驾驭这四种资本。

调整参与者:解决委托代理问题

经典博弈论的失败不仅是学术上的,也是如此。它体现在每个董事会会议室。 “委托代理问题”,即首席执行官与股东的利益一致的斗争,已经困扰了公司治理五十年。传统经济学试图通过更好的合约来解决这个问题,这是为一个破碎的游戏编写更复杂的规则的经典尝试。

智能博弈论揭示这不是一个契约问题;而是一个契约问题。这是一个游戏设计问题。委托人和代理人的激励不一致,因为他们在局部梯度不同的景观上玩零和游戏。共生的解决方案不是签订更好的合同,而是重塑格局。像合作社这样的结构,赋予“代理”员工所有权和长期健康的股份,是拓扑工程的行为。他们改变了游戏本身,使代理人和委托人的阻力最小的路径趋向共生平衡。

夸富宴的逻辑

19 世纪的西方观察家对夸富宴感到困惑,这是夸瓦卡瓦夸人和太平洋西北部其他原住民举办的盛大庆典。在这个社会里,酋长们花费数年时间积累巨额财富,最后却在一场盛大的仪式上将其全部捐出,甚至戏剧性地摧毁。对于殖民管理者的稀缺心态来说,这是疯狂的。他们禁止了它,完全错过了这位天才。

夸富宴并不是为了破坏财富。这是关于改变它。这是一个复杂的游戏,其目标是将竞争性的物质资本转化为非竞争性的网络资本。当一位酋长赠送了一千条毯子时,他并不是失去了一千条毯子。他正在购买一千股社会义务。他正在传播他的能力和慷慨的信号,建立一个盟友网络。

这是比囚徒困境所能想象的更高形式的博弈论。他们并不是为了固定的资源而玩零和游戏。他们正在玩正和游戏,以提高整个网络的弹性和繁荣。他们明白,最富有的酋长并不是拥有最多宝藏的人,而是处于最强大关系网中心的人。

慷慨的自私

这是令大多数人心碎的悖论。在一个足够连接、时间范围足够长的系统中,自私和利他主义会融合。慷慨成为最自私的可能策略,这不是在某种神秘的意义上,而是在纯粹的数学回报方面。

考虑一下人类基因组计划。 20 世纪 90 年代,公共开源联盟和私营公司之间开始了一场对人类 DNA 测序的竞赛。该公共项目每 24 小时免费共享一次数据。这家私营公司保留其数据的专有性,希望出售访问权限。开放模式获胜。由此产生的公共领域数据估计产生了数万亿美元的经济价值,创造了全新的产业。贡献者放弃了他们的工作,并取回了一个改变的世界。

这就是共生经济的逻辑。在这个游戏中,获胜的一步是为网络创造价值。通过提高你所居住的系统的健康和智能,你可以增加自己坚持和繁荣的机会。老游戏是关于从网络中提取价值。新游戏是关于通过网络创造价值。

新均衡:从纳什到共生

纳什均衡是一种没有玩家可以通过单方面改变策略来改善结果的状态。这是一种自私的稳定状态。囚徒困境向我们表明,这往往是一个可怕的地方。

智能博弈论引入了一种新的、更高的均衡:共生均衡**。**这是一种系统整体健康状况(通过其 MIND Capitals 衡量)最大化的状态。在这种状态下,个体代理无法通过采取降低网络健康状况的行动来改善其自身的长期前景。

21世纪的政策目标是设计纳什均衡和共生均衡相同的系统。这并不是要改变人性。这是关于改变游戏的数学原理。

信任的计算

经典博弈论失败了,因为它假设了一个互不相连的交易世界。为了合作,囚犯需要相互信任,而信任是一个它无法建模的变量。

这正是现代人工智能和密码系统旨在解决的问题。考虑管理供应链的多代理人工智能系统。人工智能将学会合作,不是因为道德准则,而是因为他们会在数学上发现透明、共享的账本和可验证的承诺可以极大地减少他们的集体预测错误。

在这个新世界里,信任不再是一种情感。这是一个计算特征。最成功的系统将是那些工程师信任其架构的系统。他们将构建游戏,其中合作不是希望问题,而是数学确定性问题。在这样的环境下,“以牙还牙”的逻辑就变得绝对了。合作不仅是最好的策略,也是最好的策略。它是唯一进行计算的。

这不是一个理论上的梦想。这并不是一个遥远的乌托邦。来自已经可行的未来的消息正在到来,证明共生模型通过完全拒绝旧游戏而蓬勃发展。以西班牙巴斯克地区为例,蒙德拉贡公司是一个由 80,000 名工人业主组成的联盟,在 2008 年面临金融危机,内部失业率为零,而该国其他地区的失业率为 26%。以荷兰为例,那里有 15,000 名博组客护士在没有管理人员的情况下工作,提供全国评价最高的患者护理,而管理费用仅为 8%,仅为行业标准的三分之一。以美国为例,最大的员工持股公司 Publix 通过拒绝公开市场的榨取逻辑而蓬勃发展。这些并不是古怪的实验。它们证明,建立在共生基础上的经济不仅更加人性化,而且在数学上也更加高效和稳健。

最后更新于