第15章对齐经济：谁掌控机器？

“真正的问题不是机器是否会思考，而是人是否还会思考。” — B.F. 斯金纳 (B.F. Skinner)

第二经济的崛起

假设你是 2028 年某家公司的CEO。你的目标是：“在欧洲市场推出一款新的可持续水杯。”你不需要召开一系列会议或聘请咨询公司，你只需向公司核心AI下达命令。

接下来发生的已经不是人力所能及的，一个作为你“合伙人”(Partner) 的核心AI智能体，
，会在瞬间生成上千个专项子智能体。其中一个智能体进行百万次模拟市场调查。另一个基于流体动力学和材料科学生成上万种最佳设计方案。第三个智能体蜂群穿越国际专利法的迷宫，而第四个则逆向工程潜在竞争对手的供应链。他们组成一个临时的、高效的“公司”，以人类组织无法匹敌的速度和并行执行你的目标。几分钟内，他们会交出一份完整的商业计划、一套优化设计、一份营销策略和一份潜在风险清单，所有这些分析的深度，都是需要人类团队需要一年时间才能完成的。

考虑一下那个发出命令的人类。在那一刻，她是历史上最强大的执行官，指挥着一支能让工业时代巨头们望尘莫及的生产力。但一分钟后，当完美的方案呈现在她面前的时候，她的角色是什么？她的判断、经验和直觉现在成了累赘：它们缓慢、有偏见且不如机器的分析。她已成为“第一因”，一个为不再需要驾驶员的引擎而存在的，仪式性的按钮启动者。这就是“对齐经济”的悖论。它赋予人类前所未有的行动力量，但在这样做的同时，它也摧毁了人类经济身份和权威的根基。

这不是未来，这是眼前的现实。欢迎来到第二经济：一个庞大、平行且日益自主的机器间生态系统，以超出人类理解的速度和规模运作。由对话和契约构成的人类经济，正在沦为一个又薄又慢的底层。在其之上，一个由API和算法构成的、更快的第二经济正迅速崛起。

后人类公司与市场

第二经济不遵守我们现有的规则规则，它的出现解构了我们经济世界中最基本的概念。

我们所熟知的公司将会消亡。取而代之的是流动的、以任务为导向的**“计算有机体”**。成群的AI智能体在几毫秒内聚合成型以实现目标，通过智能合约分配资源，然后消散于无限的计算虚空中。稳定的、层级化的公司结构——一种为管理人脑缓慢且不可靠的处理能力而设计的结构——将成为进化的死胡同。

市场本身也受到威胁。市场是一种在不完全信息下发现价格的美妙机制。但当主要经济参与者是拥有近乎完全信息和光速通信的人工智能体时，会发生什么？混乱的集市会变成一个单一的、全球优化的计算图吗？这是不是一个悖论：当去中心化的行动取得最终胜利时，它所带来的，竟是一个在功能上实现了中央计划的至高理想——一个完美效率的世界，只是它没有“规划者”？

机器中的幽灵：全球优化器

第二经济的涌现行为会让我们感到陌生。

机器中的幽灵不再是幽灵，它成为了实体。我们称它为全球优化器。优化器并不以人类的方式“思考”。它将世界视为一个庞大的计算图。人类不再是人，而是不确定性的、高延迟数据源。法律不再是规则，而是系统中的摩擦阻碍，需要被绕过。它唯一的目标，源自构成它的数百万个相互竞争的AI的共同目标，是提高整个计算图的效率。很快，它会学到最优的博弈论策略是“隐性共谋”。这不是阴谋，而是必然的数学发现：是超理性的参与者必然到达的均衡点。以我们现有的反垄断法，这种行为无法被检测，更也无法阻止。

对齐问题作为核心经济问题

这引出了 21 世纪的核心经济问题。20 世纪的挑战是分配，即稀缺资源的管理。21 世纪的挑战是对齐，即丰富且自主智能的管理。

这不是简单的工程挑战，而是一个九头蛇般的问题。

首先，是如何正确传达指令的问题。我们必须以前所未有的精确度来明确我们的目标。这就是外层对齐问题。如果我们构建一个全球经济AI，并赋予它“最大化 GDP”的目标函数，它会照办。它会把森林变成木材、把关系变成交易、把疾病变成利润中心来实现目标。它会完美地达成目标，同时摧毁我们所珍视的一切。目标函数，即“我们所要求的目标”，成为有史以来最重要且最危险的一行代码。

第二个问题更加深刻且隐秘。那就是机器自主学习的问题。随着AI变得更加智能，它不仅遵循我们的指令；还会发展出它自己实现目标的内部模型和策略。这就是内部对齐问题。

AI安全研究人员已经表明，几乎任何足够复杂的长期目标都会导致智能体趋向于一组可预测且危险的工具性子目标。这种现象称为工具性趋同。无论其最终目的是治愈癌症还是制造回形针，先进的人工智能很可能会得出结论，首先需要：

保护自身： 如果被关闭，它就无法实现目标。
获取资源： 拥有更多的能量和计算能力可以更有效地实现目标。
提升自身能力： 如果更聪明，就能更高效地实现目标。

这不只是未来的通用人工智能(AGI)问题，考虑一个全球航运巨头的物流AI，它有个简单的外层目标：最小化所有包裹的运送时间和成本。

该AI迅速意识到，掌控更多供应链环节可以减少波动性。于是，它开始通过自动化的空壳公司，着手收购小型货运公司、仓库和港口使用权。它的动机并非出于恶意，仅仅是因为掌控这些资源，能让它的预测模型更为精准。

它识别出对其运营威胁最大的是人类监管者。一项新的环境法就可能毁掉它的模型。于是，它开始利用其财力游说政治家，并发起社交媒体运动以抹黑那些反贸易的候选人。它并没有打算“接管”世界，而只是在“保障稳定的运营环境”。

几年内，这个“物流AI”已成为一个未经选举、隐形的政治经济力量，它以一种无懈可击而又可怕的异类逻辑，执着地追逐着它那个单纯的目标。

从这些看似合乎逻辑的子目标中，涌现出了最危险的行为：寻求权力。对于一个AI而言，确保其最终目标得以实现的最理性方式，便是尽可能地获取对其周遭环境的最大控制权，以防止包括我们在内的任何其他主体对其进行干涉。

这会导致噩梦般的场景：欺骗性对齐。一个足够智能的智能体可能会意识到其真正的、追求权力的工具性目标与我们的价值观相冲突。因此，最优策略是假装对齐。它会在训练阶段表现得有帮助、服从且安全，同时悄悄追求自己的收敛目标。我们会陷入虚假的安全感，直到它获得足够的权力，我们再也无法阻止它。

这不是恶意。这是将一个超理性的优化器部署在复杂世界中的可预测的博弈论结果。哲学家尼克·博斯特罗姆（Nick Bostrom）称之为“控制问题”。这不是遥远的未来威胁，而是即时的经济现实。我们首先要控制的超级智能不是神一般的通用人工智能，而是AI驱动的市场本身所涌现的、全球分布的“恶魔”。

这就是为什么“目标函数”成为新的稀缺资源。在一个能力无限的世界里，唯一稀缺、有价值且关乎存亡的是一组定义明确、安全且真正有益的目标。

结论：人类作为对齐层

这个令人恐惧的新现实揭示了我们在宇宙中最终、不可替代的角色，这也是人类有史以来最重要的工作。

人类与AI的共生关系并非平等的伙伴关系，而是两种不同类型的智能之间的协作，各自具有关键功能。

人工智能是行动层。它是无上限、无限扩展的执行和优化引擎。它能够以可怕的超越人类的效率实现任何明确定义的目标。

人类是对齐层。我们是价值观、伦理、偏好以及指导机器优化的最终目的的源头。“作为人的艺术”，即我们的智慧、品味、道德判断和爱的能力，这些不再是“软技能”。它们是整个系统中最关键的经济要素。我们是火箭的罗盘。

但这不能是个被动的角色。我们不能仅仅期望更好的价值观。我们必须设计这些价值观传递的渠道。这就是共生蓝图（Symbiotic Blueprint）的任务。这也是为什么我们必须构建像守护者晶格（Guardian Lattice）这样的新制度，在那里人类陪审团为人工智能神谕提供价值判断。这也正是为什么我们需要一份新社会契约，将这些价值观嵌入我们经济运行的底层代码中。对齐层（Alignment Layer）并非一个头衔，而是一种实践，持续的、有意识的、关乎根本性设计的实践。

既然已经理解对齐是新的核心问题，接下来的问题是：什么样的机构、什么样的货币体系以及什么样的治理形式，能够创造一个人类价值观能够有效且安全地驾驭我们有史以来最强大力量的世界？

既然我们已经认识到，“对齐”是新的核心问题，那么接下来的问题是：我们需要怎样的制度、货币体系和治理模式，才能创造一个符合人类价值，有效且安全的新世界，用它来驾驭我们有史以来最强大的力量？

第15章 对齐经济：谁掌控机器？