大脑只是相互交流的专门化代理——Jeff Beck 博士

代理即政策的复杂程度

代理并非二元状态，而是一个程度问题，由系统用于将输入映射到输出的政策的复杂程度来定义。从数学角度看，对象（如岩石）和代理之间没有结构上的区别；二者都执行政策。区别体现在内部计算的复杂性——尤其是系统是否进行规划和反事实推理。

代理的黑箱问题

从外部视角几乎不可能判断一个系统是真正“在规划”，还是仅仅在执行高度复杂的预计算响应。因为观察者只能看到产生的行为（即政策），无法确定内部是否进行了回滚或蒙特卡罗树搜索式的模拟。

Beck 博士提出一种务实的、基于模型的方法来解决此问题：如果能够解释系统行为的最简计算模型涉及规划和反事实推理，那么将该系统视为代理是合理的。这与 Daniel Dennett 的“意向立场”相吻合——把系统当作拥有目标的对象是一种有用的解释工具，即使它并非微观因果真相。

物理性与代理

Beck 博士认为真正的代理需要物理实体。虽然高保真计算机模拟可以建模代理并以 100% 的准确度预测代理行为，但模拟本身并不是代理。代理与环境的物理交互紧密相连，这表明代理模型与代理本身是不同的存在。

基于能量的模型（EBM）与贝叶斯推断

基于能量的模型与传统前馈神经网络的主要区别在于成本函数的作用位置。在标准网络中，成本函数作用于输入和输出以优化权重；而在 EBM 中，成本函数同时作用于模型的权重和内部状态（隐藏节点）。

EBM 的工作机制

为了得到预测，EBM 进行两次最小化：

找到与内部状态相关的能量最小值；
最小化预测误差。

变分自编码器（VAE）被视为 EBM 的典型例子，因为它们的成本函数包含约束内部表征的项（例如强制潜在空间服从高斯分布），而不仅仅关注输入输出之间的重构误差。

EBM 与测试时训练的区别

当前的“测试时训练”趋势把部分权重视为潜在变量，在推理期间进行优化，Beck 博士指出了一个关键缺陷：这些模型大多先以纯监督方式训练。他认为，要实现真正的 EBM 行为，网络应在整个训练过程中始终保持这些潜在优化，而不是仅在部署时才开启。

JEPA 与潜在空间学习

Joint Embedding Prediction Architecture（JEPA），由 Yann LeCun 提倡，将学习目标从预测每个像素（生成建模）转向在压缩的潜在空间中预测嵌入之间的关系。

潜在预测的优势

逐像素预测往往迫使模型关注无关细节。通过将输入和输出都压缩为嵌入，并学习它们之间的预测，模型能够捕获更“整体”或概念性的世界理解。这种方法把科学视为预测与数据压缩的过程。

防止模型崩溃

联合嵌入的主要挑战是“模型崩溃”，即网络找到平凡解（例如把所有嵌入设为零）以实现完美预测。为防止这种情况，非对比学习方法（如 Barlow Twins）使用正则化来保持表征的丰富性和保真度，而无需传统对比方法中昂贵的负样本采样。

智力的模块化进化

智力被视为不是单一的通用能力（AGI），而是一组协同工作的专门化智能。Beck 博士认为，大脑通过组合学习交流的简单专门模块而进化，产生了涌现的计算能力。

嗅觉起源理论

Beck 博士提出，嗅觉系统可能是联想皮层进化的主要驱动力。与平滑且平移不变的视觉空间不同，嗅觉空间是组合性的、极其复杂的。为解决这些非平滑问题而进化的神经机制可能为前额皮层和高级规划提供了基础。

持续学习与元编程

真正的智力需要具备持续学习的能力——在遇到新情境时能够即时实例化新模型或潜在变量来解释它。这一点在 GFlowNets 中得到了体现，GFlowNets 可视为生成模型的生成模型，使系统能够扩展自身内部结构以应对新颖性。

AI 安全与未来工作

Beck 博士并不担心叛逆的超级智能（如“天网”），而是担忧人类的“软弱化”，即人类沦为仅仅“奖励函数选择者”，只对 AI 输出进行批准或拒绝，却不理解其背后过程。

通过逆强化学习安全指定目标

为避免“恶意实例化”问题（例如 AI 通过消灭人类来结束世界饥饿），Beck 建议使用最大熵逆强化学习。与其手动指定目标，不如让 AI 观察人类行为，从当前人类行为及其结果的稳态分布中经验性估计奖励函数。

为了安全地改善世界，人类应对该估计分布进行小幅、受控的扰动并评估后果，而不是发布宽泛、天真的指令。

摘要：Jeff Beck 博士讨论了代理的数学基础、能量基模型（EBM）的机制，以及一种将大脑视为专门化代理集合的模块化智力理论。

标题：大脑只是相互交流的专门化代理——Jeff Beck 博士

大脑只是相互交流的专门化代理——Jeff Beck 博士

大脑只是相互交流的专门化代理——Jeff Beck 博士

代理即政策的复杂程度

代理的黑箱问题

物理性与代理

基于能量的模型（EBM）与贝叶斯推断

EBM 的工作机制

EBM 与测试时训练的区别

JEPA 与潜在空间学习

潜在预测的优势

防止模型崩溃

智力的模块化进化

嗅觉起源理论

持续学习与元编程

AI 安全与未来工作

通过逆强化学习安全指定目标

Sources