AutoGrad 与贝叶斯大脑：Jeff Beck 博士谈 AI 的未来

核心论点：智能不是函数近似

真正的人工智能不能仅仅通过放大 transformer 或改进函数近似来实现。相反，智能必须立足于与人类认知相同的领域：物理的、宏观的世界。Jeff Beck 博士提出将庞大、单块的神经网络转向“许多小模型”方法——模块化、以对象为中心的贝叶斯模型，通过发现的力相互作用，类似于生物大脑处理现实的方式。

AutoGrad 与 Transformers：到底改变了 AI 什么

虽然业界把当前的 AI 热潮归功于 transformer 架构，Beck 博士认为真正的催化剂是 自动微分 (AutoGrad)。

AutoGrad 将 AI 开发从理论数学问题转变为工程问题。通过自动计算梯度，它让研究者能够快速尝试不同的架构、非线性函数和记忆结构，而无需手动推导学习规则。这一工程转变实现了模型的超大规模化，进而导致了 transformer 的成功感知。Beck 博士指出，其他架构，如 Mamba（状态空间模型），在规模化后也能实现类似功能，这表明规模化——由 AutoGrad 使能——比特定的 transformer 架构本身更为关键。

贝叶斯大脑与主动推断

Beck 博士认为人类大脑是一个贝叶斯推断引擎，持续对世界进行假设检验。这得到“最优线索组合”行为实验的支持——人在结合可靠和不可靠的感官信息（例如视觉和听觉线索）时表现出惊人的效率。

贝叶斯方法的关键原则：

假设检验： 大脑使用基于特定假设的世界生成模型。
信息过滤： 大多数大脑活动用于决定忽略什么，以避免信息超载。
主动推断： 基于 Karl Friston 的工作，这一框架将信息论和统计物理联系起来，描述主体如何最小化惊讶度以维持自身存在。

落地问题：物理优先于语言

当前大语言模型（LLM）的根本缺陷在于它们以语言为落地。Beck 博士认为语言是思维的糟糕模型，因为心理学中的自我报告数据极不可靠；人们常常用与实际决策过程不一致的方式解释自己的行为。

要构建像人类一样思考的 AI，必须以 宏观物理 为落地。这意味着 AI 应该把世界视为具有特定关系和可供性的对象，而不是像素或 token。智能必须具身，因为物理环境提供了“思维的原子要素”——构建更复杂概念模型的基本构件。

“许多小模型”架构

Beck 博士设想的系统不像单一的巨型神经网络，而是类似于视频游戏引擎的结构。在这种架构中，AI 维护一个包含数千个小型、模块化模型的库，每个模型代表特定对象或对象类（例如“书本模型”。）

模块化对象模型的优势：

计算效率： 代理仅实例化当前环境中相关的极小部分模型，保持稀疏性。
系统工程： 通过理解对象及其相互作用的力，AI 能进行“系统工程”——将已知对象以新颖方式组合，发明新事物（例如将机翼与喷气发动机组合成飞机）。
泛化能力： 在一个领域学到的模型（例如房屋内部）可以迁移到另一个领域（例如公园），因为对象本身是模块化的。

解决泛化：仓库里的猫

Beck 博士用“仓库里的猫”问题说明当前 AI 的失败。仅在箱子和叉车上训练的仓库机器人在遇到猫时通常会撞上或产生幻觉。

在贝叶斯、以对象为中心的系统中，过程如下：

惊讶度检测： 机器人检测到高惊讶度信号，因为猫不符合任何现有模型。
知识获取： 机器人“打电话给朋友”（查询中心服务器）以下载与视觉数据匹配的潜在对象模型。
假设检验： 机器人通过观察猫的行为测试多个候选模型（例如不同的猫品种），直至识别出正确模型。
整合： 将猫模型纳入机器人本地库，以备将来使用。

通过信念交换实现对齐

Beck 博士认为传统的强化学习（RL）对齐——使用奖励函数——根本有缺陷，因为奖励值往往是任意的，可能导致退化行为（即“恶意精灵”问题）。

他提出一种基于 信念交换 的对齐策略。由于人类行为是信念与价值的组合，对齐应涉及显式的信念交换。通过交流并调和双方对世界的内部模型，人类与 AI 能够区分分歧是基于事实误解（信念）还是价值差异（奖励函数），从而实现更透明、更稳健的对齐形式。

AutoGrad 与贝叶斯大脑：Jeff Beck 博士谈 AI 的未来

AutoGrad 与贝叶斯大脑：Jeff Beck 博士谈 AI 的未来

核心论点：智能不是函数近似

AutoGrad 与 Transformers：到底改变了 AI 什么

贝叶斯大脑与主动推断

贝叶斯方法的关键原则：

落地问题：物理优先于语言

“许多小模型”架构

模块化对象模型的优势：

解决泛化：仓库里的猫

通过信念交换实现对齐

Sources