正常计算与热力学 AI 芯片

正常计算与热力学 AI 芯片

热力学计算:将噪声视为资源

热力学计算通过将物理噪声视为计算的核心机制,而不是需要消除的敌人,改变了芯片设计的范式。传统半导体制造投入大量资源确保晶体管精确落在 0 或 1 上,而热力学计算则利用硬件固有的随机性来求解随机微分方程。

CN101 芯片

Normal Computing 开发了 CN101,全球首款热力学计算芯片。该硬件由一组可编程电阻的电容阵列组成。通过向系统注入噪声,芯片按照随机微分方程运行,使其能够在概率工作负载上得到答案,这在传统硬件上计算成本极高。具体而言,芯片可用于矩阵求逆,让物理噪声收敛到表示芯片中编程权重矩阵逆的状态。

在概率机器学习中的应用

该方法特别适用于贝叶斯智能和概率机器学习,在这些领域中不确定性量化至关重要。现代生成式 AI 关注 token 流,而热力学计算则针对贝叶斯推断的底层数学挑战,如马尔可夫链蒙特卡罗(MCMC)和扩散模型,其中在 GPU 上采样高斯随机变量是一个显著瓶颈。

AI 驱动的芯片设计与形式化验证

为了加速 tape‑out 的进程,Normal Computing 使用“一群”AI 代理来处理芯片设计、优化和验证的全流程。

Verilog 仿真器项目

由于商业电子设计自动化(EDA)工具价格高昂——每个 CPU 核心许可证常常高达 $10,000——Normal Computing 自行构建了开源 Verilog 仿真器。借助 AI 代理,团队在 43 天内生成了约 580,000 行代码。该项目展示了递归自我改进的潜力,即 AI 帮助构建设计更好 AI 硬件所需的工具。

形式化验证的挑战

在硬件领域,一个 bug 可能导致数百万美元的损失(历史上某 Intel 部门的 bug 造成 $5 亿至 $20 亿不等的损失)。因此,形式化验证是必不可少的。Normal Computing 采用“自动形式化”,即将人工规范转化为形式模型(例如使用 Lean 或 TLA+)。

关键策略包括:

  • AlphaProof 技巧:训练模型“证明或反驳”某个属性。如果形式化略有错误,模型仍可通过证明该命题为假来提供价值,从而生成有用的训练数据。
  • 多层次形式化:针对不同抽象层使用不同工具,例如使用 SystemVerilog Assertions(SVA)进行周期级验证,使用 TLA+ 或时序 Petri 网进行高层协议和系统级属性验证(如防止 DRAM 死锁)。

代理编码的“理解债务”

随着 AI 代理生成的代码库日益庞大,软件的功能性能与人类对其结构的理解之间出现了鸿沟。

结构 vs. 能力

引用 ProgramBench,讨论指出,尽管 LLM 能通过高比例的测试,但往往无法从头重建复杂程序(如 FFmpeg)。这表明存在“能力”(通过测试)与“结构”(深层约束理解)之间的区别。

理解债务的风险

Thomas Ahle 警告说,“理解债务”会导致开发者依赖 AI 维护一个“意大利面怪兽”式的代码——它能运行,却没有任何人真正理解。这种债务会使未来的演进陷入瘫痪,因为深层的、扎根的理解是下一代设计决策的基础。

认识论主观性与“AI 低质量产出”

AI 生成内容的激增在开源生态系统中制造了“污染海啸”或“低质量产出”。这导致技术协作的社会契约破裂,维护者不再能够假设贡献者已经在编写或审查 Pull Request 上投入了大量精力。这种“认识论主观性”发生在用户被 AI 说服认为平庸的输出很棒时,进而产生对工具的依赖,侵蚀了用户自身的批判性思维和领域专长。


摘要:Thomas Ahle 讨论了 CN101 热力学芯片的开发,该芯片利用物理噪声作为计算资源,以解决复杂的概率工作负载并实现矩阵求逆。

标题:正常计算与热力学 AI 芯片

Sources