Guillermo Rauch 谈 AI 超级周期与智能体基础设施的经济学
Guillermo Rauch 谈 AI 超级周期与智能体基础设施的经济学
向智能体基础设施的转变
AI 编程智能体正在推动软件创作总潜在市场(TAM)实现历史上最大规模的扩张。 虽然传统的软件开发受限于人类程序员的数量,但 AI 智能体现在可以以前所未有的规模和速度编写、修复和保护软件。这种转变正在将云端从“Amazon Web Services” (AWS) 模型推向 Guillermo Rauch 所描述的“Amazon Agent Services” (AAS)。
从页面到智能体
历史上,互联网是建立在以交付页面和像素为核心的即时请求-响应周期之上的。 “智能体云”引入了一种不同的范式:
- 长思考流: 与传统的网页不同,智能体可能需要几秒钟、几分钟、几小时甚至几天来完成一项任务(例如,生成一份全面的报告或构建软件)。
- 计算反转: 重点正在从托管静态或动态页面转向托管能够隐身在幕后维护、推广和扩展公司的自主智能体。
- 基于 Token 的经济学: 智能现在是以 Token 而非像素的形式进行流式传输的,这导致了从基于席位的 SaaS 定价向基于 Token 的定价模式转变,后者衡量的是智能消耗量。
“区块经济”与智能体工程学
AI 时代的软件成功取决于“可组合性”和“智能体工程学”——即创建 AI 智能体可以轻松利用的构建块。 Rauch 称之为“区块经济”,在这种模式下,智能体不会为每个任务都重新发明宇宙,而是依赖于现有的、高质量的基础设施区块。
为什么智能体更青睐某些工具
编程智能体对具有“局部推理”属性的工具表现出偏好。例如,Rauch 指出,Tailwind CSS、Next.js 和 React 等技术深受智能体青睐,因为:
- 局部推理: 组件可以在隔离状态下进行推理,使其具有前瞻性,并且更容易在不破坏整体的情况下插入到不同的环境中。
- 上下文窗口效率: 由于 LLM 的上下文窗口有限,允许局部推理的代码对模型来说处理起来更高效。
- 训练数据普及度: 这些框架的海量开源文档和现有代码为智能体提供了强大的基础。
智能体基础设施的核心组件
为了使 AI 模型变得有用,它们需要一个能够模拟为人类知识工作者提供工具的全栈环境。 Rauch 识别出智能体时代所需的三个关键基础设施层:
- 沙箱 (Compute): 正如人类员工会得到一台笔记本电脑一样,智能体也需要一个安全、临时性的计算机(沙箱)来执行代码。通过允许智能体与真实环境交互,这增加了从模型中提取的“IQ 点数”。
- AI 网关 (Token CDN): Token 需要与像素曾经面临的同样扩展性、加速和安全性需求。AI 网关充当“Token 的 CDN”,提供:
- 观察与故障转移: 监控 Token 流并在某个提供商失效时进行切换。
- 语义缓存: 通过使用较小的模型处理简单响应(例如,对“谢谢”回复“不客气”)来降低成本,同时将大型模型保留用于复杂任务。
- 自动驾驶云 (Automation): 云管理的未来是“自动驾驶汽车”模型,其中智能体可以自动配置、优化并利用 Pull Requests (PRs) 发布性能改进,而无需人工干预。
对 SaaS 商业模式的影响
AI 软件生成的速率正在使传统的、“最低公约数”式的 SaaS 产品过时,而有利于具有开放接口的系统记录器(Systems of Record)。
“氛围编程”与定制化软件的兴起
Rauch 观察到一种趋势,即用户通过“氛围编程” (vibe coding) 来编写高度定制化的工具,以取代通用的现成软件。他举了一个例子,一位 CEO 用 V0 实时编写的代码构建了一个定制工具,取代了公司停车场的管理软件。
AI 技术栈中的价值积累
- 看空 (Short on): 静态数据/内容业务(例如,Stack Overflow)以及过于主观且具有约束性的“辅助轮”式拖拽构建器。
- 看好 (Long on): 以“Token 速度”运行的公司,提供基于消耗量的定价、即时注册和原始 API 访问。
- 系统记录器 (The System of Record): 虽然软件的展示层正在变得具有可塑性和可塑性,但底层的系统记录器(数据库、ACLs 和访问控制)仍然至关重要。通过智能体接口(如 MCP 或 CLIs)暴露这些功能的 SaaS 公司将生存并发展。
AI 时代的运营转变
智能体驱动的需求规模正在迫使人们重新思考传统的工程约束,特别是关于速率限制 (rate limiting)。
由于智能体可以触发部署的频率远超人类,Rauch 已推动其团队远离僵化的速率限制。相反,重点已转向滥用预防和 KYC (Know Your Customer) 以防止受超级计算机支持的攻击者瞬间产生巨额成本,同时允许合法的智能体需求在没有人工上限的情况下进行扩展。