代理时代:Logan Kilpatrick 谈 AI Studio 与构建的未来
代理时代:Logan Kilpatrick 谈 AI Studio 与构建的未来
从提示到代理工程的转变
AI 代理的时代已经到来,从理论炒作转向在 Google 生态系统中的实际交付。 这一转变的特征是从简单的“提示到原型”工作流,转向“代理工程”,在这种模式下,AI 不仅仅是建议代码,而是主动构建、部署并迭代功能性应用。
Vibe Coding 与 Build 选项卡
AI Studio 已经演进为通过其 Build 选项卡提供“vibe coding”体验。这使用户能够在几分钟内从提示转化为可运行的应用——包括数据库集成和通过 Cloud Run 部署。关键新功能包括:
- 设计预览: 用户可以在初始生成阶段看到多个 UI 迭代,并选择自己喜欢的方向。
- “我很幸运”按钮: 通过生成与 Google 生态系统相连的初始应用想法,帮助解决“灵感不足”问题。
- Tap Tap 选项卡: 基于 Gemini Flash 的 AI 自动补全,帮助用户生成性地扩展和表达提示。
- Yapta 应用: 一种语音驱动的提示体验,Gemini 将不连贯的口头想法转化为连贯、可执行的计划供模型执行。
“雄心”思维方式的转变
随着模型能力的提升,创作的瓶颈已从技术能力转向人类的雄心。Logan Kilpatrick 指出,用户不再需要极其精确以避免模型失败;相反,他们可以一次性提出 dozens(数十)个需求。这为构建者带来了新的责任——构思更具雄心的项目,因为技术实现已经变得可行。
扩展构建者生态系统
AI 正在让软件创作民主化,使非程序员也能成为构建者,并提升对专业开发者的整体需求。 通过降低进入门槛,Google 旨在将创造具有经济赋能的软件的机会分配给全球受众。
“开发者”的新定义
AI Studio 同时充当非程序员的“构建者产品”和专业人士的“开发者产品”。这种双重身份让缺乏前端经验的开发者能够快速构建精致界面,而专业工程师则通过合作模式保持生产质量的高标准。在此模型中,“vibe coders”提出变更,技术人员确保 CI/CD 流水线通过并且代码可扩展后再合并到核心代码库。
移动端与设备端 AI
Google 正在努力将 AI Studio 带到移动平台,以触达不使用桌面的下一代构建者。这包括探索设备端模型(如 Gemma),以在移动设备上实现本地 AI Studio 功能。
多模态能力与实时交互
多模态理解是高级生成和实时代理行为的基础。 模型能够实时观看、聆听和发声,正在改变用户与物理及数字世界的交互方式。
Gemini Live 与 Project Astra
Gemini Live(及其前身 Project Astra)实现了音频、视频和文本的实时流式传输。这支持“无处不在”的使用场景,例如:
- 屏幕共享代理: 代理能够看到用户的屏幕,并实时引导其完成复杂软件界面的操作。
- 物理世界辅助: 使用摄像头识别损坏的家电或复杂机械(如高端咖啡机),并提供逐步维修或操作指引。
Gen Media 组合
Google 的多模态战略包括一套专用模型:Nano Banana、Lyria 以及各种 TTS(文本转语音)模型。目标是最终将这些定制能力整合到主线 Gemini 模型中,以降低复杂度,同时在图像和音频上的推理能力保持高水平。
代理与基础设施的未来
AI 的下一个前沿是长期运行的代理以及 AI 在每个基础产品中的深度集成。 行业正朝着能够自主运行数天甚至数周的代理迈进,而不是仅限于数小时。
Deep Research 与 Interactions API
Google 最近通过 Interactions API 更新了 Deep Research API(包括“Max”版本)。该框架将模型和代理视为一等公民,允许开发者在 Gemini API 中创建自己的代理。这为未来每个产品——如 Gmail 或 Search——都能具备代理特性奠定了基础。
基础设施挑战与 TPU
尽管在 TPU 基础设施上投入巨大(包括提供 3 倍推理提升的新架构),AI 令牌的需求仍然超过供给。这种“成功致死”局面将要求用户和企业更有针对性地将令牌用于最高价值的用例,而不是把 AI 应用于所有可能的任务。
机器人技术与未来 12‑18 个月
机器人被视为另一种模态。随着新模型中智能的注入,Google 正与 Boston Dynamics 等组织合作,解决此前阻碍机器人发展的边缘案例,预计在未来一年内会有重大突破。
摘要:Logan Kilpatrick 讨论了 AI Studio 向“vibe coding”平台的演进、代理工程的崛起,以及 Google 对于一个人人都能构建软件、无需编码经验的世界的愿景。
标题:代理时代:Logan Kilpatrick 谈 AI Studio 与构建的未来