代理時代:Logan Kilpatrick 談 AI Studio 與未來的建構

代理時代:Logan Kilpatrick 談 AI Studio 與未來的建構

從提示到代理工程的轉變

AI 代理的時代已經到來,從理論炒作轉向在 Google 生態系統中的實際交付。 這一轉變的特徵是從簡單的「提示 → 原型」工作流程,走向「代理工程」,在此過程中 AI 不僅僅是建議程式碼,而是主動構建、部署並迭代功能性應用程式。

Vibe Coding 與 Build 分頁

AI Studio 已演進為透過其 Build 分頁提供「vibe coding」體驗。這讓使用者能在數分鐘內從提示轉為可運作的應用程式——包括資料庫整合與透過 Cloud Run 部署。主要新功能包括:

  • 設計預覽: 使用者在初始生成階段即可看到多個 UI 迭代,並選擇自己偏好的方向。
  • 「我很走運」按鈕: 透過產生與 Google 生態系統相連的初始應用點子,解決「靈感問題」。
  • Tap Tap 分頁: 使用 Gemini Flash 的 AI 自動完成,協助使用者生成性地擴展與表述提示。
  • Yapta App: 以語音驅動的提示體驗,Gemini 將不連貫的口語想法轉化為可執行、具體的計畫供模型執行。

「雄心」心態的轉變

隨著模型變得更強大,創作的瓶頸已從技術能力轉向人類的雄心。Logan Kilpatrick 指出,使用者不再需要極度精確以避免模型失敗;相反地,他們可以一次提出數十項需求。這為建構者帶來新的責任——構思更具雄心的專案,因為技術執行已變得可行。

擴大建構者生態系統

AI 正在民主化軟體創作,將非程式設計師轉變為建構者,同時提升對專業開發者的整體需求。 透過降低入門門檻,Google 旨在將創造具經濟賦能軟體的機會分配給全球受眾。

「開發者」的新定義

AI Studio 同時是非程式設計師的「建構者產品」與專業人士的「開發者產品」。這種雙重身份讓缺乏前端專長的開發者能快速打造精緻介面,而專業工程師則透過合作模式維持高品質的生產標準。在此模型中,「vibe coders」提出變更,技術人員確保 CI/CD 流程通過且程式碼具可擴展性,然後再合併至核心程式庫。

行動與裝置端 AI

Google 正致力於將 AI Studio 帶到行動平台,以觸及不使用桌面的下一代建構者。這包括探索裝置端模型(如 Gemma),使 AI Studio 能在行動裝置上本地運作。

多模態能力與即時互動

多模態理解是進階生成與即時代理行為的基礎。 模型即時「看、聽、說」的能力正改變使用者與實體及數位世界的互動方式。

Gemini Live 與 Project Astra

Gemini Live(以及其前身 Project Astra)支援音訊、影片與文字的即時串流。這讓「無所不在」的使用情境成為可能,例如:

  • 螢幕共享代理: 代理能看到使用者的螢幕,並即時指導其操作複雜的軟體介面。
  • 實體世界協助: 使用相機辨識損壞的家電或複雜機械(如高階咖啡機),提供逐步的維修或操作說明。

Gen Media 作品集

Google 的多模態策略包含一系列專門模型:Nano Banana、Lyria 以及各種 TTS(文字轉語音)模型。最終目標是將這些客製化能力整合至主線 Gemini 模型,以降低複雜度,同時在影像與音訊上保持高推理能力。

代理與基礎建設的未來

AI 的下一個前沿是長時間運行的代理,以及將 AI 融入每個基礎產品。 產業正朝向能自主運作數天或數週的代理,而非僅限於數小時。

Deep Research 與 Interactions API

Google 最近透過 Interactions API 更新了 Deep Research API(包括「Max」版本)。此框架將模型與代理視為一等公民,允許開發者在 Gemini API 內自行建立代理。這為未來每個產品(如 Gmail 或 Search)皆具代理化奠定基礎。

基礎建設挑戰與 TPU

儘管在 TPU 基礎建設上投入巨資(包括提供 3 倍推論效能的新架構),AI 代幣需求仍持續超過供給。這種「成功致死」的情況將迫使使用者與企業更有意識地將代幣投入最高價值的使用案例,而非將 AI 套用於所有可能的任務。

機器人與未來 12‑18 個月

機器人被視為另一種模態。隨著新模型內嵌的智慧,Google 正與 Boston Dynamics 等組織合作,解決過去阻礙機器人的邊緣案例,預計在未來一年內取得重大突破。


摘要:Logan Kilpatrick 討論了 AI Studio 向「vibe coding」平台的演進、代理工程的崛起,以及 Google 的願景——讓任何人都能在不具備程式設計經驗的情況下建構軟體。

標題:代理時代:Logan Kilpatrick 談 AI Studio 與未來的建構

Sources