Claude 設計代理架構:垂直 AI 代理的 6 種模式
Claude 設計代理架構:垂直 AI 代理的 6 種模式
Claude 設計不僅僅是大型語言模型的包裝器;它是一個複雜的垂直代理應用,使用特定的架構模式堆疊來實現高品質、專業的結果。雖然針對 Claude 3.7 Opus 進行了最佳化,但系統的核心力量在於六種代理模式的結合,這些模式可套用於任何垂直代理,例如法律、銷售或醫療應用。
1. 代理上下文落地
代理絕不能盲目產生內容;它們必須先在使用者的特定資料上落地。
Claude 設計透過在生成開始前要求建立詳細的設計系統來實現此點。此系統包含通用的品牌上下文、特定的顏色、字體,以及可重複使用的元件(如按鈕與卡片)的 HTML 程式碼。
與傳統的 RAG(檢索增強生成)只是在系統提示中注入上下文不同,Claude 設計使用「漸進式揭露」。代理會根據手頭的具體任務,動態決定要閱讀設計系統的哪些部分並將其帶入上下文視窗。
2. 結構化記憶
垂直代理的第一個輸出應該是結構化的記憶產物,而非面向使用者的交付物。
在上下文落地的基礎上,Claude 設計建立品牌與專案目標的持久記憶。此記憶以簡單、可攜帶的格式(如 Markdown、HTML 或 CSS)儲存,而非專有結構。
先將原始使用者資料重構為記憶產物,之後的生成會更快、更精確,因為代理擁有一個穩定、可重用的參考點,可在多個專案間使用。
3. 迭代精煉迴圈(多模態)
避免將所有互動都強迫通過聊天機器人;允許模型根據輸出自行產生輸入控制。
Claude 設計超越聊天介面,採用五種不同的輸入模式:
- 聊天與語音: 標準對話輸入。
- DOM 選取: 滑鼠懸停並選取特定元素以描述變更。
- 視覺塗鴉: 直接在螢幕上繪圖以提供編輯指示。
- 自動截圖: 代理對自己的輸出截圖以進行分析。
此外,模型會以 token 形式生成自己的 UI 元件(如滑桿或按鈕),由包裝層負責渲染。這讓使用者體驗更自然——例如,銷售代理可以產生「侵略性滑桿」讓使用者調整郵件語氣,而不必手動輸入指令。
4. 自我 QA 與反思迴圈
代理應在向人類使用者展示之前,使用視覺模型渲染並批評自己的作品。
在交付最終結果前,Claude 設計會渲染輸出、截圖,並將該影像回饋給視覺模型進行批評。代理會持續迭代設計,直到視覺輸出符合預期目標。此模式依賴 Opus 4.7 等模型提升的視覺能力,雖然耗用較多 token,卻顯著提升最終輸出的品質。
5. 多變體生成
主動產生多個解決方案版本,以顯示高層決策並降低不確定性。
Claude 設計不只提供單一答案,而是生成多種版面的、結構的或顏色的變體。這迫使代理先確定「決策層級」(例如先決定版面再決定字體)。
在其他垂直領域,這意味著找出主要的變化軸——如銷售中的「溫暖 vs. 直接」語氣——並提前提供選項。這通常比詢問澄清問題更有效,因為它給予使用者具體的起點以作回應。
6. 移交模式
確保代理的輸出以開放格式儲存,以便無縫移交給其他代理或專業工具。
Claude 設計避免使用專有格式,主要以 HTML 與 CSS 儲存資料。這使系統能將結果匯出至各種外部工具,包括:
- Claude Code(代理對代理的移交)
- Figma、Canva、PowerPoint 與 PDF(工具移交)
使用 JSON、Markdown 與 HTML 等開放格式,可確保輸出在不同模型與生態系統間保持可攜性。
結論:模式結合的力量
Claude 設計的質的差異來自於這六種模式的協同作用。最關鍵的突破是 上下文落地 與 結構化記憶 的結合,這取代了需要龐大、靜態系統提示的做法,轉而使用動態、由代理管理的上下文系統。先建立自己的記憶,再以此為基礎生成,代理即可達到大多數當前企業 AI 部署所缺乏的精準度與可靠性。
Sources
- undefinedHow Claude's Design Agents Work