ax:它是什麼、解決了什麼問題以及為何受到關注

ax:它是什麼、解決了什麼問題以及為何受到關注

它解決了什麼

Ax 提供一個統一、語言無關的程式模型,用於構建 LLM 應用程式。它消除了手動提示工程的需求,讓開發者能夠定義跨多個供應商(OpenAI、Anthropic、Gemini 等)以及多種程式語言(TypeScript、Python、Java、C++、Go、Rust)皆可使用的結構化輸入與輸出(簽名)。

它如何運作

Ax 使用一個「語意核心」編譯成各語言的原生函式庫。核心圍繞 Signatures,透過 DSL 或像 Zod 這樣的 schema 驗證器定義生成任務的型別結構。這些簽名由一個輕量執行時處理,負責供應商抽象、串流與驗證。

對於更複雜的行為,Ax 提供:

  • AxAgent:一個三階段管線(distiller → executor → responder),使用遞迴執行時(RLM)透過沙盒化的 JS 執行、記憶體與技能來管理長上下文。
  • AxFlow:一個型別化工作流程執行器,將 LLM 呼叫組織成 DAG 節點,支援平行執行與狀態管理。
  • Optimizers:如 GEPA(多目標 Pareto 優化器)等工具,能根據定義的指標與訓練集自動調整提示。

目標對象

需要構建健全、型別安全的 LLM 應用程式,且必須在不同 AI 供應商之間保持可移植,並相容多種後端語言的開發者。

重點特色

  • 多語言支援:單一程式模型可編譯至 TypeScript、Python、Java、C++、Go、Rust。
  • 供應商無關:可無縫切換 OpenAI、Anthropic、Gemini、Grok、Mistral 等供應商,無需更改程式碼。
  • 結構化生成:深度整合 Standard Schema v1(Zod、Valibot、ArkType),實現端到端型別安全。
  • 進階代理工具:內建支援沙盒化 JS 執行環境、向量記憶體召回與基於技能的指導。
  • 多模態與音訊:原生支援圖像、音訊與即時語音串流。

Sources