ax: それが何であるか、解決する問題、そして注目を集めている理由

ax: それが何であるか、解決する問題、そして注目を集めている理由

解決すること

Ax は、LLM アプリケーションを構築するための統一された言語非依存のプログラミングモデルを提供します。手動でのプロンプトエンジニアリングの必要性を排除し、開発者が構造化された入力と出力(Signatures)を定義できるようにし、複数のプロバイダー(OpenAI、Anthropic、Gemini など)や複数のプログラミング言語(TypeScript、Python、Java、C++、Go、Rust)で動作させることができます。

仕組み

Ax は「semantic core」を使用し、これを各言語向けのネイティブライブラリにコンパイルします。中心となるのは Signatures で、DSL や Zod などのスキーマバリデータを用いて生成タスクの型付き構造を定義します。これらのシグネチャは、プロバイダー抽象化、ストリーミング、バリデーションを処理する軽量ランタイムによって処理されます。

より複雑な振る舞いのために、Ax は以下を提供します:

  • AxAgent: 3 段階パイプライン(distiller → executor → responder)で、再帰ランタイム(RLM)を使用し、サンドボックス化された JS 実行、メモリ、スキルを通じて長いコンテキストを管理します。
  • AxFlow: 型付きワークフローランナーで、LLM 呼び出しを DAG のノードに編成し、並列実行と状態管理を可能にします。
  • Optimizers: GEPA(マルチオブジェクティブ Pareto オプティマイザ)などのツールで、定義されたメトリクスとトレーニングセットに基づきプロンプトを自動的にチューニングします。

対象者

異なる AI プロバイダー間でポータブルであり、複数のバックエンド言語と互換性のある堅牢で型安全な LLM アプリケーションを構築する必要がある開発者向けです。

ハイライト

  • マルチ言語サポート: TypeScript、Python、Java、C++、Go、Rust 向けにコンパイルされた単一のプログラミングモデル。
  • プロバイダー非依存: コードを変更せずに OpenAI、Anthropic、Gemini、Grok、Mistral などをシームレスに切り替え可能。
  • 構造化生成: 標準スキーマ v1(Zod、Valibot、ArkType)との深い統合によりエンドツーエンドの型安全性を実現。
  • 高度なエージェントツール: サンドボックス化された JS ランタイム、ベクトルメモリリコール、スキルベースのガイダンスを組み込みでサポート。
  • マルチモーダル&オーディオ: 画像、音声、リアルタイム音声ストリームのネイティブサポート。

Summary

Typed signatures を用いたマルチ言語フレームワークで、TypeScript、Python、Java、C++、Go、Rust 向けにエージェント、フロー、プロンプト最適化の統一 API を提供します。

Title

ax: それが何であるか、解決する問題、そして注目を集めている理由

Sources