MetaClaw: 実世界の会話を通じてAIアシスタントがメタ学習し、進化することを可能にするエージェントプロキシ

解決する課題

MetaClawは、AIエージェントがデプロイ後に静的な状態のままであるという問題に対処します。オフライン学習のみに頼るのではなく、実世界の会話から継続的に学習し、進化することを可能にします。これにより、ユーザーがGPUクラスターを管理することなく、時間の経過とともにパフォーマンスを向上させ、ユーザーの好みに適応させることができます。

仕組み

MetaClawは、パーソナルエージェント（OpenClaw、CoPaw、またはNanoClawなど）とLLM APIの間の透明なプロキシとして機能します。インタラクションをインターセプトし、関連するスキルを注入し、長期的なメモリを永続化します。

モードに応じて、学習方法は異なります：

Skills Mode: 会話を短いMarkdown形式の指示（スキル）に自動的に要約し、それらを将来のプロンプトに取得して注入します。
RL Mode: ジャッジLLM（PRM）を使用して非同期にレスポンスをスコアリングし、Tinker、MinT、またはWeaverのようなクラウドベースのバックエンドを介してLoRAファインチューニングを実行します。
Auto Mode: スキルとRLを組み合わせ、スマートなスケジューラを使用して、エージェントが中断されないように、ウェイトの更新をアイドル時間（睡眠、アイドル時間、またはカレンダーの会議）に遅延させます。

対象ユーザー

ローカルのハイエンドハードウェアを必要とせずに、セッションを越えて事実、好み、プロジェクトの履歴を記憶し、進化させたいパーソナルAIエージェントのユーザー向けに設計されています。

ハイライト

One-click deployment: サポートされているパーソナルエージェントを自動的に設定するシンプルなCLIセットアップ。
Multi-agent support: OpenAI互換またはAnthropicネイティブのエンドポイントを介して、OpenClaw、CoPaw、IronClawなど、幅広いエージェントと互換性があります。
Long-term memory: セッションを越えた事実や好みを永続化し、一貫したコンテキストを提供します。
Asynchronous architecture: サービング、報酬モデリング、およびトレーニングを分離することで、使用中のレイテンシをゼロにします。
Flexible RL backends: Tinker、MinT、およびWeaverを含む複数のクラウドトレーニングプロバイダーをサポートしています。

MetaClaw: 実世界の会話を通じてAIアシスタントがメタ学習し、進化することを可能にするエージェントプロキシ

MetaClaw: 実世界の会話を通じてAIアシスタントがメタ学習し、進化することを可能にするエージェントプロキシ

解決する課題

仕組み

対象ユーザー

ハイライト

Sources