pyod: マルチモーダルデータ向けのエージェント型ワークフローを備えた包括的な異常検知ライブラリ

pyod: マルチモーダルデータ向けのエージェント型ワークフローを備えた包括的な異常検知ライブラリ

何を解決するか

PyODは、データセット内の外れ値や異常を検知するために設計された包括的なPythonライブラリです。幅広い検知アルゴリズムに対して統一されたAPIを提供し、ユーザーが特定のデータに対して最も効果的な手法を簡単に切り替えられるようにします。

仕組み

PyODは、3つのレイヤーの利用方法を提供します:

  1. Classic API: すでに使用したい特定の検知器(detector)を知っているユーザー向けの、標準的な fit/predict インターフェース。
  2. ADEngine: ユーザーに代わって検知器を自動的に選択、比較、および評価するオーケストレーション・コア。
  3. Agentic Investigation: 自然言語のリクエストを、od-expert スキル(Claude Code/Codex用)または他のLLM互換エージェント用のMCPサーバーを介してワークフローに変換する、AI駆動型のレイヤー。

対象ユーザー

表形式、時系列、グラフ、テキスト、画像、および音声データを含む、複数のデータモダリティにわたって異常検知を行う必要があるデータサイエンティスト、研究者、およびAIエンジニアを対象としています。

ハイライト

  • マルチモーダル対応: 表形式、時系列、グラフ、テキスト、画像、および音声データをカバーする61種類の検知器を含みます。
  • エージェント型ワークフロー: MCPおよび od-expert スキルを介してLLMエージェントと統合し、対話を通じて調査を推進します。
  • 規模と採用実績: 4,600万回以上のダウンロードを記録し、Walmartや欧州宇宙機関(European Space Agency)などの組織に利用されています。
  • 包括的なベンチマーク: ADBench、TSB-AD、およびBONDなどのベンチマークに裏打ちされています。
  • 高性能: 並列トレーニングのためのSUODに基づいて構築されており、numba JITを使用して高速化を実現しています。

Sources