pyod: 一個具備多模態數據代理工作流的全面異常檢測庫

pyod: 一個具備多模態數據代理工作流的全面異常檢測庫

它解決了什麼問題

PyOD 是一個旨在檢測數據集中離群值和異常值的全面 Python 庫。它為各種檢測算法提供了一個統一的 API,允許用戶輕鬆地在不同方法之間切換,以找到最適合其特定數據的最有效方法。

它是如何運作的

PyOD 提供三層使用方式:

  1. Classic API:對於已經知道想要使用哪種特定檢測器的用戶,提供標準的 fit/predict 接口。
  2. ADEngine:一個編排核心,會自動為用戶選擇、比較並評估檢測器。
  3. Agentic Investigation:一個 AI 驅動的層,透過 od-expert 技能(適用於 Claude Code/Codex)或適用於其他 LLM 相容代理的 MCP 服務器來將自然語言請求轉換為工作流。

對象是誰

它適用於數據科學家、研究人員和 AI 工程師,這些用戶需要對多種數據模態進行異常檢測,包括表格、時間序列、圖、文本、圖像和音頻數據。

重點亮點

  • Multi-Modal Support:包含 61 種檢測器,涵蓋表格、時間序列、圖、文本、圖像和音頻數據。
  • Agentic Workflows:透過 MCP 和 od-expert 技能與 LLM 代理集成,透過對話來驅動調查。
  • Scale and Adoption:超過 4600 萬次下載,並被 Walmart 和歐洲太空總署等組織使用。
  • Comprehensive Benchmarking:由 ADBench、TSB-AD 和 BOND 等基準測試支持。
  • High Performance:基於 SUOD 進行並行訓練,並利用 numba JIT 來加速。

Sources