pyod: 一個具備多模態數據代理工作流的全面異常檢測庫

pyod: 一個具備多模態數據代理工作流的全面異常檢測庫

它解決了什麼問題

PyOD 是一個旨在檢測數據集中離群值和異常值的全面 Python 庫。它為各種檢測算法提供了一個統一的 API，允許用戶輕鬆地在不同方法之間切換，以找到最適合其特定數據的最有效方法。

它是如何運作的

PyOD 提供三層使用方式：

Classic API：對於已經知道想要使用哪種特定檢測器的用戶，提供標準的 fit/predict 接口。
ADEngine：一個編排核心，會自動為用戶選擇、比較並評估檢測器。
Agentic Investigation：一個 AI 驅動的層，透過 od-expert 技能（適用於 Claude Code/Codex）或適用於其他 LLM 相容代理的 MCP 服務器來將自然語言請求轉換為工作流。

對象是誰

它適用於數據科學家、研究人員和 AI 工程師，這些用戶需要對多種數據模態進行異常檢測，包括表格、時間序列、圖、文本、圖像和音頻數據。

重點亮點

Multi-Modal Support：包含 61 種檢測器，涵蓋表格、時間序列、圖、文本、圖像和音頻數據。
Agentic Workflows：透過 MCP 和 od-expert 技能與 LLM 代理集成，透過對話來驅動調查。
Scale and Adoption：超過 4600 萬次下載，並被 Walmart 和歐洲太空總署等組織使用。
Comprehensive Benchmarking：由 ADBench、TSB-AD 和 BOND 等基準測試支持。
High Performance：基於 SUOD 進行並行訓練，並利用 numba JIT 來加速。

Sources

undefinedyzhao062/pyod