pyod: 一個具備多模態數據代理工作流的全面異常檢測庫
pyod: 一個具備多模態數據代理工作流的全面異常檢測庫
它解決了什麼問題
PyOD 是一個旨在檢測數據集中離群值和異常值的全面 Python 庫。它為各種檢測算法提供了一個統一的 API,允許用戶輕鬆地在不同方法之間切換,以找到最適合其特定數據的最有效方法。
它是如何運作的
PyOD 提供三層使用方式:
- Classic API:對於已經知道想要使用哪種特定檢測器的用戶,提供標準的
fit/predict接口。 - ADEngine:一個編排核心,會自動為用戶選擇、比較並評估檢測器。
- Agentic Investigation:一個 AI 驅動的層,透過
od-expert技能(適用於 Claude Code/Codex)或適用於其他 LLM 相容代理的 MCP 服務器來將自然語言請求轉換為工作流。
對象是誰
它適用於數據科學家、研究人員和 AI 工程師,這些用戶需要對多種數據模態進行異常檢測,包括表格、時間序列、圖、文本、圖像和音頻數據。
重點亮點
- Multi-Modal Support:包含 61 種檢測器,涵蓋表格、時間序列、圖、文本、圖像和音頻數據。
- Agentic Workflows:透過 MCP 和
od-expert技能與 LLM 代理集成,透過對話來驅動調查。 - Scale and Adoption:超過 4600 萬次下載,並被 Walmart 和歐洲太空總署等組織使用。
- Comprehensive Benchmarking:由 ADBench、TSB-AD 和 BOND 等基準測試支持。
- High Performance:基於 SUOD 進行並行訓練,並利用 numba JIT 來加速。
Sources
- undefinedyzhao062/pyod