pyod: 一个适用于多模态数据的、带有智能体工作流的全面异常检测库
pyod: 一个适用于多模态数据的、带有智能体工作流的全面异常检测库
它解决了什么问题
PyOD 是一个全面的 Python 库,旨在检测数据集中的离群点和异常值。它为各种检测算法提供了一个统一的 API,允许用户轻松地在不同方法之间切换,从而为他们特定的数据找到最有效的方法。
它是如何工作的
PyOD 提供三个层级的用法:
- Classic API: 对于已经知道想要使用哪种特定检测器的用户,提供标准的
fit/predict接口。 - ADEngine: 一个编排核心,可以自动为用户选择、比较和评估检测器。
- Agentic Investigation: 一个 AI 驱动的层,通过
od-expert技能(适用于 Claude Code/Codex)或用于其他 LLM 兼容智能体的 MCP 服务器,将自然语言请求转换为工作流。
它是为谁准备的
它适用于需要对多种数据模态进行异常检测的数据科学家、研究人员和 AI 工程师,包括表格、时间序列、图、文本、图像和音频数据。
亮点
- 多模态支持: 包括 61 个检测器,涵盖表格、时间序列、图、文本、图像和音频数据。
- 智能体工作流: 通过 MCP 和
od-expert技能与 LLM 智能体集成,通过对话驱动调查。 - 规模与采用: 超过 4600 万次下载,并被 Walmart 和欧洲航天局等机构使用。
- 全面的基准测试: 由 ADBench、TSB-AD 和 BOND 等基准测试支持。
- 高性能: 基于 SUOD 进行并行训练,并利用 numba JIT 进行加速。
Sources
- undefinedyzhao062/pyod