pyod: 一个适用于多模态数据的、带有智能体工作流的全面异常检测库

pyod: 一个适用于多模态数据的、带有智能体工作流的全面异常检测库

它解决了什么问题

PyOD 是一个全面的 Python 库，旨在检测数据集中的离群点和异常值。它为各种检测算法提供了一个统一的 API，允许用户轻松地在不同方法之间切换，从而为他们特定的数据找到最有效的方法。

它是如何工作的

PyOD 提供三个层级的用法：

Classic API: 对于已经知道想要使用哪种特定检测器的用户，提供标准的 fit/predict 接口。
ADEngine: 一个编排核心，可以自动为用户选择、比较和评估检测器。
Agentic Investigation: 一个 AI 驱动的层，通过 od-expert 技能（适用于 Claude Code/Codex）或用于其他 LLM 兼容智能体的 MCP 服务器，将自然语言请求转换为工作流。

它是为谁准备的

它适用于需要对多种数据模态进行异常检测的数据科学家、研究人员和 AI 工程师，包括表格、时间序列、图、文本、图像和音频数据。

亮点

多模态支持: 包括 61 个检测器，涵盖表格、时间序列、图、文本、图像和音频数据。
智能体工作流: 通过 MCP 和 od-expert 技能与 LLM 智能体集成，通过对话驱动调查。
规模与采用: 超过 4600 万次下载，并被 Walmart 和欧洲航天局等机构使用。
全面的基准测试: 由 ADBench、TSB-AD 和 BOND 等基准测试支持。
高性能: 基于 SUOD 进行并行训练，并利用 numba JIT 进行加速。

Sources

undefinedyzhao062/pyod