pyod: 一个适用于多模态数据的、带有智能体工作流的全面异常检测库

pyod: 一个适用于多模态数据的、带有智能体工作流的全面异常检测库

它解决了什么问题

PyOD 是一个全面的 Python 库,旨在检测数据集中的离群点和异常值。它为各种检测算法提供了一个统一的 API,允许用户轻松地在不同方法之间切换,从而为他们特定的数据找到最有效的方法。

它是如何工作的

PyOD 提供三个层级的用法:

  1. Classic API: 对于已经知道想要使用哪种特定检测器的用户,提供标准的 fit/predict 接口。
  2. ADEngine: 一个编排核心,可以自动为用户选择、比较和评估检测器。
  3. Agentic Investigation: 一个 AI 驱动的层,通过 od-expert 技能(适用于 Claude Code/Codex)或用于其他 LLM 兼容智能体的 MCP 服务器,将自然语言请求转换为工作流。

它是为谁准备的

它适用于需要对多种数据模态进行异常检测的数据科学家、研究人员和 AI 工程师,包括表格、时间序列、图、文本、图像和音频数据。

亮点

  • 多模态支持: 包括 61 个检测器,涵盖表格、时间序列、图、文本、图像和音频数据。
  • 智能体工作流: 通过 MCP 和 od-expert 技能与 LLM 智能体集成,通过对话驱动调查。
  • 规模与采用: 超过 4600 万次下载,并被 Walmart 和欧洲航天局等机构使用。
  • 全面的基准测试: 由 ADBench、TSB-AD 和 BOND 等基准测试支持。
  • 高性能: 基于 SUOD 进行并行训练,并利用 numba JIT 进行加速。

Sources