pyod: 멀티모달 데이터를 위한 에이전트 워크플로우를 갖춘 종합적인 이상 탐지 라이브러리

pyod: 멀티모달 데이터를 위한 에이전트 워크플로우를 갖춘 종합적인 이상 탐지 라이브러리

해결하는 문제

PyOD는 데이터셋에서 이상치와 이상 징후를 탐지하도록 설계된 종합적인 Python 라이브러리입니다. 다양한 탐지 알고리즘에 대해 통일된 API를 제공하여 사용자가 특정 데이터에 가장 효과적인 방법을 찾기 위해 서로 다른 방법 간을 쉽게 전환할 수 있도록 합니다.

작동 방식

PyOD는 세 가지 계층의 사용 방식을 제공합니다:

  1. Classic API: 이미 어떤 특정 탐지기를 사용하고 싶은지 알고 있는 사용자를 위한 표준 fit/predict 인터페이스.
  2. ADEngine: 사용자를 위해 탐지기를 자동으로 선택, 비교 및 평가하는 오케스트레이션 코어.
  3. Agentic Investigation: 자연어 요청이 od-expert 스킬(Claude Code/Codex용) 또는 다른 LLM 호환 에이전트를 위한 MCP 서버를 통해 워크플로우로 변환되는 AI 기반 계층.

대상 사용자

표 형식, 시계열, 그래프, 텍스트, 이미지 및 오디오 데이터를 포함한 여러 데이터 모달리티에 걸쳐 이상 탐지를 수행해야 하는 데이터 과학자, 연구원 및 AI 엔지니어를 대상으로 합니다.

주요 특징

  • 멀티모달 지원: 표 형식, 시계열, 그래프, 텍스트, 이미지 및 오디오 데이터를 다루는 61개의 탐지기를 포함합니다.
  • 에이전트 워크플로우: MCP 및 od-expert 스킬을 통해 LLM 에이전트와 통합되어 대화를 통해 조사를 수행합니다.
  • 규모 및 채택: 4,600만 회 이상의 다운로드 수를 기록했으며 Walmart 및 유럽 우주국(European Space Agency)과 같은 조직에서 활용되고 있습니다.
  • 종합적인 벤치마킹: ADBench, TSB-AD 및 BOND와 같은 벤치마크를 지원합니다.
  • 고성능: 병렬 학습을 위해 SUOD를 기반으로 구축되었으며 속도 향상을 위해 numba JIT를 활용합니다.

Sources