darts: 시계열 예측 및 이상 탐지를 위한 통합 Python 라이브러리
darts: 시계열 예측 및 이상 탐지를 위한 통합 Python 라이브러리
해결하는 문제
Darts는 시계열 예측과 이상 탐지를 단순화하기 위해 설계된 Python 라이브러리입니다. 고전적인 통계 방법부터 현대적인 딥러닝 아키텍처에 이르기까지 광범위한 모델에 대한 통합된 인터페이스를 제공하여, 사용자가 다양한 예측 접근 방식을 쉽게 전환, 결합 및 평가할 수 있도록 합니다.
작동 방식
Darts는 다양한 모델 유형 간의 일관성을 유지하기 위해 fit() 및 predict() 함수를 사용하는 scikit-learn 스타일의 API를 사용합니다. 단변량 및 다변량 시계열을 모두 지원하며, 과거에 관찰되었거나 미래에 알려진 외부 데이터(covariates)의 통합도 지원합니다. 딥러닝 모델은 PyTorch Lightning을 사용하여 구현되어 GPU/TPU 가속 및 사용자 정의 학습 루프를 가능하게 합니다. 또한 데이터 처리, 백테스팅, 그리고 데이터 계층 구조의 다양한 수준에서 예측이 일관되게 유지되도록 하는 계층적 조정(hierarchical reconciliation) 도구를 포함합니다.
대상 사용자
여러 시리즈를 포함하는 잠재적으로 대규모 데이터 세트에서 시계열 분석, 예측 및 이상 탐지를 수행해야 하는 데이터 과학자 및 ML 엔지니어를 대상으로 합니다.
주요 특징
- 통합 API: 통계 모델(예: ARIMA)과 심층 신경망(예: N-BEATS)을 위한 일관된 인터페이스.
- 다변량 및 글로벌 모델: 여러 시계열 변동 차원을 지원하며, 단일 모델을 여러 시계열에 대해 학습시킬 수 있는 기능.
- 확률적 예측: 신뢰 구간을 생성하고 매개변수 분포 또는 분위수를 추정할 수 있는 기능.
- 통합 이상 탐지: PyOD 모델을 위한 래퍼를 포함하여, 이상치 점수 산출기 및 탐지기를 위한 전용 모듈(
darts.ad). - 외부 데이터 지원: 과거 관찰 데이터, 미래 정보 데이터, 그리고 정적 공변량(static covariates) 지원.
- 확력성: 예측을 위해 scikit-learn과 호환되는 모든 모델을 플러그인으로 연결할 수 있는 기능.
- 설명 가능성: SHAP 값을 사용하여 예측 모델을 설명하는 기능 지원.
Sources
- undefinedunit8co/darts