torchgeo: 다중 스펙트럼 지형 공간 및 원격 탐사 데이터를 활용한 딥러닝을 위한 PyTorch 도메인 라이브러리

torchgeo: 다중 스펙트럼 지형 공간 및 원격 탐사 데이터를 활용한 딥러닝을 위한 PyTorch 도메인 라이브러리

해결하는 문제

TorchGeo는 지형 공간 데이터에 딥러닝을 적용하는 과정을 단순화합니다. 이는 서로 다른 위성 및 센서에 따라 스펙트럼 밴드, 공간 해상도 및 좌표 참조 시스템(CRS)이 자주 달라지는 원격 탐사 이미지 작업의 어려움을 해결합니다.

작동 방식

TorchGeo는 지형 공간 데이터를 위한 전문화된 도구를 제공하는 PyTorch 도메인 라이브러리(torchvision과 유사)로 작동합니다:

  • 지형 공간 데이터셋 및 샘플러: 교집합(&) 및 합집합(|) 연산자를 사용하여 여러 데이터셋을 결합할 수 있게 해주며, 일치하는 CRS 및 해상도로의 재투영을 자동으로 처리합니다. 또한 학습을 위해 작은 패치를 추출하여 매우 큰 이미지를 처리할 수 있는 샘플러(RandomPatchSampler와 같은)를 포함합니다.
  • 벤치마크 데이터셋: 이미지 분류, 의미론적 분할(semantic segmentation) 및 객체 탐지(object detection)와 같은 일반적인 작업에 바로 사용할 수 있는 데이터셋을 제공합니다.
  • 사전 학습된 가중치: 표준 RGB ImageNet 가중치를 넘어 원격 탐사 데이터에 더 적합하도록 다중 스펙트럼 센서(예: Sentinel-2)에서 사전 학습된 모델을 제공합니다.
  • Lightning 통합: 보일러플레이트 코드를 줄이고 실험의 재현성을 보장하기 위해 PyTorch Lightning datamodules 및 trainers를 제공합니다.

대상 사용자

  • 머신러닝 전문가: 원격 탐사에 대한 깊은 전문 지식 없이도 지형 공간 데이터를 다루고자 하는 전문가.
  • 원격 탐사 전문가: 자신의 데이터를 위해 머신러닝 솔루션을 탐구하고자 하는 전문가.

주요 특징

  • 자동 CRS/해상도 처리: 데이터셋을 결합할 때 일치하는 좌표 참조 시스템과 해상도를 자동으로 보장합니다.
  • 다중 스펙트럼 지원: 다양한 다중 스펙트럼 센서에 대한 사전 학습된 가중치를 지원하는 최초의 라이브러리입니다.
  • 유연한 데이터셋 구성: 집합과 유사한 연산자를 사용하여 이미지 및 레이블 데이터셋을 병합하거나 교집합을 구합니다.
  • C-Line 인터페이스: 구성 기반 실험을 위해 LightningCLI를 통한 명령줄 학습을 지원합니다.

Sources