torchgeo: 多スペクトル地理空間およびリモートセンシングデータを用いたディープラーニングのための PyTorch ドメインライブラリ

torchgeo: 多スペクトル地理空間およびリモートセンシングデータを用いたディープラーニングのための PyTorch ドメインライブラリ

何を解決するか

TorchGeo は、地理空間データへのディープラーニングの適用プロセスを簡素化します。リモートセンシング画像は、衛星やセンサーによってスペクトルバンド、空間解像度、および座標参照系 (CRS) が異なることが多いため、それらを扱う際の課題に対処します。

仕組み

TorchGeo は、地理空間データに特化したツールを提供する PyTorch ドメインライブラリ (torchvision と同様) として機能します。

  • 地理空間データセット & サンプラー: 集合演算 (& および |) を使用して複数のデータセットを組み合わせることができ、一致する CRS と解像度への自動的な再投影を処理します。また、非常に大きな画像を扱うために、トレーニング用の小さなパッチを抽出するサンプラー (例: RandomPatchSampler) を含んでいます。
  • ベンチマークデータセット: 画像分類、セマンティックセグメンテーション、および物体検出などの一般的なタスク向けの、すぐに使えるデータセットを提供します。
  • 学習済み重み: 標準的な RGB ImageNet の重みを超え、リモートセンシングデータにより適した、多スペクトルセンサー (例: Sentinel-2) で事前学習されたモデルを提供します。
  • Lightning 統合: PyTorch Lightning の datamodules および trainers を提供し、ボイラープレートコードを削減し、実験の再現性を確保します。

対象ユーザー

  • 機械学習のエキスパート: リモートセンシングに関する深い専門知識を必要とせずに、地理空間データを扱いたいと考えている方。
  • リモートセンシングのエキスパート: 自身のデータに対して機械学習ソリューションを探索したいと考えている方。

ハイライト

  • CRS/解像度の自動処理: データセットを組み合わせる際に、座標参照系と解像度の一致を自動的に保証します。
  • マルチスペクトル対応: さまざまな多スペクトルセンサーの学習済み重みをサポートする初のライブラリです。
  • 柔軟なデータセット構成: 集合のような演算子を使用して、画像データセットとラベルデータセットをマージまたは交差させることができます。
  • C-Line インターフェース: 設定ベースの実験を行うための LightningCLI を介したコマンドライントレーニングをサポートしています。

Sources