torchgeo: 多スペクトル地理空間およびリモートセンシングデータを用いたディープラーニングのための PyTorch ドメインライブラリ
torchgeo: 多スペクトル地理空間およびリモートセンシングデータを用いたディープラーニングのための PyTorch ドメインライブラリ
何を解決するか
TorchGeo は、地理空間データへのディープラーニングの適用プロセスを簡素化します。リモートセンシング画像は、衛星やセンサーによってスペクトルバンド、空間解像度、および座標参照系 (CRS) が異なることが多いため、それらを扱う際の課題に対処します。
仕組み
TorchGeo は、地理空間データに特化したツールを提供する PyTorch ドメインライブラリ (torchvision と同様) として機能します。
- 地理空間データセット & サンプラー: 集合演算 (
&および|) を使用して複数のデータセットを組み合わせることができ、一致する CRS と解像度への自動的な再投影を処理します。また、非常に大きな画像を扱うために、トレーニング用の小さなパッチを抽出するサンプラー (例:RandomPatchSampler) を含んでいます。 - ベンチマークデータセット: 画像分類、セマンティックセグメンテーション、および物体検出などの一般的なタスク向けの、すぐに使えるデータセットを提供します。
- 学習済み重み: 標準的な RGB ImageNet の重みを超え、リモートセンシングデータにより適した、多スペクトルセンサー (例:
Sentinel-2) で事前学習されたモデルを提供します。 - Lightning 統合: PyTorch Lightning の datamodules および trainers を提供し、ボイラープレートコードを削減し、実験の再現性を確保します。
対象ユーザー
- 機械学習のエキスパート: リモートセンシングに関する深い専門知識を必要とせずに、地理空間データを扱いたいと考えている方。
- リモートセンシングのエキスパート: 自身のデータに対して機械学習ソリューションを探索したいと考えている方。
ハイライト
- CRS/解像度の自動処理: データセットを組み合わせる際に、座標参照系と解像度の一致を自動的に保証します。
- マルチスペクトル対応: さまざまな多スペクトルセンサーの学習済み重みをサポートする初のライブラリです。
- 柔軟なデータセット構成: 集合のような演算子を使用して、画像データセットとラベルデータセットをマージまたは交差させることができます。
- C-Line インターフェース: 設定ベースの実験を行うための LightningCLI を介したコマンドライントレーニングをサポートしています。
Sources
- undefinedtorchgeo/torchgeo