torchgeo:用于多光谱地理空间和遥感数据深度学习的 PyTorch 领域库

torchgeo:用于多光谱地理空间和遥感数据深度学习的 PyTorch 领域库

它解决了什么问题

TorchGeo 简化了将深度学习应用于地理空间数据的过程。它针对遥感影像的挑战提供解决方案,这类影像在不同卫星和传感器之间常常在光谱波段、空间分辨率和坐标参考系(CRS)上存在差异。

工作原理

TorchGeo 充当一个 PyTorch 领域库(类似于 torchvision),提供针对地理空间数据的专用工具:

  • 地理空间数据集 & 采样器:它允许用户使用交集(&)和并集(|)运算符组合多个数据集,自动处理重投影以匹配 CRS 和分辨率。它还包括采样器(如 RandomPatchSampler),通过提取小块来处理超大图像以进行训练。
  • 基准数据集:提供可直接使用的数据集,适用于图像分类、语义分割和目标检测等常见任务。
  • 预训练权重:提供在多光谱传感器(例如 Sentinel-2)上预训练的模型,超越标准的 RGB ImageNet 权重,更适合遥感数据。
  • Lightning 集成:提供 PyTorch Lightning 数据模块和训练器,减少样板代码并确保实验的可复现性。

适用人群

  • 机器学习专家:希望在不需要深入遥感专业知识的情况下处理地理空间数据。
  • 遥感专家:希望为其数据探索机器学习解决方案。

亮点

  • 自动 CRS/分辨率处理:在合并数据集时自动确保坐标参考系和分辨率匹配。
  • 多光谱支持:首个支持多种多光谱传感器预训练权重的库。
  • 灵活的数据集组合:使用集合运算符合并或交叉图像和标签数据集。
  • C‑Line 接口:通过 LightningCLI 支持基于配置的命令行训练实验。

Sources