ArcGIS Pro 深度学习模型训练完整指南

ArcGIS Pro 深度学习模型训练完整指南

ArcGIS Pro 深度学习模型训练完整指南

A Comprehensive Guide to Training Deep Learning Models in ArcGIS Pro
A Comprehensive Guide to Training Deep Learning Models in ArcGIS Pro

ArcGIS Pro 提供强大的深度学习模型训练功能,支持高级地理空间分析和图像处理。本指南详细概述了流程、参数和可用的模型架构。

核心功能围绕“训练深度学习模型”工具展开。此工具需要输入训练数据,这些数据需组织到包含图像切片、标签和相关统计信息的文件夹中。这些数据必须使用“导出深度学习训练数据”工具进行预处理,以确保所有输入文件夹中元数据格式(分类图块、标记图块、多标记图块、Pascal Visual Object Classes、RCNN masks 或 CycleGAN)和波段计数一致。满足这些条件后,支持多个输入文件夹。

一个关键参数是“模型类型”,它决定了用于训练的基础架构。ArcGIS Pro 支持各种预配置模型,每种模型都针对特定任务进行了优化:

  • 像素分类:BDCN 边缘检测器、变化检测器、ClimaX、ConnectNet、DeepLabV3、HED 边缘检测器、MMSegmentation、多任务道路提取器、PSETAE、金字塔场景解析网络和 U-Net。这些模型非常适合土地覆盖分类、变化检测和道路网络提取等任务。
  • 目标检测:DETReg、FasterRCNN、MaskRCNN、MMDetection、RetinaNet、RTDetrV2、单次检测器和 YOLOv3。这些模型适用于识别和定位图像中的物体,例如建筑物或车辆。
  • 目标跟踪:Deep Sort 和 Siam Mask。这些模型通过视频序列跟踪物体。
  • 图像转换:CycleGAN、图像字幕生成器、Pix2Pix、Pix2PixHD 和超分辨率。这些模型执行图像到图像转换(例如,将卫星图像转换为地图)和图像增强(超分辨率)等任务。
  • 全景分割:MaX-DeepLab。此模型同时执行语义分割(对每个像素进行分类)和实例分割(识别单个物体)。

其他参数提供了对训练过程的细粒度控制。“最大迭代次数”决定训练迭代次数。“批量大小”控制同时处理的样本数量,影响性能和内存使用。“学习率”调整模型更新速度。“主干模型”参数允许迁移学习,利用预训练模型(ResNet、DenseNet、VGG 等)来加速训练并提高准确性。可以使用 Esri 模型定义文件 (.emd) 或深度学习包文件 (.dlpk) 指定预训练模型。仅支持微调使用 ArcGIS 训练的模型。

该工具还支持各种优化技术。“验证百分比”设置用于模型验证的数据比例。“模型停止改进时停止”启用提前停止,防止过拟合。“冻结模型”允许冻结预训练模型的主干层,保留预训练权重。“数据增强”人工扩展训练数据集,提高模型鲁棒性。这可以使用默认设置、无增强或自定义参数来配置,以控制旋转、亮度、对比度和缩放等变换。

高级选项包括指定图像裁剪的“切片大小”、“调整大小”用于图像大小调整,“权重初始化方案”用于多光谱数据处理,“监控指标”(验证损失、平均精度、准确率等)用于检查点和提前停止,以及“启用 Tensorboard”用于实时监控训练过程(支持部分模型类型)。

该工具的输出是经过训练的深度学习模型文件,可在 ArcGIS Pro 中部署以进行进一步分析。

Read the English version (阅读英文版)

免责声明:本文内容来自互联网公开信息,请仔细甄别,如有侵权请联系我们删除。