【人工智能】ISPRS Vaihingen & Potsdam数据集在GeoSeg框架遥感图像语义分割领域的拆分方法 - AI科研编程读书笔记

Vaihingen和Potsdam数据集官方页面

下载完成数据集后解压出来，寻找下面分割方法中需要的压缩文件。明确在UNetFormer原论文中，作者所用的训练和测试图片的id。如下图所示：

注意！此图为arxiv上的旧版论文

勘误！新版论文对于这两个数据集的叙述如下：

Vaihingen：Vaihingen数据集包含33幅超高空间分辨率的TOP图像块，平均尺寸为2494×2064像素。每幅TOP图像块有3个多光谱波段（近红外、红、绿），以及数字表面模型（DSM）和归一化数字表面模型（NDSM），其地面采样距离（GSD）为9厘米。该数据集包含5个前景类别（不透水面、建筑物、低植被、树木、汽车）和1个背景类别（杂波）。在我们的实验中，仅使用了TOP图像块，未使用DSM和NDSM。我们采用ID为2、4、6、8、10、12、14、16、20、22、24、27、29、31、33、35、38的图像块作为测试集，ID为30的作为验证集，其余15幅图像作为训练集。图像块被裁剪为1024×1024像素的补丁。

Potsdam：Potsdam数据集包含38幅超高空间分辨率的TOP图像块（地面采样距离为5厘米），尺寸为6000×6000像素，包含与Vaihingen数据集相同的类别信息。该数据集提供4个多光谱波段（红、绿、蓝、近红外）以及DSM和NDSM。我们采用ID为2_13、2_14、3_13、3_14、4_13、4_14、4_15、5_13、5_14、5_15、6_13、6_14、6_15、7_13的图像块作为测试集，ID为2_10的作为验证集，其余22幅图像（剔除标注有误的7_10）作为训练集。同样，实验中仅使用3个波段（红、绿、蓝），原始图像块被裁剪为1024×1024像素的补丁。

这里新增了验证集，此前GeoSeg的config和dataset两个文件中验证集都是直接使用了测试集，会造成数据泄露，不符合规范。如果您还希望按照旧版的方式进行分割，请参考上方旧版图片的图片ID进行操作。下面的分割教程是最新版的，按照最新版分割后不要忘记在模型的config文件修改验证集的路径。

Vaihingen数据集分割方法

所用文件包括ISPRS_semantic_labeling_Vaihingen.zip、ISPRS_semantic_labeling_Vaihingen_ground_truth_COMPLETE.zip、ISPRS_semantic_labeling_Vaihingen_ground_truth_eroded_COMPLETE.zip。

数据分配方面，训练集的train_images是从ISPRS_semantic_labeling_Vaihingen.zip的top文件夹里，选取除ID为2、4、6、8、10、12、14、16、20、22、24、27、29、31、33、35、38（测试集）以及ID为30（验证集）之外的15幅图像对应的文件；train_masks则从ISPRS_semantic_labeling_Vaihingen.zip的gts_for_participants文件夹获取与上述train_images对应的掩码文件。

验证集的val_images是从ISPRS_semantic_labeling_Vaihingen.zip的top文件夹中选择ID为30的图像文件；val_masks从ISPRS_semantic_labeling_Vaihingen_ground_truth_COMPLETE.zip里选择ID为30的掩码文件；val_masks_eroded从ISPRS_semantic_labeling_Vaihingen_ground_truth_eroded_COMPLETE.zip中选择ID为30的掩码侵蚀文件。

测试集的test_images从ISPRS_semantic_labeling_Vaihingen.zip的top文件夹里选择ID为2、4、6、8、10、12、14、16、20、22、24、27、29、31、33、35、38的图像文件；test_masks从ISPRS_semantic_labeling_Vaihingen_ground_truth_COMPLETE.zip中选择ID为2、4、6、8、10、12、14、16、20、22、24、27、29、31、33、35、38的掩码文件；test_masks_eroded从ISPRS_semantic_labeling_Vaihingen_ground_truth_eroded_COMPLETE.zip中选择ID为2、4、6、8、10、12、14、16、20、22、24、27、29、31、33、35、38的掩码侵蚀文件。

数据切割使用vaihingen_patch_split.py脚本将上述图像块裁剪为1024×1024像素的补丁。

Potsdam数据集分割方法

所用文件有2_Ortho_RGB.zip、5_Labels_all.zip、5_Labels_for_all_no_Boundary.zip。

数据分配上，训练集的train_images是从2_Ortho_RGB.zip中，选择除ID为2_13、2_14、3_13、3_14、4_13、4_14、4_15、5_13、5_14、5_15、6_13、6_14、6_15、7_13（测试集）以及ID为2_10（验证集）之外的22幅图像（剔除标注有误的7_10）对应的文件；train_masks从5_Labels_all.zip中获取与上述train_images对应的掩码文件。

验证集的val_images从2_Ortho_RGB.zip中选择ID为2_10的图像文件；val_masks从5_Labels_all.zip里选择ID为2_10的掩码文件；val_masks_eroded从5_Labels_for_all_no_Boundary.zip中选择ID为2_10的掩码侵蚀文件。

测试集的test_images从2_Ortho_RGB.zip中选择ID为2_13、2_14、3_13、3_14、4_13、4_14、4_15、5_13、5_14、5_15、6_13、6_14、6_15、7_13的图像文件；test_masks从5_Labels_all.zip中选择ID为2_13、2_14、3_13、3_14、4_13、4_14、4_15、5_13、5_14、5_15、6_13、6_14、6_15、7_13的掩码文件；test_masks_eroded从5_Labels_for_all_no_Boundary.zip中选择ID为2_13、2_14、3_13、3_14、4_13、4_14、4_15、5_13、5_14、5_15、6_13、6_14、6_15、7_13的掩码侵蚀文件。

数据切割使用potsdam_patch_split.py脚本将上述图像块裁剪为1024×1024像素的补丁。

分割脚本的具体命令和目录结构请查看GeoSeg框架readme：https://github.com/WangLibo1995/GeoSeg

下面是我分割好的数据集，提供有验证集和无验证集两个版本，解压后修改路径配置即可直接使用，同时包含LoveDA已分好的数据集，夸克网盘+天翼云盘+123云盘（APP端不限速），感谢支持！

此处内容已隐藏，请付费后查看

1. 除特殊说明外，本网站所有原创文章的版权归作者所有，未经授权，禁止以任何形式（包括但不限于转载、摘编、复制、镜像等）发布至任何平台。
2. 论文总结类文章中涉及的图表、数据等素材，版权归原出版商及论文作者所有，仅为学术交流目的引用；若相关权利人认为存在侵权，请联系本网站删除，联系方式：i@smallbamboo.cn。
3. 违反上述声明者，将依法追究其相关法律责任。

THE END

人工智能

评论共17条

请登录后发表评论

登录注册

查看全部

- SmallBamboo作者1
  LoveDA数据集官方并没有提供测试集的标签内容，测试只能到竞赛平台获取结果，但是竞赛平台近期测试队列拥堵，可靠性差。官方代码中本地测试LoveDA数据集用的是--val参数，也就是在验证集上测试。
  4个月前河南省南阳市回复
- SmallBamboo作者0
  注意，本文适用于基于GeoSeg的训练测试框架
  10个月前回复
- SmallBamboo作者0
  你看geoseg仓库config里面数据集的设置：train_dataset = LoveDATrainDataset(transform=train_aug, data_root='data/LoveDA/train_val')。作者用的train和val合并后作为训练，作者这样来设置，怎么设置看各自情况吧
  1个月前@用户16904462回复
- SmallBamboo作者0
  注意运行命令时的参数，要加--val才能当作本地验证模式，而不是改路径，LoveDA不用改路径
  1个月前河南省南阳市@用户16904462回复
- SmallBamboo作者0
  关于GeoSeg框架本身的问题请您在GitHub仓库发issue联系作者哈
  1个月前@用户16904462回复
- SmallBamboo作者0
  可以按照旧版，毕竟您看的都是按旧版，这样对比起来的话较为公平
  2个月前河南省南阳市@用户39247147回复
- SmallBamboo作者0
  在这里哦：https://www.sciencedirect.com/science/article/abs/pii/S0924271622001654。我指的旧论文是作者在Arxiv预发表的。
  2个月前河南省南阳市@用户39247147回复
- SmallBamboo作者0
  请参照geoseg仓库中分割脚本的默认设置哈
  2个月前河南省南阳市@用户25362271回复
- SmallBamboo作者0
  对的，将readme中提供的分割测试集的代码改成验证集即可。不要忘了config中修改一下验证集的目录，我看默认验证集直接用了测试集。
  4个月前河南省南阳市@MengleiLiu回复