![图片[1] - AI科研 编程 读书笔记 - 【人工智能】ISPRS Vaihingen & Potsdam数据集在GeoSeg框架遥感图像语义分割领域的拆分方法 - AI科研 编程 读书笔记 - 小竹の笔记本](https://img.smallbamboo.cn/i/2024/11/29/674989040c67c.png)
下载完成数据集后解压出来,寻找下面分割方法中需要的压缩文件。明确在UNetFormer原论文中,作者所用的训练和测试图片的id。如下图所示:
![图片[2] - AI科研 编程 读书笔记 - 【人工智能】ISPRS Vaihingen & Potsdam数据集在GeoSeg框架遥感图像语义分割领域的拆分方法 - AI科研 编程 读书笔记 - 小竹の笔记本](https://img.smallbamboo.cn/i/2025/03/31/67e9e47c90e99.png)
Vaihingen:Vaihingen数据集包含33幅超高空间分辨率的TOP图像块,平均尺寸为2494×2064像素。每幅TOP图像块有3个多光谱波段(近红外、红、绿),以及数字表面模型(DSM)和归一化数字表面模型(NDSM),其地面采样距离(GSD)为9厘米。该数据集包含5个前景类别(不透水面、建筑物、低植被、树木、汽车)和1个背景类别(杂波)。在我们的实验中,仅使用了TOP图像块,未使用DSM和NDSM。我们采用ID为2、4、6、8、10、12、14、16、20、22、24、27、29、31、33、35、38的图像块作为测试集,ID为30的作为验证集,其余15幅图像作为训练集。图像块被裁剪为1024×1024像素的补丁。
Potsdam:Potsdam数据集包含38幅超高空间分辨率的TOP图像块(地面采样距离为5厘米),尺寸为6000×6000像素,包含与Vaihingen数据集相同的类别信息。该数据集提供4个多光谱波段(红、绿、蓝、近红外)以及DSM和NDSM。我们采用ID为2_13、2_14、3_13、3_14、4_13、4_14、4_15、5_13、5_14、5_15、6_13、6_14、6_15、7_13的图像块作为测试集,ID为2_10的作为验证集,其余22幅图像(剔除标注有误的7_10)作为训练集。同样,实验中仅使用3个波段(红、绿、蓝),原始图像块被裁剪为1024×1024像素的补丁。
这里新增了验证集,此前GeoSeg的config和dataset两个文件中验证集都是直接使用了测试集,会造成数据泄露,不符合规范。如果您还希望按照旧版的方式进行分割,请参考上方旧版图片的图片ID进行操作。下面的分割教程是最新版的,按照最新版分割后不要忘记在模型的config文件修改验证集的路径。
Vaihingen数据集分割方法
所用文件包括ISPRS_semantic_labeling_Vaihingen.zip、ISPRS_semantic_labeling_Vaihingen_ground_truth_COMPLETE.zip、ISPRS_semantic_labeling_Vaihingen_ground_truth_eroded_COMPLETE.zip。
数据分配方面,训练集的train_images是从ISPRS_semantic_labeling_Vaihingen.zip的top文件夹里,选取除ID为2、4、6、8、10、12、14、16、20、22、24、27、29、31、33、35、38(测试集)以及ID为30(验证集)之外的15幅图像对应的文件;train_masks则从ISPRS_semantic_labeling_Vaihingen.zip的gts_for_participants文件夹获取与上述train_images对应的掩码文件。
验证集的val_images是从ISPRS_semantic_labeling_Vaihingen.zip的top文件夹中选择ID为30的图像文件;val_masks从ISPRS_semantic_labeling_Vaihingen_ground_truth_COMPLETE.zip里选择ID为30的掩码文件;val_masks_eroded从ISPRS_semantic_labeling_Vaihingen_ground_truth_eroded_COMPLETE.zip中选择ID为30的掩码侵蚀文件。
测试集的test_images从ISPRS_semantic_labeling_Vaihingen.zip的top文件夹里选择ID为2、4、6、8、10、12、14、16、20、22、24、27、29、31、33、35、38的图像文件;test_masks从ISPRS_semantic_labeling_Vaihingen_ground_truth_COMPLETE.zip中选择ID为2、4、6、8、10、12、14、16、20、22、24、27、29、31、33、35、38的掩码文件;test_masks_eroded从ISPRS_semantic_labeling_Vaihingen_ground_truth_eroded_COMPLETE.zip中选择ID为2、4、6、8、10、12、14、16、20、22、24、27、29、31、33、35、38的掩码侵蚀文件。
数据切割使用vaihingen_patch_split.py脚本将上述图像块裁剪为1024×1024像素的补丁。
Potsdam数据集分割方法
所用文件有2_Ortho_RGB.zip、5_Labels_all.zip、5_Labels_for_all_no_Boundary.zip。
数据分配上,训练集的train_images是从2_Ortho_RGB.zip中,选择除ID为2_13、2_14、3_13、3_14、4_13、4_14、4_15、5_13、5_14、5_15、6_13、6_14、6_15、7_13(测试集)以及ID为2_10(验证集)之外的22幅图像(剔除标注有误的7_10)对应的文件;train_masks从5_Labels_all.zip中获取与上述train_images对应的掩码文件。
验证集的val_images从2_Ortho_RGB.zip中选择ID为2_10的图像文件;val_masks从5_Labels_all.zip里选择ID为2_10的掩码文件;val_masks_eroded从5_Labels_for_all_no_Boundary.zip中选择ID为2_10的掩码侵蚀文件。
测试集的test_images从2_Ortho_RGB.zip中选择ID为2_13、2_14、3_13、3_14、4_13、4_14、4_15、5_13、5_14、5_15、6_13、6_14、6_15、7_13的图像文件;test_masks从5_Labels_all.zip中选择ID为2_13、2_14、3_13、3_14、4_13、4_14、4_15、5_13、5_14、5_15、6_13、6_14、6_15、7_13的掩码文件;test_masks_eroded从5_Labels_for_all_no_Boundary.zip中选择ID为2_13、2_14、3_13、3_14、4_13、4_14、4_15、5_13、5_14、5_15、6_13、6_14、6_15、7_13的掩码侵蚀文件。
数据切割使用potsdam_patch_split.py脚本将上述图像块裁剪为1024×1024像素的补丁。
分割脚本的具体命令和目录结构请查看GeoSeg框架readme:https://github.com/WangLibo1995/GeoSeg
下面我直接提供分割好的数据集,如需可直接下载。
2. 论文总结类文章中涉及的图表、数据等素材,版权归原出版商及论文作者所有,仅为学术交流目的引用;若相关权利人认为存在侵权,请联系本网站删除,联系方式:i@smallbamboo.cn。
3. 违反上述声明者,将依法追究其相关法律责任。
- 最新
- 最热
查看全部