排序
【人工智能】ISPRS Vaihingen & Potsdam数据集在GeoSeg框架遥感图像语义分割领域的拆分方法
本文详细说明了ISPRS Vaihingen和Potsdam遥感数据集在GeoSeg框架中的处理流程。对于Vaihingen数据集需分别从三个特定ZIP压缩包提取训练/测试图像与掩膜,通过vaihingen_patch_split.py脚本切分...
【人工智能】GlobalMamba: 用于Vision Mamba的全局图像序列化
论文作者提出了GlobalMamba模型,通过全局图像序列化方法捕捉图像的频域信息,解决现有视觉Mamba模型忽略图像二维结构和全局信息的问题。首先通过离散余弦变换(DCT)将图像转换到频域,并将频...
【人工智能】关于FreqFusion.py官方代码的研究(修正版)
本文介绍了FreqFusion.py代码的研究,该代码主要用于频率感知特征融合,旨在通过结合高频和低频信息来改进特征的类内一致性和边界清晰度。FreqFusion类是该模块的核心,包含自适应低通滤波器(A...
【人工智能】【Python】混淆矩阵的各项指标计算
我总结了论文的混淆矩阵计算方法及其相关评估指标,包括准确率、精确率、召回率和F1分数等。通过Python代码实现了多分类场景下各项指标的计算,并详细解释了宏平均和微平均的区别。该方法适用于...
【人工智能】UNet++:嵌套的U-Net架构用于医学图像分割
我总结了UNet++论文,该论文发表在MICCAI会议上,引用量高达6895次。UNet++通过改进传统U-Net架构,引入了嵌套密集跳跃连接和深度监督,显著提高了医学图像分割的精度。实验结果显示,UNet++在...
【人工智能】Vision Transformer和Swin Transformer
本文探讨了Vision Transformer(ViT)和Swin Transformer在图像识别领域的应用与创新。ViT通过将图像划分为16x16的块,并利用Transformer编码器进行全局信息建模,在大规模图像分类任务中表现出...