人工智能 - AI科研编程读书笔记

【人工智能】ISPRS Vaihingen & Potsdam数据集在GeoSeg框架遥感图像语义分割领域的拆分方法

本文详细说明了ISPRS Vaihingen和Potsdam遥感数据集在GeoSeg框架中的处理流程。对于Vaihingen数据集需分别从三个特定ZIP压缩包提取训练/测试图像与掩膜，通过vaihingen_patch_split.py脚本切分...

SmallBamboo12个月前

17251620

本文介绍了FreqFusion.py代码的研究，该代码主要用于频率感知特征融合，旨在通过结合高频和低频信息来改进特征的类内一致性和边界清晰度。FreqFusion类是该模块的核心，包含自适应低通滤波器（A...

SmallBamboo9个月前

063410

论文作者提出了GlobalMamba模型，通过全局图像序列化方法捕捉图像的频域信息，解决现有视觉Mamba模型忽略图像二维结构和全局信息的问题。首先通过离散余弦变换（DCT）将图像转换到频域，并将频...

SmallBamboo1年前

061315

我总结了论文的混淆矩阵计算方法及其相关评估指标，包括准确率、精确率、召回率和F1分数等。通过Python代码实现了多分类场景下各项指标的计算，并详细解释了宏平均和微平均的区别。该方法适用于...

SmallBamboo1年前

049212

我总结了UNet++论文，该论文发表在MICCAI会议上，引用量高达6895次。UNet++通过改进传统U-Net架构，引入了嵌套密集跳跃连接和深度监督，显著提高了医学图像分割的精度。实验结果显示，UNet++在...

SmallBamboo1年前

04865

本文探讨了Vision Transformer（ViT）和Swin Transformer在图像识别领域的应用与创新。ViT通过将图像划分为16x16的块，并利用Transformer编码器进行全局信息建模，在大规模图像分类任务中表现出...

SmallBamboo1年前

24659