news 2025/12/24 12:12:35

Boosting Few-shot Fine-grained Recognition with Background Suppression and Foreground Alignment

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Boosting Few-shot Fine-grained Recognition with Background Suppression and Foreground Alignment

通过背景抑制和前景对齐促进少样本细粒度识别

摘要

小样本学习和细粒度识别的主要挑战有以下两个方面:首先,缺乏标记样本使得学习到的模型容易过拟合。其次,它还受到背景差异以及数据集的类间差异较小,类内差异较大的影响。为了解决这一具有挑战性的任务,我们提出了一个两阶段背景抑制和前景对齐框架,该框架由背景激活抑制 (BAS)模块、前景对象对齐 (FOA)模块和局部到局部 (L2L)相似性度量组成。具体而言,引入 BAS 模块生成前景掩膜进行定位,以减弱背景干扰,增强优势前景目标。接着FOA模板根据每个支持样本对查询样本的校正重建每个支持样本的特征映射,解决了支持 -查询图像对之间的不对齐问题。为了使所提出的方法能够捕获混淆样本中的细微差异,我们提出了一种新的 L2L 相似性度量,以进一步测量嵌入空间中一对对齐空间特征之间的局部相似性。

核心任务

少样本细粒度识别(FS-FGR):在少样本学习(仅提供少量标记样本)的设置下,识别属于同一超类下的多个细粒度子类(例如不同种类的鸟类、犬类、汽车型号等),需同时克服少样本学习的过拟合问题和细粒度识别的类内方差大、类间差异小的挑战。

不足与创新点:

创新点

  1. 两阶段框架:文章提出了一个两阶段的背景抑制和前景对齐框架,包括背景激活抑制(BAS)模块和前景对象对齐(FOA)模块。这一创新设计旨在分别处理背景干扰和支持-查询样本之间的错位问题。背景激活抑制(BAS)模块:BAS模块生成前景掩码进行定位,以减弱背景干扰并增强主要前景对象,从而提高模型在处理细粒度样本时的鲁棒性。前景对象对齐(FOA)模块:FOA模块根据支持样本与查询样本的匹配关系重建特征图,解决支持-查询图像对之间的错位问题。这有助于提高模型在少样本情况下的对齐能力。
  2. 局部到局部(L2L)相似度度量:提出了一种新的L2L相似度度量方法,用于进一步衡量嵌入空间中对齐局部特征之间的相似性,以捕捉细微差别。
  3. 双重相似性推断:为了提高模型的鲁棒性,文章同时使用原始图像和精细化图像推断特征图的成对相似性。这种双重相似性推断方法可以更好地处理背景干扰问题。

不足之处

  1. 模型复杂性:虽然提出的框架在性能上有所提升,但增加了模型的复杂性,可能导致计算和存储开销的增加。在实际应用中,这可能会限制模型的部署和使用。
  2. 数据集依赖:尽管在多个流行的细粒度基准数据集上进行了广泛实验,但在更大规模和更多样化的数据集上的泛化性能尚未得到验证。特别是,实际应用中的数据分布可能与实验数据集存在显著差异。
  3. 背景生成和对齐准确性:尽管提出了BAS和FOA模块,但生成的前景掩码和特征图的对齐准确性可能会受到一些噪声和异常值的影响,从而影响整体性能。
  4. 没有彻底消除对标注的依赖:尽管方法中没有直接依赖手动标注的边界框(bounding boxes),但这种方法仍然间接地依赖于高质量的初始训练数据。如果初始数据中的噪声较多,可能会影响模型的训练效果。

小样本细粒度的主要挑战:背景差异,以及横向观察类间差异较小,类内差异较大。

研究动机

  1. 背景干扰问题:细粒度图像中,不同子类可能具有相似背景(如不同鸟类均处于天空、草地背景),这些背景会掩盖子类间的细微差异,影响识别准确性。虽然人工标注边界框可去除背景,但违背了少样本学习 “减少标注负担” 的初衷。
  2. 前景错位问题:同一细粒度子类的对象可能存在姿态、视角、位置等差异,导致支持样本与查询样本的前景特征在嵌入空间中错位,无法有效匹配局部 discriminative 特征。
  3. 现有方法缺陷:现有 FS-FGR 方法多依赖全局特征或复杂注意力机制,要么无法捕捉局部细微差异,要么引入过多参数导致效率低下,且未同时解决背景干扰和前景错位问题。

框架模型:

细化阶段的输入由基于原始阶段输入的背景激活抑制模块生成。两个阶段具有相同的结构,除了全局分类器外,所有参数都是共享的。每个阶段由一个前景对象对齐 (FOA) 模块、一个全局分类器和一个基于 L2L 的相似性比较器组成.

整体模型框架通过组合BAS、FOA和L2L相似度度量,提供了一个系统化的方法来处理少样本细粒度识别中的关键挑战。具体来说,BAS模块负责减弱背景干扰,FOA模块解决特征对齐问题,L2L相似度度量提高了对细微特征差异的捕捉能力,而双重相似性推断则进一步增强了模型的鲁棒性。

全局分类损失(GCCL)的计算流程

  • 约束 BAS 模块:通过优化 “原始特征→优化特征” 的分类损失,强迫 BAS 模块生成 “前景更准确、背景干扰更少” 的优化图像 —— 如果 BAS 的前景定位不准,优化特征的分类损失会变大,从而反向调整 BAS 的掩码生成逻辑;
  • 辅助注意力擦除:注意力擦除后,模型需要用 “不完整的原始特征” 做分类,这会强迫模型关注前景的更多区域(而不是只依赖局部特征),提升前景特征的完整性;
  • 补充局部损失:和之前的 L2L 局部损失配合,既保证 “局部特征能精准匹配细粒度差异”,又保证 “全局特征能稳定区分不同类别”,让模型学习更鲁棒的特征。

这是背景激活抑制(BAS)模块的执行步骤,核心是 “自动定位前景并生成优化图像”,无需人工标注边界框:

  1. 输入特征图(Feature Maps):从原始图像(比如蜂鸟图)提取的多通道特征图;
  2. 生成激活图(Activation Map):对特征图做通道级聚合,得到 “激活图”—— 图中颜色越亮的区域,代表特征响应越强(对应前景对象);
  3. 生成前景掩码(Mask):通过阈值筛选激活图,把低响应的背景区域抑制(设为 0),保留高响应的前景区域(设为 1),得到前景掩码;
  4. 生成优化图像(Refined Image):用前景掩码在原始图像上框出前景边界框(Bounding Box),裁剪并放大前景区域,最终得到 “去除背景干扰的优化图像”。

注意力擦除图。在第二阶段,为了鼓励网络最小化整个图像的背景激活和整体激活的比例,在输入到全局分类器之前擦除激活高于阈值的原始特征区域,这有助于探索前景的整个范围。核心是 “避免模型过度聚焦局部特征,强迫学习完整前景”

这是 BAS 模块中辅助提升前景完整性的策略,核心是 “避免模型过度聚焦局部特征,强迫学习完整前景”:

  1. 通道级聚合 + 生成激活图:和 BAS 模块一样,先从原始图像提取特征,生成激活图;
  2. 生成擦除掩码(Erase Mask):对激活图设一个高阈值(比如最大激活值的 85%),把激活值超过阈值的区域标记为 “要擦除的区域”,得到擦除掩码;
  3. 特征擦除:用擦除掩码和原始特征图做空间级相乘(Spatial-wise Multiplication),把原始特征中 “过度激活的局部区域” 擦除;
  4. 输出优化特征:擦除后的特征图再输入全局分类器,强迫模型去关注前景的其他区域,从而学习到更完整的前景特征。

1.前景对象对齐(FOA)模块

  • 目标:解决支持样本与查询样本之间的错位问题,确保特征对齐。
  • 机制:FOA模块根据支持样本与查询样本的匹配关系,重建支持样本的特征图,以对齐查询样本的特征图。
  • 输入特征:原始的支持特征(\(F_s\),黄色块)和查询特征(\(F_q\),蓝色块)—— 此时二者的前景特征(比如图中绿色 / 蓝色小方块)因姿态差异,在特征图中的位置是错位的;
  • 计算语义相关矩阵:通过计算支持特征与查询特征的局部语义相似度,生成 “语义相关矩阵”(图中网格)—— 矩阵中每个位置的数值代表支持特征块与查询特征块的匹配程度;
  • 特征对齐:用这个相关矩阵对支持特征做空间变换(矩阵相乘),将支持特征中与查询特征匹配的区域 “移动” 到对应位置;
  • 输出对齐后的支持特征:得到与查询特征空间对齐的支持特征(\(F_{s|q}\)),此时二者的前景特征在特征图中位置一致,避免了错位。

2.局部到局部(L2L)相似度度量

  • 目标:进一步衡量嵌入空间中对齐局部特征之间的相似性,以捕捉细微差别。
  • 机制:L2L相似度度量方法通过比较对齐后的局部特征,提高模型识别细粒度差异的能力。
  • 输入对齐后的特征:FOA 模块输出的 “对齐后支持特征”(\(F_{s|q}\),黄色块)和查询特征(\(F_q\),蓝色块)—— 此时二者的前景特征已在空间上对齐;
  • 逐元素计算余弦相似度:对对齐后的支持特征和查询特征,按 “局部特征块”(图中黄色 / 蓝色小方块)逐点计算余弦相似度(图中红色块代表 cos 计算);
  • 生成相似度图:所有局部特征块的相似度结果组成 “相似度图”,最终的总相似度是这些局部相似度的总和。

总结:

通过经验揭示了显著提高小样本任务性能的两个关键点,一是减弱背景干扰,二是对准前景响应。提出的少样本细粒度识别方法通过引入背景激活抑制、前景对象对齐、局部到局部相似度度量和双重相似性推断机制,显著提高了少样本细粒度分类任务的性能。实验结果验证了方法的有效性和普适性,为少样本细粒度识别领域提供了新的思路和解决方案。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2025/12/23 8:22:33

搭建你的第一个“私有知识库” (RAG)

最近 AI 圈子里最火的技术莫过于 RAG (检索增强生成)。简单说,就是给大模型“外挂”一个你的私人资料库,让它能回答你公司内部文档、个人笔记里的问题。 市面上很多 RAG 工具都要收费,或者部署起来像修核电站一样复杂。 今天,我给…

作者头像 李华
网站建设 2025/12/24 2:37:37

13、Unix 系统磁盘管理与安全定位脚本实用指南

Unix 系统磁盘管理与安全定位脚本实用指南 在 Unix 和 Linux 系统中,磁盘管理和文件查找是系统管理员日常工作中的重要任务。本文将介绍几个实用的脚本,帮助你更高效地管理磁盘空间、监控磁盘使用情况以及安全地查找文件。 磁盘配额监控脚本 首先,我们来看看磁盘配额监控…

作者头像 李华
网站建设 2025/12/21 14:09:07

15、系统管理脚本实用指南

系统管理脚本实用指南 在Unix或Linux系统管理中,shell脚本是非常实用的工具。下面将详细介绍几个实用的系统管理脚本。 1. 环境验证脚本(validator) 环境验证脚本用于检查用户环境变量的有效性。以下是脚本代码: if [ ! -d ${HOME:?"You need to have your HOME…

作者头像 李华
网站建设 2025/12/22 4:31:40

怎么选一款适合大面积清洁的多功能全自动洗地机呢?

理解多功能全自动洗地机的优势在如今快节奏的生活里,我们越来越需要高效的清洁工具。多功能全自动洗地机就像是清洁工作的小帮手,不仅能快速完成常规的清理,还能提供多种功能,让打扫变得更加简单。例如,MN-V86驾驶式洗…

作者头像 李华
网站建设 2025/12/24 2:11:22

教培行业新媒体运营困境凸显!这款软件或成转型制胜法宝?

随着数字化时代的来临,教培行业的竞争格局发生了巨大变化。新媒体运营成为了教培机构提升品牌知名度、获取客户的重要手段。然而,许多教培机构在新媒体运营过程中却遭遇了重重困境,如何突破这些困境,实现数字化转型,成…

作者头像 李华