语义分割领域最近的研究太务实了!不管是医疗、遥感这些刚需场景,还是数据稀缺、遮挡干扰这些经典难题,都有针对性的硬核解决方案出炉~
医疗场景里,内存增强型SAM3搞定手术器械遮挡分割,白癜风、视网膜血管分割精度直奔90%+;遥感领域靠面向任务的扩散生成,解决标注数据不足问题。更关键的是泛化能力大升级,因果调优、频域对齐技术打破领域壁垒,恶劣天气下分割精度显著提升。
还有少样本3D零件分割、无真值模型评估这些前沿方向也有新突破。今天精选的顶会级论文,覆盖医疗、遥感、3D等核心场景,全是可落地、有深度的干货,搞语义分割的别错过!
1.Memory-Enhanced SAM3 for Occlusion-Robust Surgical Instrument Segmentation
【要点】在内窥镜视频中准确分割手术器械对于计算机辅助干预至关重要,但由于频繁的遮挡、快速运动、镜面伪影和长期器械重新进入等问题,这一任务仍然具有挑战性。
【方法】提出了一种名为ReMeDI-SAM3的无需训练的记忆增强SAM3扩展,通过三个组件来解决这些限制:相关性感知内存过滤、遮挡感知内存存储预遮挡帧、分段插值方案扩展有效内存容量以及基于特征的重新识别模块和时间投票进行可靠的遮挡后身份去歧义。
【实验】 在EndoVis17和EndoVis18数据集上进行的零样本设置评估显示,与原始SAM3相比,ReMeDI-SAM3的绝对mcIoU分别提高了约7%和16%,甚至优于先前基于训练的方法。
2.Task-Oriented Data Synthesis and Control-Rectify Sampling for Remote Sensing Semantic Segmentation
【要点】针对遥感(RS)语义分割任务中,语义掩码控制和采样质量的不确定性限制了合成数据的有效性。
【方法】提出了一种任务导向的数据合成框架(TODSynth),包括一个具有统一三重注意力的多模态扩散变换器(MM-DiT)和由任务反馈指导的即插即用采样策略。
【实验】通过实验证明,该方法在遥感语义分割数据合成中,特别是在少样本和复杂场景下,显著提高了合成数据的有效性,并且优于现有的可控生成方法,产生了更稳定和任务导向的合成数据。
3.Adaptive Frequency Domain Alignment Network for Medical image segmentation
【要点】论文旨在解决医疗图像分割中高质量标注数据稀缺的问题,这一问题源于手动标注的耗时和劳动密集性。
【方法】论文提出了一种名为自适应频率域对齐网络(AFDAN)的新型域适应框架,通过在频率域对齐特征来缓解数据稀缺问题。AFDAN集成了三个核心组件:对抗域学习模块、源-目标频率融合模块和空间-频率集成模块,以实现鲁棒的跨域知识迁移。
【实验】广泛的实验表明,AFDAN在医疗图像分割任务上取得了显著的性能提升,实现了90.9的交并比(IoU)。
4.In search of truth: Evaluating concordance of AI-based anatomy segmentation models
【要点】难以在缺乏真实标注数据集的情况下评估功能相似的AI解剖分割模型。
【方法】提出了一种将分割结果统一到标准、可互操作表示的框架,以实现结构的一致性术语标注,并扩展了3D Slicer以简化这些统一分割的加载和比较。
【实验】该框架在自动化加载、结构化检查和跨模型比较方面显示出实用性,初步结果表明该方法在快速检测和审查问题结果方面具有实际效用。比较结果显示,某些结构(如肺部)的分割效果良好,但并非所有结构(如某些模型的椎骨或肋骨分割)都有效。