告别“标签粘连”!BDSNet:首个面向集群红外小目标的半自动标注框架

发布时间:2026/6/25 13:37:43
告别“标签粘连”!BDSNet:首个面向集群红外小目标的半自动标注框架 原文信息Tuntun Wang, Jincheng Zhou, Shuai Yuan, Shunchao Guo, Yuxin Jing. “Separate and Conquer: Cluster Infrared Small Target Label Generation With Boundary and Direction Sensitivity.” IEEE Transactions on Geoscience and Remote Sensing, 2026.代码已开源https://github.com/wangtuntun/BDSNet1. 痛点集群场景下人工标注成本太高现有方法“粘成一团”红外小目标检测在无人机集群监控、海上搜救等场景中至关重要。但现有深度学习方法严重依赖像素级全标注掩码标注成本极高。更棘手的是当目标以集群形式密集出现时目标尺寸极小、间距极近、边缘高度模糊现有标签生成方法如EDGSP、LESPS、PAL、MCGC等极易产生标签粘连多个目标被合并成一个连通区域导致下游检测模型无法准确区分邻近目标。为此作者团队提出了BDSNet这是首个专门为集群红外小目标设计的标签生成框架。它仅需用户提供点标注在目标上点击一下就能自动生成高质量的像素级掩码且能有效避免粘连。2. 核心思想“先分后治” 边界与方向双管齐下BDSNet的核心理念可以概括为先分后治Separate and Conquer。既然集群内目标容易粘连那就先通过空间划分把每个目标的“地盘”圈定好再在每个子区域内独立生长最后进行形状精修。基于这个思路BDSNet设计了两个级联模块BRD模块边界约束区域划分负责“分地盘”生成非重叠的粗糙标签。MDP模块多方向感知负责“精修形状”把粗糙的圆形标签修正为符合真实目标形状的多边形。3. BRD模块如何用Voronoi图“圈地盘”解决粘连问题BRD模块解决的核心问题是点标注 → 掩码的扩张过程中如何不让相邻目标的扩张区域相互重叠作者的思路很巧妙先聚类再分区最后膨胀。Step 1聚类先分群基于点标注的坐标利用密度聚类DBSCAN将属于同一集群的点聚为一类得到多个独立的点簇。Step 2动态Voronoi图划分分区传统做法是直接对整个图像做Voronoi划分。但作者发现直接划分会导致外围目标区域被过度扩张边界约束失效。因此作者提出DVDD动态Voronoi图划分对每个聚类计算其外接矩形并基于簇内目标间距动态向外填充一个边界宽度。在这个紧凑的外接边界内构建Voronoi图为每个点分配一个独立的、紧凑的子区域。这样每个目标都被限制在一个“格子”里从根源上杜绝了标签粘连。Step 3高斯平滑点→面在每个子区域内以点标注为中心进行高斯加权距离变换再经过归一化和平滑得到初始的粗糙圆形伪标签。4. MDP模块用“多方向感知”修正目标形状BRD生成的标签是圆形的但真实目标往往是沿某一方向拉伸的椭圆或不规则形状。MDP模块的任务就是从灰度图中提取目标的真实方向特征把圆形修正为正确的形状。4.1 自适应特征提取AFE传统Gabor滤波器能提取方向特征但依赖人工预设参数无法自适应。作者提出卷积-Gabor融合策略用四个固定方向0,45,90,135的Gabor核生成方向注意力图。将注意力图与可学习的卷积权重逐元素相乘让网络自适应地调整各方向的响应强度。通过Canny边缘检测自适应计算Gabor滤波器的尺度参数 σ_θ。4.2 自适应融合AF从多个方向提取的特征如何融合传统做法是直接拼接Concat但忽略了方向间的协同效应。作者引入部分信息分解PID理论将多方向信息分解为三类独特信息每个方向独有的特征。协同信息多个方向共同提供的增益。冗余信息多个方向重复的部分。然后根据协同信息与冗余信息的差异计算动态融合权重w_θ​最终加权融合得到更准确的方向感知特征。5. 损失函数既要“不粘连”又要“形状对”为了引导模型学习作者设计了两项专用损失函数方向感知边界损失L_DAB​计算预测边缘与真实边缘之间的豪斯多夫距离迫使模型沿正确方向调整形状。重叠损失L_O​显式惩罚不同目标预测掩码之间的重叠面积进一步强化防粘连能力。6. 实验结果IoU提升至88.29%近乎零虚警作者在DenseSIRST集群场景和SIRST3稀疏场景两个数据集上进行了全面评估。关键结论IRSTLG方法对比表IBDSNet在DenseSIRST上以88.29% IoU、89.36% F1、99.85% 检测率、仅0.71% 虚警率全面超越现有方法包括之前最好的EDGSP81.27% IoU。下游检测任务验证表II用BDSNet生成的伪标签训练主流IRSTD模型如SCTransNet平均IoU达到67.67%仅比用全标注训练的模型68.56%低0.89%。这说明BDSNet生成的伪标签质量已接近人工精细标注。消融实验表IIIBRD模块单独带来12.56% IoU提升MDP模块单独带来8.53% IoU提升两者结合后达到最佳。这证明了“先分地盘”“后修形状”的设计是有效的。可视化对比BDSNet生成的伪标签边界清晰、无粘连与Ground Truth高度吻合。相比之下COM、MCGC、EDGSP等方法均出现不同程度的粘连或形状失真。7. 总结与启发BDSNet的贡献可以概括为三点首个面向集群红外小目标的标签生成框架弥补了该领域的数据标注空白。先分后治的策略通过BRD模块的空间划分从根本上解决标签粘连问题。多方向感知与PID融合使形状修正更精确生成接近人工质量的伪标签。对研究者的启发当数据标注成本高昂时可以借鉴BDSNet的思路用点标注半自动生成替代全标注。“先分后治”的策略对于其他密集目标标注任务如细胞分割、遥感目标检测也有参考价值。