基于锚框的目标检测:
在图像中随机生成很多个锚框,首先预测锚框内是否含有目标
然后预测锚框与目标真实的边缘框的偏移
生成锚框后,通过IoU(交并比)来计算两个框之间的相似度,0表示无重叠,1表示重合
IoU=Area(A∩B)/Area(A∪B)
简单说:IoU 是 “两个框重叠部分的面积” 占 “两个框整体覆盖面积” 的比例
赋予锚框标号:
每个锚框是一个训练样本,将每个锚框,要么标注成背景,要么关联上一个真实边缘框(IoU最大的那个)
非极大值抑制(NMS)输出:其作用是解决 “同一目标被多个锚框重复预测” 的问题
- 前置基础:目标检测中每个 “锚框”(预设的候选框)会预测一个边界框,但同一目标会被多个锚框覆盖,产生大量重叠框;
- 选最优框:在所有非背景类的预测框中,选择置信度最高的框作为 “基准框”;
- 剔除重叠框:计算其他框与基准框的IoU(交并比),去掉 IoU 大于阈值
θ(通常取 0.5~0.7)的框(这些框是对同一目标的重复预测); - 循环筛选:对剩余框重复 “选最高置信度框→剔除重叠框” 的步骤,直到所有框要么被选中,要么被剔除。