目标检测中的非极大值抑制(NMS)算法 - 文章 - 开发者社区

点击上方蓝字关注我们

picture.image

导读

picture.image

经典的Anchor-Based目标检测算法(YOLO、SSD、Faster-RCNN)中都包含一个生成候选边界框的过程，出于提高目标检测召回率的目的，通常会生成数量众多的候选边界框，这些候选边界框有不同的长宽比，同时每个候选边界框都会被分配一个置信度分数。在目标检测的后处理阶段，可以先通过阈值过滤掉大部分置信度低于阈值的候选边界框，但是对于同一个目标，还是有可能会有好几个置信度高于阈值的边界框会留下来，这时候就需要通过非极大值抑制(Non-Max Suppression， NMS)算法来去掉重复的边界框。下图展示了目标检测算法中从生成候选边界框到用NMS算法筛选边界框的过程。

picture.image

NMS算法的原理

picture.image

由于目标在图像中的形状和大小可能是各种各样的，所以为了能够较好地在图像中检测这些目标，通常会设计去生成数量众多、长宽各异的候选边界框。但是对于一个目标检测任务来说，理想的情况是一个目标只需输出一个最准确的边界框即可。

picture.image

为了从多个候选边界框中选择一个最佳边界框，通常会使用非极大值抑制(NMS)算法，这种算法用于“抑制”置信度低的边界框并只保留置信度最高的边界框。

NMS算法的伪代码如下：

picture.image

算法的实现过程为：

输入：候选边界框集合B(每个候选框都有一个置信度)、IoU阈值N

输出：最终的边界框集合D(初始为空集合)

对集合B根据置信度进行降序排序；
从集合B中选择第一个候选框(置信度最高)，把它放入集合D中并从集合B中删除；
遍历集合B中的每个候选框，计算它们与D集合中这个候选框的IoU值。如果IoU值大于阈值N，则把它从集合B中删除；
重复步骤2~3直到集合B为空。

下图展示了NMS算法的过程及效果：

picture.image

从NMS算法的原理，可以比较容易想到该算法的缺点：

仅依据边界框的置信度评价边界框的质量好坏，但是在目标检测任务中需要的是能准确框出目标的边界框，而边界框的置信度与其是否框得准确这二者之间并没有强相关，可能会出现框的更准但置信度低的边界框被其他置信度更高但框不准的边界框抑制掉；
如果目标之间出现大面积重叠，目标A边界框的置信度大于目标B边界框的置信度，它们之间的IoU大于阈值，那么目标B的边界框就会被抑制，导致目标B被漏检。

picture.image