YOLO 不止检测,从注意力机制到 Mamba 113篇论文+20+数据集+5大类改进方向,从理论到落地一应俱全!

大数据机器学习算法

最近看了不少YOLO的论文,加上前不久YOLOv13也出来了,YOLOv14更是即将出世。我就梳理了一遍YOLO各版本的技术突破,以及YOLO相关的一些热门改进思路。

这些思路我从技术本质、作用方式和场景适配性等角度做了分类(看下文5点),既能帮助论文er理清不同技术在模型改进中的定位、作用机制及关联关系,便于组织论文结构;也方便研发er快速定位技术在流程中的位置,明确各阶段的优化重点。

YOLO各版本以及每个分类都附有参考论文+开源代码,共整理了113篇,另附20+缺陷检测数据集,供大家学习。

picture.image

需要的话添加小享,回复【YOLO创新】无偿分享

picture.image

长按即可扫码添加

架构增强组件类

✅ +注意力机制

✅ +Mamba

✅ +多尺度特征融合

该类方法扩展了原始YOLO的感受野和上下文建模能力,而且这三者都可以无缝集成到检测头的改进中。

参考论文:SCCA-YOLO: A Spatial and Channel Collaborative Attention Enhanced YOLO Network for Highway Autonomous Driving Perception System

方法: 论文提出了一种基于YOLO的改进方法SCCA-YOLO,通过引入空间通道协同注意力机制,增强了目标检测的准确性和效率。同时,结合Ghost模块优化计算效率,使其更适合实际应用。

picture.image

创新点:

  • 提出了一种新的空间通道协同注意力模块,结合空间注意力和通道自注意力,提升特征表达能力。
  • 集成Ghost模块,优化网络的计算效率,降低资源消耗,增强实际部署的可行性。
  • 构建了一个针对农村公路场景的大型动物数据集,为相关研究提供了新的资源。

picture.image

模型效率优化类

✅ 轻量级YOLO

通过深度卷积拆解、知识蒸馏等压缩模型体量,适配边缘设备的实时推理需求,该类方法可以与其他技术并行应用。

参考论文:YOLO‑Granada: a lightweight attentioned Yolo for pomegranates fruit detection

方法: 论文推出轻量化YOLO-Granada算法检测石榴果实,它采用ShuffleNetv2作为骨干网络,结合CBAM注意力机制,优化了模型的计算效率和检测精度。该算法在保持高精度的同时,显著减少了模型大小和计算量,适合在低功耗设备上实时运行。

picture.image

创新点:

  • 使用轻量化的ShuffleNetv2作为骨干网络,显著降低模型大小和计算量。
  • 引入CBAM注意力机制,增强特征提取能力,优化检测精度。
  • 实现了实时检测,检测速度比原网络快17.3%,适合在资源受限的设备上运行。

picture.image

添加小享,回复【YOLO创新】

领取113篇YOLO论文代码+数据集

picture.image

长按即可扫码添加

多任务协同学习类

✅ +SAM(分割模型)

将图像分割作为辅助分支与检测任务联合训练,共享主干特征提取器。通过交叉监督增强语义理解能力,间接提升缺陷定位精度。

参考论文:Intraoperative Glioma Segmentation with YOLO + SAM for Improved Accuracy in Tumor Resection

方法: 论文创新融合YOLOv8与SAM,利用YOLOv8快速定位肿瘤,并通过SAM进行精确分割。模型在包含噪声的MRI图像上训练,实现了0.79的Dice分数,性能与现有模型相当,但推理时间更短(15到25秒),适合实时手术应用。

picture.image

创新点:

  • 结合YOLOv8和SAM,实现快速检测和精确分割胶质瘤。
  • 在模拟术中MRI的噪声图像上训练,表现出较强的鲁棒性和高Dice分数(0.79)。
  • 推理时间仅需15到25秒,适合实时术中应用,显著优于其他模型。

picture.image

时序建模与滤波类

✅ +卡尔曼滤波

唯一涉及时间维度的动态优化方法,用于平滑视频流中的检测结果轨迹,减少帧间抖动。

参考论文:Seedling maize counting method in complex backgrounds based on YOLOV5 and Kalman filter tracking algorithm

方法: 论文提出了一种基于YOLOv5和卡尔曼滤波的玉米幼苗计数方法。该方法利用无人机拍摄的图像,通过改进的YOLOv5模型检测玉米幼苗,并结合卡尔曼滤波进行跟踪和计数,最终实现了复杂背景下的快速、准确计数。

picture.image

创新点:

  • 构建含通道注意力机制的SE-YOLOV5m模型,提升复杂背景下玉米检测精度。
  • 结合改进YOLOV5与卡尔曼滤波,通过匹配跟踪避免连续帧重复计数。
  • 引入计数基线和阈值参数,解决边缘畸变与漏检导致的计数误差。

picture.image

领域定制化类

✅ +缺陷检测

通常表现为数据增强策略和损失函数加权设计的调整,落地可针对工业异常检测场景进行特殊改造。

参考论文:A high precision YOLO model for surface defect detection based on PyConv and CISBA

方法: 论文提出了一种改进的YOLO算法(EPSC-YOLO),专门用于工业表面缺陷检测。该方法融合EMA/PyConv/CISBA及Soft-NMS技术,强化工业表面小目标与复杂背景缺陷检测,精度实时性双优。

picture.image

创新点:

  • 引入高效多尺度注意力模块(EMA),增强对多尺度目标的关注。
  • 设计两种金字塔卷积(PyConv)模块,提升多尺度特征提取能力。
  • 提出CISBA卷积注意力模块,增强复杂背景下小目标检测能力。

picture.image

添加小享,回复【YOLO创新】

领取113篇YOLO论文代码+数据集

picture.image

长按即可扫码添加

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
CV 技术在视频创作中的应用
本次演讲将介绍在拍摄、编辑等场景,我们如何利用 AI 技术赋能创作者;以及基于这些场景,字节跳动积累的领先技术能力。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论