YOLO 不止检测，从注意力机制到 Mamba 113篇论文+20+数据集+5大类改进方向，从理论到落地一应俱全！ - 文章 - 开发者社区

最近看了不少YOLO的论文，加上前不久YOLOv13也出来了，YOLOv14更是即将出世。我就梳理了一遍YOLO各版本的技术突破，以及YOLO相关的一些热门改进思路。

这些思路我从技术本质、作用方式和场景适配性等角度做了分类（看下文5点），既能帮助论文er理清不同技术在模型改进中的定位、作用机制及关联关系，便于组织论文结构；也方便研发er快速定位技术在流程中的位置，明确各阶段的优化重点。

YOLO各版本以及每个分类都附有参考论文+开源代码，共整理了113篇，另附20+缺陷检测数据集，供大家学习。

picture.image

需要的话添加小享，回复【YOLO创新】无偿分享

picture.image

长按即可扫码添加

架构增强组件类

✅ +注意力机制

✅ +Mamba

✅ +多尺度特征融合

该类方法扩展了原始YOLO的感受野和上下文建模能力，而且这三者都可以无缝集成到检测头的改进中。

参考论文：SCCA-YOLO: A Spatial and Channel Collaborative Attention Enhanced YOLO Network for Highway Autonomous Driving Perception System

方法： 论文提出了一种基于YOLO的改进方法SCCA-YOLO，通过引入空间通道协同注意力机制，增强了目标检测的准确性和效率。同时，结合Ghost模块优化计算效率，使其更适合实际应用。

picture.image

创新点：

提出了一种新的空间通道协同注意力模块，结合空间注意力和通道自注意力，提升特征表达能力。
集成Ghost模块，优化网络的计算效率，降低资源消耗，增强实际部署的可行性。
构建了一个针对农村公路场景的大型动物数据集，为相关研究提供了新的资源。

picture.image

模型效率优化类

✅ 轻量级YOLO

通过深度卷积拆解、知识蒸馏等压缩模型体量，适配边缘设备的实时推理需求，该类方法可以与其他技术并行应用。

参考论文：YOLO‑Granada: a lightweight attentioned Yolo for pomegranates fruit detection

方法： 论文推出轻量化YOLO-Granada算法检测石榴果实，它采用ShuffleNetv2作为骨干网络，结合CBAM注意力机制，优化了模型的计算效率和检测精度。该算法在保持高精度的同时，显著减少了模型大小和计算量，适合在低功耗设备上实时运行。

picture.image

创新点：

使用轻量化的ShuffleNetv2作为骨干网络，显著降低模型大小和计算量。
引入CBAM注意力机制，增强特征提取能力，优化检测精度。
实现了实时检测，检测速度比原网络快17.3%，适合在资源受限的设备上运行。

picture.image

添加小享，回复【YOLO创新】

领取113篇YOLO论文代码+数据集

picture.image

长按即可扫码添加

多任务协同学习类

✅ +SAM（分割模型）

将图像分割作为辅助分支与检测任务联合训练，共享主干特征提取器。通过交叉监督增强语义理解能力，间接提升缺陷定位精度。

参考论文：Intraoperative Glioma Segmentation with YOLO + SAM for Improved Accuracy in Tumor Resection

方法： 论文创新融合YOLOv8与SAM，利用YOLOv8快速定位肿瘤，并通过SAM进行精确分割。模型在包含噪声的MRI图像上训练，实现了0.79的Dice分数，性能与现有模型相当，但推理时间更短（15到25秒），适合实时手术应用。

picture.image

创新点：

结合YOLOv8和SAM，实现快速检测和精确分割胶质瘤。
在模拟术中MRI的噪声图像上训练，表现出较强的鲁棒性和高Dice分数（0.79）。
推理时间仅需15到25秒，适合实时术中应用，显著优于其他模型。

picture.image

时序建模与滤波类

✅ +卡尔曼滤波

唯一涉及时间维度的动态优化方法，用于平滑视频流中的检测结果轨迹，减少帧间抖动。

参考论文：Seedling maize counting method in complex backgrounds based on YOLOV5 and Kalman filter tracking algorithm

方法： 论文提出了一种基于YOLOv5和卡尔曼滤波的玉米幼苗计数方法。该方法利用无人机拍摄的图像，通过改进的YOLOv5模型检测玉米幼苗，并结合卡尔曼滤波进行跟踪和计数，最终实现了复杂背景下的快速、准确计数。

picture.image

创新点：

构建含通道注意力机制的SE-YOLOV5m模型，提升复杂背景下玉米检测精度。
结合改进YOLOV5与卡尔曼滤波，通过匹配跟踪避免连续帧重复计数。
引入计数基线和阈值参数，解决边缘畸变与漏检导致的计数误差。

picture.image

领域定制化类

✅ +缺陷检测

通常表现为数据增强策略和损失函数加权设计的调整，落地可针对工业异常检测场景进行特殊改造。

参考论文：A high precision YOLO model for surface defect detection based on PyConv and CISBA

方法： 论文提出了一种改进的YOLO算法（EPSC-YOLO），专门用于工业表面缺陷检测。该方法融合EMA/PyConv/CISBA及Soft-NMS技术，强化工业表面小目标与复杂背景缺陷检测，精度实时性双优。

picture.image

创新点：

引入高效多尺度注意力模块（EMA），增强对多尺度目标的关注。
设计两种金字塔卷积（PyConv）模块，提升多尺度特征提取能力。
提出CISBA卷积注意力模块，增强复杂背景下小目标检测能力。

picture.image

添加小享，回复【YOLO创新】

领取113篇YOLO论文代码+数据集

picture.image

长按即可扫码添加