We're sorry but react app doesn't work properly without JavaScript enabled. Please enable it to continue.
文档
备案
控制台
登录
立即注册
首页
文章
问答
视频
活动
下载资源
团队号
镜像站
发布
集智书童
文章
专栏
问答
集智书童
边缘AI革命!MicroViT 革新轻量视觉Transformer:3.6倍速+40%能效提升,突破边缘部署极限
边缘云
向量数据库
大模型
机器学习
点击下方卡片,关注「集智书童」公众号点击加入👉「集智书童」交流群视觉Transformer(ViT)在各种计算机视觉任务中展现了最先进的性能,但其高计算需求使其在资源有限的边缘设备上不切实际。本文提出了MicroViT,这是一种轻量级的视觉Transformer架构,通过显著降低计算复杂度,同时保持高精度,针对边缘设备进行了优化。MicroViT的核心是高效单头注意力(ESHA)机制,该机制利用
0
0
0
0
集智书童
算力核爆!碾压YOLO系 | Fast-COS 横扫 BDD100K/TJU 双冠,边缘端实时推理,效率起飞
AI
向量数据库
大模型
机器学习
点击下方卡片,关注「集智书童」公众号点击加入👉「集智书童」交流群感知系统是自动驾驶系统的核心元素,在确保安全方面发挥着关键作用。驾驶场景感知系统本质上是一个目标检测任务,需要在准确性和处理速度之间取得平衡。许多当代方法侧重于提高检测精度,但往往忽视了在计算资源有限时实时检测能力的重要性。因此,研究针对驾驶场景的高效目标检测策略至关重要。本文介绍了Fast-COS,这是一个专为驾驶场景应用设计的单
5
0
0
0
集智书童
终结NMS时代 | DCG-DeHomo差异化编码颠覆OD,去同质化Query+联合损失屠榜,参数暴降8%
云原生
向量数据库
大模型
机器学习
点击下方卡片,关注「集智书童」公众号点击加入👉「集智书童」交流群密集目标检测在自动驾驶、视频监控等领域得到广泛应用。本文聚焦于密集场景下具有挑战性的密集目标检测任务。目前,基于贪婪算法的检测方法,如非极大值抑制(NMS),在密集场景中往往会产生许多重复预测或漏检,这是NMS类算法面临的一个常见问题。通过端到端DETR(DEtection TRansformer)作为一类能够将NMS等后处理去重能
14
0
0
0
集智书童
基于 Yolact 的检测优化,训练优化不损推理效率,解决边缘模糊问题 !
AI
向量数据库
大模型
机器学习
点击下方卡片,关注「集智书童」公众号点击加入👉「集智书童」交流群想要了解更多:前沿AI视觉感知全栈知识👉「分类、检测、分割、关键点、车道线检测、3D视觉(分割、检测)、多模态、目标跟踪、NerF」行业技术方案 👉「AI安防、AI医疗、AI自动驾驶」AI模型部署落地实战 👉「CUDA、TensorRT、NCNN、OpenVINO、MNN、ONNXRuntime以及地平线框架」欢迎扫描上方二维
12
0
0
0
集智书童
快速学会登上nature的热门算法,LSTM!
AI
向量数据库
大模型
机器学习
快速学会登上nature的热门算法,LSTM!
12
0
0
0
集智书童
尺度损失与分布损失,Elastic-DETR 让多尺度图像分辨率更灵活,超越 DN-DETR !
AI
向量数据库
大模型
机器学习
点击下方卡片,关注「集智书童」公众号点击加入👉「集智书童」交流群想要了解更多:前沿AI视觉感知全栈知识👉「分类、检测、分割、关键点、车道线检测、3D视觉(分割、检测)、多模态、目标跟踪、NerF」行业技术方案 👉「AI安防、AI医疗、AI自动驾驶」AI模型部署落地实战 👉「CUDA、TensorRT、NCNN、OpenVINO、MNN、ONNXRuntime以及地平线框架」欢迎扫描上方二维
19
0
0
0
集智书童
BEExformer:解决大语言模型部署难题的创新架构 !
AI
大模型
向量数据库
机器学习
基于Transformer的大语言模型(LLMs)在各种应用中取得了前沿成果。然而,它们庞大的规模和处理需求使得在受限资源设备上部署变得极其困难。在各种效率考虑中,模型二值化和Early Exit(EE)是常用的有效解决方案。但二值化可能会因精度降低导致梯度估计和参数更新性能下降。此外,现有的Early Exit机制仍处于研究的初步阶段。为解决这些问题,作者提出了一种名为Binarized Ear
10
0
0
0
集智书童
从标准到注意力路由A-MoD:基于注意力图的混合深度模型优化之道 !
AI
大模型
向量数据库
机器学习
点击下方卡片,关注「集智书童」公众号点击加入👉「集智书童」交流群想要了解更多:前沿AI视觉感知全栈知识👉「分类、检测、分割、关键点、车道线检测、3D视觉(分割、检测)、多模态、目标跟踪、NerF」行业技术方案 👉「AI安防、AI医疗、AI自动驾驶」AI模型部署落地实战 👉「CUDA、TensorRT、NCNN、OpenVINO、MNN、ONNXRuntime以及地平线框架」欢迎扫描上方二维
29
0
0
0
集智书童
内容自适应 Tokenizer(CAT):提升图像 Diffusion Transformers 训练效能 !
AI
大模型
机器学习
数据库
点击下方卡片,关注「集智书童」公众号点击加入👉「集智书童」交流群想要了解更多:前沿AI视觉感知全栈知识👉「分类、检测、分割、关键点、车道线检测、3D视觉(分割、检测)、多模态、目标跟踪、NerF」行业技术方案 👉「AI安防、AI医疗、AI自动驾驶」AI模型部署落地实战 👉「CUDA、TensorRT、NCNN、OpenVINO、MNN、ONNXRuntime以及地平线框架」欢迎扫描上方二维
32
0
0
0
集智书童
南开提出 DEYOLO, 双功能增强YOLO,用于跨模态目标检测 !
AI
大模型
机器学习
算法
点击下方卡片,关注「集智书童」公众号点击加入👉「集智书童」交流群想要了解更多:前沿AI视觉感知全栈知识👉「分类、检测、分割、关键点、车道线检测、3D视觉(分割、检测)、多模态、目标跟踪、NerF」行业技术方案 👉「AI安防、AI医疗、AI自动驾驶」AI模型部署落地实战 👉「CUDA、TensorRT、NCNN、OpenVINO、MNN、ONNXRuntime以及地平线框架」欢迎扫描上方二维
77
0
0
0
集智书童
LLM 与 BiomedCLIP 携手提升图像 Prompt 学习的准确性与泛化性 !
AI
大模型
向量数据库
数据中台
备注好友:方向-学校/公司-姓名/昵称【AIGC 先锋科技】交流群最近,视觉语言模型(VLMs)如CLIP在视觉任务的自监督表示学习方面取得了显著成功。然而,有效地将VLMs应用到下游任务仍具有挑战性,因为它们的准确性通常依赖于耗时且需要专业知识的时间密集型 Prompt 工程,而全模型微调则成本高昂。这在生物医学图像中尤为明显,因为与自然图像不同,生物医学图像通常具有有限的标注数据集、不直观的图
25
0
0
0
集智书童
即插即用,轻松涨点!把大牛的模块缝合到自己的paper里
AI
大模型
向量数据库
机器学习
发论文神器:即插即用缝合模块!
44
0
0
0
集智书童
最强医学图像分割!基于SAM改进登上Nature!
AI
大模型
机器学习
算法
MedSAM,医学图像分割首个基础模型!
85
0
0
0
集智书童
YOLO 家族大对决:YOLOv11 与 Transformer 称霸两类目标检测 !
AI
大模型
机器学习
数据库
点击下方卡片,关注「集智书童」公众号点击加入👉「集智书童」交流群想要了解更多:前沿AI视觉感知全栈知识👉「分类、检测、分割、关键点、车道线检测、3D视觉(分割、检测)、多模态、目标跟踪、NerF」行业技术方案 👉「AI安防、AI医疗、AI自动驾驶」AI模型部署落地实战 👉「CUDA、TensorRT、NCNN、OpenVINO、MNN、ONNXRuntime以及地平线框架」欢迎扫描上方二维
84
0
0
0
集智书童
基于 YOLO 的检测,YOLOv8、v9、v11 及混合模型深度剖析 !
AI
向量数据库
大模型
机器学习
点击下方卡片,关注「集智书童」公众号点击加入👉「集智书童」交流群想要了解更多:前沿AI视觉感知全栈知识👉「分类、检测、分割、关键点、车道线检测、3D视觉(分割、检测)、多模态、目标跟踪、NerF」行业技术方案 👉「AI安防、AI医疗、AI自动驾驶」AI模型部署落地实战 👉「CUDA、TensorRT、NCNN、OpenVINO、MNN、ONNXRuntime以及地平线框架」欢迎扫描上方二维
323
0
0
0
集智书童
大核 ConvNets 的秘密武器 | UniRepLKNet 与视觉 Transformer 的较量 !
AI
向量数据库
大模型
云通信
点击下方卡片,关注「集智书童」公众号点击加入👉「集智书童」交流群想要了解更多:前沿AI视觉感知全栈知识👉「分类、检测、分割、关键点、车道线检测、3D视觉(分割、检测)、多模态、目标跟踪、NerF」行业技术方案 👉「AI安防、AI医疗、AI自动驾驶」AI模型部署落地实战 👉「CUDA、TensorRT、NCNN、OpenVINO、MNN、ONNXRuntime以及地平线框架」欢迎扫描上方二维
23
0
0
0
集智书童
提升SAM的跨域性能,多级特征融合在少样本分割中的应用 !
AI
大模型
向量数据库
机器学习
点击下方卡片,关注 「AI视界引擎」 公众号欢迎投稿和交流( 添加时备注:方向+学校/公司+昵称/姓名 )提升SAM的跨域性能,多级特征融合在少样本分割中的应用 !在大规模预训练的背景下,大视觉模型(LVM)在图像理解方面展示了巨大的潜力。最近,Segment Anything Model(SAM)的出现使得图像分割领域实现了质的飞跃,支持了灵活的交互提示和强大的学习能力。然而,其性能往往在跨域和
18
0
0
0
集智书童
WTPose 框架:基于 Transformer 的 Waterfall 模块提升姿态估计能力 !
AI
向量数据库
大模型
机器学习
点击下方卡片,关注「集智书童」公众号点击加入👉「集智书童」交流群想要了解更多:前沿AI视觉感知全栈知识👉「分类、检测、分割、关键点、车道线检测、3D视觉(分割、检测)、多模态、目标跟踪、NerF」行业技术方案 👉「AI安防、AI医疗、AI自动驾驶」AI模型部署落地实战 👉「CUDA、TensorRT、NCNN、OpenVINO、MNN、ONNXRuntime以及地平线框架」欢迎扫描上方二维
48
0
0
0
集智书童
GPU4090 助力方案 | 用潜在图像扩散模型解决高分辨率视频逆问题 !
AI
大模型
向量数据库
数据中台
备注好友:方向-学校/公司-姓名/昵称【AIGC 先锋科技】交流群在本文中,作者提出了一种新的框架,用于使用潜在图像扩散模型解决高分辨率视频逆问题。基于近期在视频逆问题中使用图像扩散模型的时空优化方面的进展,作者的方法利用潜在空间扩散模型来实现增强的视频质量和分辨率。为了应对处理高分辨率帧的高计算需求,作者引入了一种伪批一致采样策略,使其能够在单个GPU上进行高效操作。此外,为了提高时序一致性,作
53
0
0
0
集智书童
厦大/新加坡国立大学联合提出 EOV-Seg:高效的开放词汇全景分割 !
AI
向量数据库
大模型
机器学习
点击下方卡片,关注「集智书童」公众号点击加入👉「集智书童」交流群想要了解更多:前沿AI视觉感知全栈知识👉「分类、检测、分割、关键点、车道线检测、3D视觉(分割、检测)、多模态、目标跟踪、NerF」行业技术方案 👉「AI安防、AI医疗、AI自动驾驶」AI模型部署落地实战 👉「CUDA、TensorRT、NCNN、OpenVINO、MNN、ONNXRuntime以及地平线框架」欢迎扫描上方二维
66
0
0
0