We're sorry but react app doesn't work properly without JavaScript enabled. Please enable it to continue.
文档
备案
控制台
登录
立即注册
首页
文章
问答
视频
活动
下载资源
团队号
镜像站
发布
集智书童
文章
专栏
问答
集智书童
通过重叠头自注意力增强视觉 Transformer 的学习能力 !
AI
向量数据库
大模型
机器学习
点击下方卡片,关注「集智书童」公众号点击加入👉「集智书童」交流群想要了解更多:前沿AI视觉感知全栈知识👉「分类、检测、分割、关键点、车道线检测、3D视觉(分割、检测)、多模态、目标跟踪、NerF」行业技术方案 👉「AI安防、AI医疗、AI自动驾驶」AI模型部署落地实战 👉「CUDA、TensorRT、NCNN、OpenVINO、MNN、ONNXRuntime以及地平线框架」欢迎扫描上方二维
17
0
0
0
集智书童
YOLA: 利用 Lambertian 图像形成模型提升低光目标检测性能 !
AI
向量数据库
大模型
云通信
点击下方卡片,关注「集智书童」公众号点击加入👉「集智书童」交流群想要了解更多:前沿AI视觉感知全栈知识👉「分类、检测、分割、关键点、车道线检测、3D视觉(分割、检测)、多模态、目标跟踪、NerF」行业技术方案 👉「AI安防、AI医疗、AI自动驾驶」AI模型部署落地实战 👉「CUDA、TensorRT、NCNN、OpenVINO、MNN、ONNXRuntime以及地平线框架」欢迎扫描上方二维
12
0
0
0
集智书童
TransformerRanker 高效地为下游分类任务找到最适合的语言模型的工具 !
AI
大模型
向量数据库
云安全
备注好友: 方向-学校/公司-姓名/昵称【AIGC 先锋科技】交流群在自然语言处理(NLP)的分类任务中,通常的做法是选择一个预训练的语言模型(PLM),然后针对特定下游任务进行微调。然而,考虑到目前可用的PLM数量非常庞大,一个实际挑战是如何确定哪一个PLM将最适合特定下游任务。为了解决这个问题,作者在这篇论文中引入了TRANSFORMERRANKER,这是一个轻量级的库,它可以高效地对PLM进
13
0
0
0
集智书童
清华大学提出 TANet 用于综合恶劣天气图像复原的三重注意网络 !
AI
向量数据库
大模型
机器学习
不利天气图像修复旨在去除由不利天气条件(如雾、雨、雪等)引起的不 desired 退化图像。现有方法在处理单一天气条件时取得了显著成果。然而,在遇到不可预测的天气条件时,它们面临挑战,这些条件在实际场景中经常发生。虽然不同天气条件表现出不同的退化模式,但它们具有高度相关和互补的共同特性,例如退化模式引起的遮挡、颜色失真和大气现象引起的对比度衰减。因此,作者关注利用多个天气条件之间的共享知识以统一地
23
0
0
0
集智书童
OWOD:深度神经网络在开放式世界目标检测中的新探索 !
AI
大模型
机器学习
算法
点击下方卡片,关注「集智书童」公众号点击加入👉「集智书童」交流群想要了解更多:前沿AI视觉感知全栈知识👉「分类、检测、分割、关键点、车道线检测、3D视觉(分割、检测)、多模态、目标跟踪、NerF」行业技术方案 👉「AI安防、AI医疗、AI自动驾驶」AI模型部署落地实战 👉「CUDA、TensorRT、NCNN、OpenVINO、MNN、ONNXRuntime以及地平线框架」欢迎扫描上方二维
18
0
0
0
集智书童
清华大学最新成果 3D 语义占用预测框架 GaussianFormer !
AI
向量数据库
大模型
机器学习
3D语义占用预测旨在获取周围场景的3D细粒度几何和语义信息,这对于视觉中心的自动驾驶的鲁棒性是一个重要的任务。
27
0
0
0
集智书童
使用 YOLO 加速实时应用程序中的对象检测 !
AI
图像处理
机器学习
数据库
点击下方卡片,关注「集智书童」公众号点击加入👉「集智书童」交流群想要了解更多:前沿AI视觉感知全栈知识👉「分类、检测、分割、关键点、车道线检测、3D视觉(分割、检测)、多模态、目标跟踪、NerF」行业技术方案 👉「AI安防、AI医疗、AI自动驾驶」AI模型部署落地实战 👉「CUDA、TensorRT、NCNN、OpenVINO、MNN、ONNXRuntime以及地平线框架」欢迎扫描上方二维
25
0
0
0
集智书童
复旦提出 CTA-Net | 卷积与Transformer的协同,通过轻量级多尺度特征融合提升视觉识别!
AI
向量数据库
数据安全
机器学习
点击下方卡片,关注「集智书童」公众号点击加入👉「集智书童」交流群想要了解更多:前沿AI视觉感知全栈知识👉「分类、检测、分割、关键点、车道线检测、3D视觉(分割、检测)、多模态、目标跟踪、NerF」行业技术方案 👉「AI安防、AI医疗、AI自动驾驶」AI模型部署落地实战 👉「CUDA、TensorRT、NCNN、OpenVINO、MNN、ONNXRuntime以及地平线框架」欢迎扫描上方二维
189
0
0
0
集智书童
DuoDiff: 提升浅层 Transformer 性能的扩散模型, 双 Backbone 件扩散模型在图像处理中的应用 !
AI
大模型
数据安全
机器学习
点击下方卡片,关注「集智书童」公众号点击加入👉「集智书童」交流群想要了解更多:前沿AI视觉感知全栈知识👉「分类、检测、分割、关键点、车道线检测、3D视觉(分割、检测)、多模态、目标跟踪、NerF」行业技术方案 👉「AI安防、AI医疗、AI自动驾驶」AI模型部署落地实战 👉「CUDA、TensorRT、NCNN、OpenVINO、MNN、ONNXRuntime以及地平线框架」欢迎扫描上方二维
19
0
0
0
集智书童
YOLOv8架构的改进:POLO 模型在多类目标检测中的突破 !
AI
机器学习
图像处理
NoSQL数据库
基于无人机影像和目标检测技术的自动化野生动物调查已成为保护生物学中一种强大且日益流行的工具。大多数检测器需要使用带有标注边界框的训练图像,这种做法既费时又费钱,而且并不总是明确。为了减少这种做法带来的标注负担,作者开发了POLO,这是一种可以在仅使用点标签进行训练的多类目标检测模型。POLO基于对YOLOv8架构的简单而有效的修改,包括预测过程、训练损失和后处理方面的修改。作者在包含多达数千个单独
20
0
0
0
集智书童
无需额外训练,基于 Llama-2模型,通过 Model-GLUE 实现大规模语言模型的聚合与集成 !
大模型
大模型
NoSQL数据库
机器学习
备注好友: 方向-学校/公司-姓名/昵称【AIGC 先锋科技】交流群随着大型语言模型(LLMs)在各种任务和专业化领域中的出色表现,基于现有模型的LLM扩展引起了广泛关注,但当将不同模型结合时,性能可能会降低。为了汇总预训练的LLM,已提出了各种技术,包括模型合并、混合专家和堆叠。尽管它们具有优点,但尚未对它们进行全面比较和综合应用到多样化的模型动物园中。鉴于这一研究空白,本文引入了Model-G
21
0
0
0
集智书童
优化之路 N-ReliefF 算法指导下的 CNN 超参数调整 !
AI
大模型
机器学习
数据库
点击下方卡片,关注「集智书童」公众号点击加入👉「集智书童」交流群想要了解更多:前沿AI视觉感知全栈知识👉「分类、检测、分割、关键点、车道线检测、3D视觉(分割、检测)、多模态、目标跟踪、NerF」行业技术方案 👉「AI安防、AI医疗、AI自动驾驶」AI模型部署落地实战 👉「CUDA、TensorRT、NCNN、OpenVINO、MNN、ONNXRuntime以及地平线框架」欢迎扫描上方二维
100
0
0
0
集智书童
利用知识蒸馏算法优化 YOLOv5 目标检测 !
AI
大模型
机器学习
关系型数据库
点击下方卡片,关注「集智书童」公众号点击加入👉「集智书童」交流群想要了解更多:前沿AI视觉感知全栈知识👉「分类、检测、分割、关键点、车道线检测、3D视觉(分割、检测)、多模态、目标跟踪、NerF」行业技术方案 👉「AI安防、AI医疗、AI自动驾驶」AI模型部署落地实战 👉「CUDA、TensorRT、NCNN、OpenVINO、MNN、ONNXRuntime以及地平线框架」欢迎扫描上方二维
38
0
0
0
集智书童
UniMatch V2 推进半监督语义分割极限,以更低训练成本实现更优的语义分割结果 !
AI
机器学习
NoSQL数据库
图像处理
点击下方卡片,关注「集智书童」公众号点击加入👉「集智书童」交流群想要了解更多:前沿AI视觉感知全栈知识👉「分类、检测、分割、关键点、车道线检测、3D视觉(分割、检测)、多模态、目标跟踪、NerF」行业技术方案 👉「AI安防、AI医疗、AI自动驾驶」AI模型部署落地实战 👉「CUDA、TensorRT、NCNN、OpenVINO、MNN、ONNXRuntime以及地平线框架」欢迎扫描上方二维
328
0
0
0
集智书童
无需额外标注 ,SG-MIM 实现高效结构知识引导的 Mask图像建模 !
AI
图像处理
机器学习
数据库
点击下方卡片,关注 「AI视界引擎」 公众号( 添加时备注:方向+学校/公司+昵称/姓名 )Mask 图像建模(MIM)技术已经 Reshape 了计算机视觉领域,使得预训练模型能够在各种任务上实现出色的性能。尽管它们取得了成功,但基于MIM的方法在密集预测任务中的全部潜力,尤其是在深度估计方面的潜力仍然尚未发掘。现有的MIM方法主要依赖于单张图像输入,这使得捕捉关键结构信息变得具有挑战性,从而导
39
0
0
0
集智书童
融合 Mamba 与 Transformer | MaskMamba 引领非自回归图像合成,推理速度提升 54.44% !
AI
图像处理
机器学习
关系型数据库
点击下方卡片,关注 「AI视界引擎」 公众号( 添加时备注:方向+学校/公司+昵称/姓名 )图像生成模型遇到了与可扩展性和二次复杂性相关的挑战,主要原因是依赖于基于Transformer的 Backbone 网络。在本研究中,作者引入了一种新颖的混合模型MaskMamba,它结合了Mambo和Transformer架构,使用Masked Image Modeling进行非自回归图像合成。作者仔细重
41
0
0
0
集智书童
清华再放大招 Stuffed Mamba | 基于RNN的长上下文建模中的状态崩溃与状态容量,实现近完美的 Key 检索 !
AI
大模型
机器学习
数据库
点击下方卡片,关注 「AI视界引擎」 公众号( 添加时备注:方向+学校/公司+昵称/姓名 )循环神经网络(RNNs)相对于基于 Transformer 的语言模型,在序列长度方面具有线性的计算复杂度,这使得它们在推理过程中处理长序列的速度更快。然而,大多数公开可用的RNNs(如Mamba和RWKV)都是在小于10K Token 的序列上进行训练,其在更长上下文中的有效性至今仍然不令人满意。在本文中
54
0
0
0
集智书童
中科院提出 DA-Ada | 用于域自适应目标检测的学习域感知适配器 !
AI
大模型
机器学习
数据库
点击下方卡片,关注「集智书童」公众号点击加入👉「集智书童」交流群想要了解更多:前沿AI视觉感知全栈知识👉「分类、检测、分割、关键点、车道线检测、3D视觉(分割、检测)、多模态、目标跟踪、NerF」行业技术方案 👉「AI安防、AI医疗、AI自动驾驶」AI模型部署落地实战 👉「CUDA、TensorRT、NCNN、OpenVINO、MNN、ONNXRuntime以及地平线框架」欢迎扫描上方二维
193
0
0
0
集智书童
量化挑战下的创新,LayerNorm 计算方法提升 LLMs推理性能 !
AI
大模型
关系型数据库
图像处理
点击下方卡片,关注「集智书童」公众号点击加入👉「集智书童」交流群想要了解更多:前沿AI视觉感知全栈知识👉「分类、检测、分割、关键点、车道线检测、3D视觉(分割、检测)、多模态、目标跟踪、NerF」行业技术方案 👉「AI安防、AI医疗、AI自动驾驶」AI模型部署落地实战 👉「CUDA、TensorRT、NCNN、OpenVINO、MNN、ONNXRuntime以及地平线框架」欢迎扫描上方二维
72
0
0
0
集智书童
降低标注成本,ESA 策略利用实体-超像素标注提高语义分割的主动学习效率 !
AI
图像处理
机器学习
数据库
点击下方卡片,关注「集智书童」公众号点击加入👉「集智书童」交流群想要了解更多:前沿AI视觉感知全栈知识👉「分类、检测、分割、关键点、车道线检测、3D视觉(分割、检测)、多模态、目标跟踪、NerF」行业技术方案 👉「AI安防、AI医疗、AI自动驾驶」AI模型部署落地实战 👉「CUDA、TensorRT、NCNN、OpenVINO、MNN、ONNXRuntime以及地平线框架」欢迎扫描上方二维
237
0
0
0