未来先知的个人主页 - 开发者社区 - 火山引擎

未来先知

文章

专栏

问答

无需训练，kNN-CLIP 在图像分割中的应用！

数据库技术

在持续分割领域的快速进展尚未能在计算受限的情况下桥接扩展到大型持续扩展词汇量的差距。

649

0

0

0

VSSD 在图像分类、检测与分割中的应用，刷新基于 SSM 的模型 SOTA 榜！

技术技术

视觉 Transformer 在计算机视觉领域取得了显著进展，提供了强大的建模能力和全局感受野。

326

0

0

0

香港科技大学提出 MTMamba，超越 Transformer 与 CNN，在语义分割等任务上的卓越表现！

技术技术

点击下方卡片，关注「AI视界引擎」公众号( 添加时备注：方向+学校/公司+昵称/姓名 )多任务密集场景理解，

126

0

0

0

探索小目标检测的未知领域：RGBT-Tiny数据集的构建与评估！

开源技术

小目标检测（SOD）一直是多年来持续存在且具有挑战性的任务，已经开发出众多数据集和算法。

386

0

0

0

MIT & Caltech & AWS 提出 ALDI，目标检测新突破，超越现有方法，再次刷新 SOTA！

数据库技术

目标检测器在处理与训练集不同的数据时往往表现不佳。最近，域自适应目标检测（DAOD）方法在应对这一挑战上取得了显著成果。

179

0

0

0

通过特征蒸馏与迭代学习改进 UNet 的图像分割能力！

技术技术

自从UNet被引入以来，它一直在引领各种医学图像分割任务。

112

0

0

0

南开大学提出 ADFQ-ViT，解决 ViT 在低比特量化时显著准确性损失的问题！

技术技术

视觉 Transformer （ViTs）在各种计算机视觉任务中表现出卓越的性能，但其庞大的参数规模显著增加了

345

0

0

0

卡内基梅隆大学 & 微软研究院引入 Med-VTAB 用通用预训练权重提高ViTs在视觉任务上性能！

技术技术

视觉任务适应已经在使用专门的可学习层或标记调整预训练的Vision Transformers (ViTs)以适

273

0

0

0

暗场景下的视觉突破：ECAFormer提升低光照图像增强性能！

技术技术

低光照图像增强（LLIE）对于自动驾驶至关重要。尽管其重要性，现有的LLIE方法常常优先考虑整体亮度的稳健调整，这可能会以牺牲细节保留为代价。

476

0

0

0

采用轻量级特征提取 Backbone 网络，参数数量和网络浮点运算大大减少，可部署边缘设备！

技术技术

人脸检测通常尝试使用如ResNet-50/101/152和VGG16/19这样的大型预训练 Backbone

609

0

0

0

UP-DETR 无需人工标注，随机裁剪多个 Query Patch ，并预训练 Transformer 进行目标检测！

技术技术

1 IntroductionDetection TRansformer (DETR) [1]DETR是一种最近

221

0

0

0

视频真伪难辨？蚂蚁集团 & 南大 & 上交通开源 DeMamba 即插即用，助你一臂之力！

技术技术

最近，视频生成技术快速发展。鉴于社交媒体平台上视频内容的普及，这些模型加剧了人们对虚假信息传播的担忧。

377

0

0

0

探索3D视觉中的Transformer架构：通用Backbone与自适应采样策略！

技术技术

1 Introduction计算机视觉中的一个基本问题是在三维空间中理解和识别场景与物体。

397

0

0

0

STN 也来卷 YOLO 了，提升图像检测的质量，并可用于下游应用！

技术技术

目标检测在计算机视觉领域扮演着至关重要的角色，它可以自主识别并定位感兴趣的目标。

88

0

0

0

提升CLIP性能，IntCoOp联合学习在零样本学习中的优势！

技术技术

图像文本对比模型，如CLIP，学习可迁移且健壮的表示，以便在零样本转移至各种下游任务时使用。

432

0

0

0

多模态Mamba分类器,融合3D GAN 与 ViT 进行高效特征提取与分类 !

技术技术

阿尔茨海默病（AD）是一种不可逆的神经退行性疾病，通常从轻度认知障碍（MCI）进展而来，导致记忆力丧失，严重影

648

0

0

0

南大 & 吉大 & 移动优化Pipeline设，VLM 和 LLM 助力提升物体图像修复效果！

技术技术

在图像修复领域，尤其是通过扩散建模的最新进展，已经取得了令人鼓舞的成果。

528

0

0

0

低功耗、高精度，PowerYOLO 在动态视觉传感器上的高性能检测！

技术技术

在汽车解决方案中，目标检测系统的性能必须尽可能高，响应时间最小，且由于经常采用电池供电操作，能耗要低。

197

0

0

0

从 DeiT-B 到 DeiT-S，块结构化剪枝在深度 ViTs上的应用！

技术技术

视觉 Transformer （ViTs）已作为一种有前景的卷积神经网络（CNNs）替代方案，用于各种图像分析

777

0

0

0

U-Net 架构的演进，结合领域分解与通信网络的超高分辨率图像分割新策略！

技术技术

在本次研究中，针对超高分辨率图像分割中出现的空间信息丢失和计算效率低下等问题，提出了一种将编码器-解码器结构与

326

0

0

0