We're sorry but react app doesn't work properly without JavaScript enabled. Please enable it to continue.
文档
备案
控制台
登录
立即注册
首页
文章
问答
视频
活动
下载资源
团队号
镜像站
发布
集智书童
文章
专栏
问答
集智书童
LLM 与 BiomedCLIP 携手提升图像 Prompt 学习的准确性与泛化性 !
AI
大模型
向量数据库
数据中台
备注好友:方向-学校/公司-姓名/昵称【AIGC 先锋科技】交流群最近,视觉语言模型(VLMs)如CLIP在视觉任务的自监督表示学习方面取得了显著成功。然而,有效地将VLMs应用到下游任务仍具有挑战性,因为它们的准确性通常依赖于耗时且需要专业知识的时间密集型 Prompt 工程,而全模型微调则成本高昂。这在生物医学图像中尤为明显,因为与自然图像不同,生物医学图像通常具有有限的标注数据集、不直观的图
6
0
0
0
集智书童
即插即用,轻松涨点!把大牛的模块缝合到自己的paper里
AI
大模型
向量数据库
机器学习
发论文神器:即插即用缝合模块!
6
0
0
0
集智书童
最强医学图像分割!基于SAM改进登上Nature!
AI
大模型
机器学习
算法
MedSAM,医学图像分割首个基础模型!
8
0
0
0
集智书童
YOLO 家族大对决:YOLOv11 与 Transformer 称霸两类目标检测 !
AI
大模型
机器学习
数据库
点击下方卡片,关注「集智书童」公众号点击加入👉「集智书童」交流群想要了解更多:前沿AI视觉感知全栈知识👉「分类、检测、分割、关键点、车道线检测、3D视觉(分割、检测)、多模态、目标跟踪、NerF」行业技术方案 👉「AI安防、AI医疗、AI自动驾驶」AI模型部署落地实战 👉「CUDA、TensorRT、NCNN、OpenVINO、MNN、ONNXRuntime以及地平线框架」欢迎扫描上方二维
28
0
0
0
集智书童
基于 YOLO 的检测,YOLOv8、v9、v11 及混合模型深度剖析 !
AI
向量数据库
大模型
机器学习
点击下方卡片,关注「集智书童」公众号点击加入👉「集智书童」交流群想要了解更多:前沿AI视觉感知全栈知识👉「分类、检测、分割、关键点、车道线检测、3D视觉(分割、检测)、多模态、目标跟踪、NerF」行业技术方案 👉「AI安防、AI医疗、AI自动驾驶」AI模型部署落地实战 👉「CUDA、TensorRT、NCNN、OpenVINO、MNN、ONNXRuntime以及地平线框架」欢迎扫描上方二维
86
0
0
0
集智书童
大核 ConvNets 的秘密武器 | UniRepLKNet 与视觉 Transformer 的较量 !
AI
向量数据库
大模型
云通信
点击下方卡片,关注「集智书童」公众号点击加入👉「集智书童」交流群想要了解更多:前沿AI视觉感知全栈知识👉「分类、检测、分割、关键点、车道线检测、3D视觉(分割、检测)、多模态、目标跟踪、NerF」行业技术方案 👉「AI安防、AI医疗、AI自动驾驶」AI模型部署落地实战 👉「CUDA、TensorRT、NCNN、OpenVINO、MNN、ONNXRuntime以及地平线框架」欢迎扫描上方二维
15
0
0
0
集智书童
提升SAM的跨域性能,多级特征融合在少样本分割中的应用 !
AI
大模型
向量数据库
机器学习
点击下方卡片,关注 「AI视界引擎」 公众号欢迎投稿和交流( 添加时备注:方向+学校/公司+昵称/姓名 )提升SAM的跨域性能,多级特征融合在少样本分割中的应用 !在大规模预训练的背景下,大视觉模型(LVM)在图像理解方面展示了巨大的潜力。最近,Segment Anything Model(SAM)的出现使得图像分割领域实现了质的飞跃,支持了灵活的交互提示和强大的学习能力。然而,其性能往往在跨域和
11
0
0
0
集智书童
WTPose 框架:基于 Transformer 的 Waterfall 模块提升姿态估计能力 !
AI
向量数据库
大模型
机器学习
点击下方卡片,关注「集智书童」公众号点击加入👉「集智书童」交流群想要了解更多:前沿AI视觉感知全栈知识👉「分类、检测、分割、关键点、车道线检测、3D视觉(分割、检测)、多模态、目标跟踪、NerF」行业技术方案 👉「AI安防、AI医疗、AI自动驾驶」AI模型部署落地实战 👉「CUDA、TensorRT、NCNN、OpenVINO、MNN、ONNXRuntime以及地平线框架」欢迎扫描上方二维
39
0
0
0
集智书童
GPU4090 助力方案 | 用潜在图像扩散模型解决高分辨率视频逆问题 !
AI
大模型
向量数据库
数据中台
备注好友:方向-学校/公司-姓名/昵称【AIGC 先锋科技】交流群在本文中,作者提出了一种新的框架,用于使用潜在图像扩散模型解决高分辨率视频逆问题。基于近期在视频逆问题中使用图像扩散模型的时空优化方面的进展,作者的方法利用潜在空间扩散模型来实现增强的视频质量和分辨率。为了应对处理高分辨率帧的高计算需求,作者引入了一种伪批一致采样策略,使其能够在单个GPU上进行高效操作。此外,为了提高时序一致性,作
44
0
0
0
集智书童
厦大/新加坡国立大学联合提出 EOV-Seg:高效的开放词汇全景分割 !
AI
向量数据库
大模型
机器学习
点击下方卡片,关注「集智书童」公众号点击加入👉「集智书童」交流群想要了解更多:前沿AI视觉感知全栈知识👉「分类、检测、分割、关键点、车道线检测、3D视觉(分割、检测)、多模态、目标跟踪、NerF」行业技术方案 👉「AI安防、AI医疗、AI自动驾驶」AI模型部署落地实战 👉「CUDA、TensorRT、NCNN、OpenVINO、MNN、ONNXRuntime以及地平线框架」欢迎扫描上方二维
53
0
0
0
集智书童
多视角 Transformer,在图像分类、目标检测以及实例和语义分割实现Top-1 精度 !
AI
向量数据库
大模型
云通信
点击下方卡片,关注「集智书童」公众号点击加入👉「集智书童」交流群想要了解更多:前沿AI视觉感知全栈知识👉「分类、检测、分割、关键点、车道线检测、3D视觉(分割、检测)、多模态、目标跟踪、NerF」行业技术方案 👉「AI安防、AI医疗、AI自动驾驶」AI模型部署落地实战 👉「CUDA、TensorRT、NCNN、OpenVINO、MNN、ONNXRuntime以及地平线框架」欢迎扫描上方二维
199
0
0
0
集智书童
减少从头训练需求,PROFIT 针对预训练模型微调的优化器,在图像分类和运动预测任务上的表现优异!
AI
向量数据库
大模型
机器学习
点击下方卡片,关注「集智书童」公众号点击加入👉「集智书童」交流群想要了解更多:前沿AI视觉感知全栈知识👉「分类、检测、分割、关键点、车道线检测、3D视觉(分割、检测)、多模态、目标跟踪、NerF」行业技术方案 👉「AI安防、AI医疗、AI自动驾驶」AI模型部署落地实战 👉「CUDA、TensorRT、NCNN、OpenVINO、MNN、ONNXRuntime以及地平线框架」欢迎扫描上方二维
104
0
0
0
集智书童
快速学会登上nature的热门算法,LSTM!
AI
大数据
机器学习
算法
快速学会登上nature的热门算法,LSTM!
109
0
0
0
集智书童
武大提出 Point Teacher,两阶段去噪,让小物体点标注检测更可靠 !
AI
向量数据库
大模型
机器学习
点击下方卡片,关注「集智书童」公众号点击加入👉「集智书童」交流群想要了解更多:前沿AI视觉感知全栈知识👉「分类、检测、分割、关键点、车道线检测、3D视觉(分割、检测)、多模态、目标跟踪、NerF」行业技术方案 👉「AI安防、AI医疗、AI自动驾驶」AI模型部署落地实战 👉「CUDA、TensorRT、NCNN、OpenVINO、MNN、ONNXRuntime以及地平线框架」欢迎扫描上方二维
61
0
0
0
集智书童
Token Cropr : Vit 速度原地起飞,适用于相当少的任务,图像分类、语义分割、目标检测和实例分割成1.5-4倍飞跃!
AI
大模型
向量数据库
机器学习
点击下方卡片,关注「集智书童」公众号点击加入👉「集智书童」交流群想要了解更多:前沿AI视觉感知全栈知识👉「分类、检测、分割、关键点、车道线检测、3D视觉(分割、检测)、多模态、目标跟踪、NerF」行业技术方案 👉「AI安防、AI医疗、AI自动驾驶」AI模型部署落地实战 👉「CUDA、TensorRT、NCNN、OpenVINO、MNN、ONNXRuntime以及地平线框架」欢迎扫描上方二维
57
0
0
0
集智书童
Elastic-DETR: 自适应多尺度图像分辨率学习以优化目标检测 !
AI
大模型
向量数据库
机器学习
点击下方卡片,关注「集智书童」公众号点击加入👉「集智书童」交流群想要了解更多:前沿AI视觉感知全栈知识👉「分类、检测、分割、关键点、车道线检测、3D视觉(分割、检测)、多模态、目标跟踪、NerF」行业技术方案 👉「AI安防、AI医疗、AI自动驾驶」AI模型部署落地实战 👉「CUDA、TensorRT、NCNN、OpenVINO、MNN、ONNXRuntime以及地平线框架」欢迎扫描上方二维
59
0
0
0
集智书童
EFTViT: 在资源受限的边缘设备上对带遮罩图像的视觉变换器:(VisionTransformers)的高效联合训练 !
AI
向量数据库
大模型
机器学习
点击下方卡片,关注「集智书童」公众号点击加入👉「集智书童」交流群想要了解更多:前沿AI视觉感知全栈知识👉「分类、检测、分割、关键点、车道线检测、3D视觉(分割、检测)、多模态、目标跟踪、NerF」行业技术方案 👉「AI安防、AI医疗、AI自动驾驶」AI模型部署落地实战 👉「CUDA、TensorRT、NCNN、OpenVINO、MNN、ONNXRuntime以及地平线框架」欢迎扫描上方二维
52
0
0
0
集智书童
清华大学/NVIDIA/斯坦福等在没有3D数据的情况下训练一个开放词汇的单目3D物体检测模型 !
AI
火山方舟
向量数据库
大模型
点击下方卡片,关注「集智书童」公众号点击加入👉「集智书童」交流群想要了解更多:前沿AI视觉感知全栈知识👉「分类、检测、分割、关键点、车道线检测、3D视觉(分割、检测)、多模态、目标跟踪、NerF」行业技术方案 👉「AI安防、AI医疗、AI自动驾驶」AI模型部署落地实战 👉「CUDA、TensorRT、NCNN、OpenVINO、MNN、ONNXRuntime以及地平线框架」欢迎扫描上方二维
63
0
0
0
集智书童
西工业/北理工提出 VIVID-10M:一种用于多功能和交互式视频局部编辑的数据集和基线 !
AI
向量数据库
大模型
机器学习
点击下方卡片,关注「集智书童」公众号点击加入👉「集智书童」交流群想要了解更多:前沿AI视觉感知全栈知识👉「分类、检测、分割、关键点、车道线检测、3D视觉(分割、检测)、多模态、目标跟踪、NerF」行业技术方案 👉「AI安防、AI医疗、AI自动驾驶」AI模型部署落地实战 👉「CUDA、TensorRT、NCNN、OpenVINO、MNN、ONNXRuntime以及地平线框架」欢迎扫描上方二维
57
0
0
0
集智书童
同济提出简化 Transformer结构:在RTX3090上实现CLIP的轻量级训练 !
AI
大模型
机器学习
容器
点击下方卡片,关注「集智书童」公众号点击加入👉「集智书童」交流群想要了解更多:前沿AI视觉感知全栈知识👉「分类、检测、分割、关键点、车道线检测、3D视觉(分割、检测)、多模态、目标跟踪、NerF」行业技术方案 👉「AI安防、AI医疗、AI自动驾驶」AI模型部署落地实战 👉「CUDA、TensorRT、NCNN、OpenVINO、MNN、ONNXRuntime以及地平线框架」欢迎扫描上方二维
66
0
0
0