集智书童的个人主页 - 开发者社区 - 火山引擎

文档备案控制台登录立即注册

首页文章活动开发者计划镜像站

发布

集智书童

文章

专栏

问答

AFOG | 一招破解CNN/Transformer检测器，97%剪枝率下性能反升30.6%

AI大模型向量数据库云通信

书童带你领略视觉前沿之美，精选科研前沿、工业实用的知识供你我进步与学习！

3

0

0

0

YOLO家族进化论 | 从架构增强到多任务学习，读懂2D检测未来

AI大数据机器学习算法

书童带你领略视觉前沿之美，精选科研前沿、工业实用的知识供你我进步与学习！

3

0

0

0

破解ViT过度自信难题 | Meta提出CalAttn模块，用CLS Token范数动态调节温度，ECE降至1.25%

AI向量数据库大模型机器学习

书童带你领略视觉前沿之美，精选科研前沿、工业实用的知识供你我进步与学习！

2

0

0

0

ViT计算复杂度大降50% | BSPF-ViT：基于Block的对称剪枝让视觉Transformer飞起来

AI大模型向量数据库数据中台

书童带你领略视觉前沿之美，精选科研前沿、工业实用的知识供你我进步与学习！

7

0

0

0

告别固定参数时代：SMoEStereo动态适配不同场景，ETH3D跨域泛化性能达SOTA

AI大模型向量数据库云通信

书童带你领略视觉前沿之美，精选科研前沿、工业实用的知识供你我进步与学习！

13

0

0

0

告别知识漂移！实例级Top-k选择机制让模型自动适配最优教师路径，准确率最高提升12.3%

AI大模型向量数据库云通信

书童带你领略视觉前沿之美，精选科研前沿、工业实用的知识供你我进步与学习！

15

0

0

0

当VLM学会了“回头看” | Qwen-2.5-VL突破性发现，7B模型自主激活'视觉反思'，感知任务性能提升6.3%

AI大模型向量数据库云通信

书童带你领略视觉前沿之美，精选科研前沿、工业实用的知识供你我进步与学习！

58

0

0

0

告别人工标注！强化学习首次用于医学图像定位，Qwen2.5-VL模型在MS-CXR上准确率达83.12%

AI大模型向量数据库云存储

书童带你领略视觉前沿之美，精选科研前沿、工业实用的知识供你我进步与学习！

6

0

0

0

多模态推理革命 | 从感知到规划，全模态理解+Agent行为开启AI新范式

AI大模型向量数据库机器学习

书童带你领略视觉前沿之美，精选科研前沿、工业实用的知识供你我进步与学习！

23

0

0

0

ViT新突破 | NOVO让Transformer学会选择性遗忘，多类别遗忘准确率碾压现有方法7.3倍

AI大模型机器学习算法

书童带你领略视觉前沿之美，精选科研前沿、工业实用的知识供你我进步与学习！

7

0

0

0

YOLO-APD突破 | 复杂道路下行人检测mAP达77.7%，实时100帧/秒

AI向量数据库大模型机器学习

书童带你领略视觉前沿之美，精选科研前沿、工业实用的知识供你我进步与学习！

41

0

0

0

视觉表征新范式 | ToBo用Bottleneck token压缩场景，分割指标提升12.3%

AI大模型机器学习数据库

书童带你领略视觉前沿之美，精选科研前沿、工业实用的知识供你我进步与学习！

5

0

0

0

YOLOv11的小目标进化之路 | RS-TinyNet通过渐进式融合检测头实现多尺度目标精准定位

AI向量数据库大模型数据中台

书童带你领略视觉前沿之美，精选科研前沿、工业实用的知识供你我进步与学习！

64

0

0

0

多模态推理革命 | 从感知到规划，全模态理解+Agent行为开启AI新范式

AI大模型向量数据库数据中台

书童带你领略视觉前沿之美，精选科研前沿、工业实用的知识供你我进步与学习！

40

0

0

0

2025最新即插即用！把大牛的模块缝合到自己的paper里！轻松涨点

AI大模型机器学习算法

书童带你领略视觉前沿之美，精选科研前沿、工业实用的知识供你我进步与学习！

7

0

0

0

无需思维链的视觉顿悟 | Perception-R1开源，刷新大模型认知边界，横扫四大任务

AI大模型向量数据库机器学习

书童带你领略视觉前沿之美，精选科研前沿、工业实用的知识供你我进步与学习！

27

0

0

0

告别绝对坐标系！PRoPE编码革新多视角Transformer，首次统一内外参编码

AI大模型向量数据库机器学习

书童带你领略视觉前沿之美，精选科研前沿、工业实用的知识供你我进步与学习！

24

0

0

0

多模态统一模型新突破 | Ovis-U1实现理解+生成+编辑三合一，3B参数碾压GPT-4o视觉能力

AI大模型向量数据库云通信

书童带你领略视觉前沿之美，精选科研前沿、工业实用的知识供你我进步与学习！

27

0

0

0

视觉Agent新突破 | PyVision实现多轮代码生成，Claude-4.0在VLMsAreBlind准确率跃升31.1%

AI大模型向量数据库机器学习

书童带你领略视觉前沿之美，精选科研前沿、工业实用的知识供你我进步与学习！

15

0

0

0

开源模型自对齐新时代！RLAIF-V框架让7B模型目标幻觉率直降80.7%，12B模型全面超越GPT-4V

AI大模型向量数据库云通信

书童带你领略视觉前沿之美，精选科研前沿、工业实用的知识供你我进步与学习！

5

0

0

0