余俊晖的个人主页 - 开发者社区 - 火山引擎

文档备案控制台登录立即注册

首页文章活动开发者计划镜像站

发布

余俊晖

文章

专栏

问答

开源大模型如何选择？GPT-OSS综合评估与一些结论

大模型大模型向量数据库云安全

不定期分享自然语言处理、大语言模型，文档智能等领域前沿技术及实践。作者：余俊晖，曾获CCF、Kaggle、ICPR、ICDAR等国内外近二十项算法竞赛/评测冠亚季军。曾发表sci、顶会等论文多篇。

3

0

0

0

多模态RAG长文档问答的检索增强生成方案：层级索引与跨页证据整合-MMRAG-DocQA

AI向量数据库大模型NoSQL数据库

不定期分享自然语言处理、大语言模型，文档智能等领域前沿技术及实践。作者：余俊晖，曾获CCF、Kaggle、ICPR、ICDAR等国内外近二十项算法竞赛/评测冠亚季军。曾发表sci、顶会等论文多篇。

10

0

0

0

GLM-4.5V多模态核心架构设计和训练数据构建速览

AI大模型向量数据库云存储

不定期分享自然语言处理、大语言模型，文档智能等领域前沿技术及实践。作者：余俊晖，曾获CCF、Kaggle、ICPR、ICDAR等国内外近二十项算法竞赛/评测冠亚季军。曾发表sci、顶会等论文多篇。

13

0

0

0

通俗理解RoPE、2D-RoPE、M-RoPE

AI大模型向量数据库云通信

不定期分享自然语言处理、大语言模型，文档智能等领域前沿技术及实践。作者：余俊晖，曾获CCF、Kaggle、ICPR、ICDAR等国内外近二十项算法竞赛/评测冠亚季军。曾发表sci、顶会等论文多篇。

55

0

0

0

高质量多模态训练数据生成思路-SynthVLM

AI大模型向量数据库机器学习

不定期分享自然语言处理、大语言模型，文档智能等领域前沿技术及实践。作者：余俊晖，曾获CCF、Kaggle、ICPR、ICDAR等国内外近二十项算法竞赛/评测冠亚季军。曾发表sci、顶会等论文多篇。

24

0

0

0

多模态大模型统一布局生成方法微调数据集设计及模型架构统一训练思路

大模型大模型向量数据库机器学习

不定期分享自然语言处理、大语言模型，文档智能等领域前沿技术及实践。作者：余俊晖，曾获CCF、Kaggle、ICPR、ICDAR等国内外近二十项算法竞赛/评测冠亚季军。曾发表sci、顶会等论文多篇。

8

0

0

0

多模态大模型中高分辨率处理trick-通过自适应路由选择模块动态选择合适粒度

大模型大模型机器学习图像处理

不定期分享自然语言处理、大语言模型，文档智能等领域前沿技术及实践。作者：余俊晖，曾获CCF、Kaggle、ICPR、ICDAR等国内外近二十项算法竞赛/评测冠亚季军。曾发表sci、顶会等论文多篇。

4

0

0

0

多模态大模型中图像分辨率packing策略及原生分辨率NaViT的部分结论

大模型大模型向量数据库机器学习

不定期分享自然语言处理、大语言模型，文档智能等领域前沿技术及实践。作者：余俊晖，曾获CCF、Kaggle、ICPR、ICDAR等国内外近二十项算法竞赛/评测冠亚季军。曾发表sci、顶会等论文多篇。

20

0

0

0

多模态大模型中不同分辨率策略研究与原生分辨率的有效性评估

云原生向量数据库大模型数据库

不定期分享自然语言处理、大语言模型，文档智能等领域前沿技术及实践。作者：余俊晖，曾获CCF、Kaggle、ICPR、ICDAR等国内外近二十项算法竞赛/评测冠亚季军。曾发表sci、顶会等论文多篇。

38

0

0

0

图像、视频、音频多模态大模型中长上下文token压缩方法综述

AI大模型向量数据库机器学习

不定期分享自然语言处理、大语言模型，文档智能等领域前沿技术及实践。作者：余俊晖，曾获CCF、Kaggle、ICPR、ICDAR等国内外近二十项算法竞赛/评测冠亚季军。曾发表sci、顶会等论文多篇。

39

0

0

0

LLM+KG+Agent的Text2SPARQL多语言KBQA智能体框架—mKGQAgent

云原生向量数据库大模型数据库

不定期分享自然语言处理、大语言模型，文档智能等领域前沿技术及实践。作者：余俊晖，曾获CCF、Kaggle、ICPR、ICDAR等国内外近二十项算法竞赛/评测冠亚季军。曾发表sci、顶会等论文多篇。

41

0

0

0

GSPO梯度推导过程

AI大模型向量数据库机器学习

不定期分享自然语言处理、大语言模型，文档智能等领域前沿技术及实践。作者：余俊晖，曾获CCF、Kaggle、ICPR、ICDAR等国内外近二十项算法竞赛/评测冠亚季军。曾发表sci、顶会等论文多篇。

64

0

0

0

多阶段的多模态RAG幻觉缓解方案：智能眼镜等实时交互场景比赛方案-MM-RAG

AI大模型向量数据库机器学习

不定期分享自然语言处理、大语言模型，文档智能等领域前沿技术及实践。作者：余俊晖，曾获CCF、Kaggle、ICPR、ICDAR等国内外近二十项算法竞赛/评测冠亚季军。曾发表sci、顶会等论文多篇。

50

0

0

0

标签驱动的可信金融大模型训练全流程-Agentar-Fin-R1工程思路浅尝

AI大模型向量数据库机器学习

不定期分享自然语言处理、大语言模型，文档智能等领域前沿技术及实践。作者：余俊晖，曾获CCF、Kaggle、ICPR、ICDAR等国内外近二十项算法竞赛/评测冠亚季军。曾发表sci、顶会等论文多篇。

689

0

0

0

GRPO强化学习缓解多模态大模型OCR任务的幻觉思路及数据生成思路

AI大模型向量数据库云通信

不定期分享自然语言处理、大语言模型，文档智能等领域前沿技术及实践。作者：余俊晖，曾获CCF、Kaggle、ICPR、ICDAR等国内外近二十项算法竞赛/评测冠亚季军。曾发表sci、顶会等论文多篇。

61

0

0

0

Agent设计12要素：构建可靠的AI Agent

AI大模型向量数据库数据中台

不定期分享自然语言处理、大语言模型，文档智能等领域前沿技术及实践。作者：余俊晖，曾获CCF、Kaggle、ICPR、ICDAR等国内外近二十项算法竞赛/评测冠亚季军。曾发表sci、顶会等论文多篇。

80

0

0

0

多模态视觉语言模型FILA-细粒度分辨率融合策略

AI大模型向量数据库机器学习

不定期分享自然语言处理、大语言模型，文档智能等领域前沿技术及实践。作者：余俊晖，曾获CCF、Kaggle、ICPR、ICDAR等国内外近二十项算法竞赛/评测冠亚季军。曾发表sci、顶会等论文多篇。

48

0

0

0

GRPO强化学习缓解多模态大模型OCR任务的幻觉思路及数据生成思路

AI大模型向量数据库云通信

不定期分享自然语言处理、大语言模型，文档智能等领域前沿技术及实践。作者：余俊晖，曾获CCF、Kaggle、ICPR、ICDAR等国内外近二十项算法竞赛/评测冠亚季军。曾发表sci、顶会等论文多篇。

80

0

0

0

多模态视觉语言模型FILA-细粒度分辨率融合策略

AI大模型向量数据库机器学习

不定期分享自然语言处理、大语言模型，文档智能等领域前沿技术及实践。作者：余俊晖，曾获CCF、Kaggle、ICPR、ICDAR等国内外近二十项算法竞赛/评测冠亚季军。曾发表sci、顶会等论文多篇。

45

0

0

0

Agent设计12要素：构建可靠的AI Agent

AI大模型向量数据库数据中台

不定期分享自然语言处理、大语言模型，文档智能等领域前沿技术及实践。作者：余俊晖，曾获CCF、Kaggle、ICPR、ICDAR等国内外近二十项算法竞赛/评测冠亚季军。曾发表sci、顶会等论文多篇。

70

0

0

0