We're sorry but react app doesn't work properly without JavaScript enabled. Please enable it to continue.
文档
备案
控制台
登录
立即注册
首页
AI 大模型体验中心
动手实验室
Agent 评测集
AI 案例广场
学习中心
社区
去发布
首页
AI 大模型体验中心
动手实验室
Agent 评测集
AI 案例广场
学习中心
社区
余俊晖
文章
专栏
问答
余俊晖
多模态文档解析模型进展:UNIREC-0.1B架构、数据情况、实际测试
大模型
大模型
机器学习
算法
不定期分享自然语言处理、大语言模型,文档智能等领域前沿技术及实践。作者:老余,曾获CCF、Kaggle、ICPR、ICDAR等国内外近二十项算法竞赛/评测冠亚季军。曾发表sci、顶会等论文多篇。
116
0
0
0
余俊晖
多跳多模态知识图谱增强的检索增强生成方法:M3KG-RAG
音视频
大模型
向量数据库
机器学习
不定期分享自然语言处理、大语言模型,文档智能等领域前沿技术及实践。作者:老余,曾获CCF、Kaggle、ICPR、ICDAR等国内外近二十项算法竞赛/评测冠亚季军。曾发表sci、顶会等论文多篇。
30
0
0
0
余俊晖
强化学习中的熵坍缩
大模型
大模型
机器学习
算法
不定期分享自然语言处理、大语言模型,文档智能等领域前沿技术及实践。作者:老余,曾获CCF、Kaggle、ICPR、ICDAR等国内外近二十项算法竞赛/评测冠亚季军。曾发表sci、顶会等论文多篇。
38
0
0
0
余俊晖
文档智能解析新进展:字节多模态解析模型dolphin-v2开源
大模型
大模型
图像处理
机器学习
不定期分享自然语言处理、大语言模型,文档智能等领域前沿技术及实践。作者:老余,曾获CCF、Kaggle、ICPR、ICDAR等国内外近二十项算法竞赛/评测冠亚季军。曾发表sci、顶会等论文多篇。
41
0
0
0
余俊晖
从豆包手机等看GUI Agent:MobileRL GUI Agent训练框架和安卓XML预处理
AI
大模型
机器学习
操作系统
不定期分享自然语言处理、大语言模型,文档智能等领域前沿技术及实践。作者:老余,曾获CCF、Kaggle、ICPR、ICDAR等国内外近二十项算法竞赛/评测冠亚季军。曾发表sci、顶会等论文多篇。
39
0
0
0
余俊晖
多页文档理解强化学习设计思路:DocR1奖励函数设计与数据构建思路
大模型
大模型
机器学习
算法
不定期分享自然语言处理、大语言模型,文档智能等领域前沿技术及实践。作者:老余,曾获CCF、Kaggle、ICPR、ICDAR等国内外近二十项算法竞赛/评测冠亚季军。曾发表sci、顶会等论文多篇。
25
0
0
0
余俊晖
左脚踩右脚:大模型的有趣且简单的微调方式“SHADOW-FT”
大模型
大模型
机器学习
算法
不定期分享自然语言处理、大语言模型,文档智能等领域前沿技术及实践。作者:老余,曾获CCF、Kaggle、ICPR、ICDAR等国内外近二十项算法竞赛/评测冠亚季军。曾发表sci、顶会等论文多篇。
36
0
0
0
余俊晖
多模态视觉语言模型增强原生分辨率继续预训练方法-COMP架构及训练方法
大模型
大模型
机器学习
算法
不定期分享自然语言处理、大语言模型,文档智能等领域前沿技术及实践。作者:老余,曾获CCF、Kaggle、ICPR、ICDAR等国内外近二十项算法竞赛/评测冠亚季军。曾发表sci、顶会等论文多篇。
31
0
0
0
余俊晖
Qwen:Gated Attention为何简单高效并能消除Attention Sink?
大模型
大模型
机器学习
算法
不定期分享自然语言处理、大语言模型,文档智能等领域前沿技术及实践。作者:老余,曾获CCF、Kaggle、ICPR、ICDAR等国内外近二十项算法竞赛/评测冠亚季军。曾发表sci、顶会等论文多篇。
127
0
0
0
余俊晖
股票研究报告生成-基于LLM的多智能体框架FinRpt-Gen数据构建、方法框架
AI
大模型
机器学习
算法
不定期分享自然语言处理、大语言模型,文档智能等领域前沿技术及实践。作者:余俊晖,曾获CCF、Kaggle、ICPR、ICDAR等国内外近二十项算法竞赛/评测冠亚季军。曾发表sci、顶会等论文多篇。
483
0
0
0
余俊晖
文档智能解析方案总结进展更新(含ocr-pipline、layout+VLM+纯多模态端到端解析)
开源
大模型
机器学习
算法
不定期分享自然语言处理、大语言模型,文档智能等领域前沿技术及实践。作者:余俊晖,曾获CCF、Kaggle、ICPR、ICDAR等国内外近二十项算法竞赛/评测冠亚季军。曾发表sci、顶会等论文多篇。
57
0
0
0
余俊晖
大模型预训练语料提取-网页数据清洗工具思路:MinerU-HTML
大模型
大模型
机器学习
算法
不定期分享自然语言处理、大语言模型,文档智能等领域前沿技术及实践。作者:余俊晖,曾获CCF、Kaggle、ICPR、ICDAR等国内外近二十项算法竞赛/评测冠亚季军。曾发表sci、顶会等论文多篇。
75
0
0
0
余俊晖
多模态文档智能解析模型进展-英伟达开源NVIDIA-Nemotron-Parse-v1.1
AI
大模型
机器学习
数据库
不定期分享自然语言处理、大语言模型,文档智能等领域前沿技术及实践。作者:余俊晖,曾获CCF、Kaggle、ICPR、ICDAR等国内外近二十项算法竞赛/评测冠亚季军。曾发表sci、顶会等论文多篇。
52
0
0
0
余俊晖
多模态文档智能解析-MonkeyOCR v1.5框架、数据构造及特点
AI
机器学习
算法
图像处理
不定期分享自然语言处理、大语言模型,文档智能等领域前沿技术及实践。作者:余俊晖,曾获CCF、Kaggle、ICPR、ICDAR等国内外近二十项算法竞赛/评测冠亚季军。曾发表sci、顶会等论文多篇。
126
0
0
0
余俊晖
智能招聘-简历解析技术方案回忆及SmartResume demo方案解读
AI
大模型
机器学习
算法
不定期分享自然语言处理、大语言模型,文档智能等领域前沿技术及实践。作者:余俊晖,曾获CCF、Kaggle、ICPR、ICDAR等国内外近二十项算法竞赛/评测冠亚季军。曾发表sci、顶会等论文多篇。
68
0
0
0
余俊晖
RLVR训练多模态文档解析模型-olmOCR 2技术方案(模型、数据和代码均开源)
大模型
大模型
机器学习
算法
不定期分享自然语言处理、大语言模型,文档智能等领域前沿技术及实践。作者:余俊晖,曾获CCF、Kaggle、ICPR、ICDAR等国内外近二十项算法竞赛/评测冠亚季军。曾发表sci、顶会等论文多篇。
95
0
0
0
余俊晖
一套针对金融领域多模态问答的自适应多层级RAG框架-VeritasFi
AI
向量数据库
机器学习
算法
不定期分享自然语言处理、大语言模型,文档智能等领域前沿技术及实践。作者:余俊晖,曾获CCF、Kaggle、ICPR、ICDAR等国内外近二十项算法竞赛/评测冠亚季军。曾发表sci、顶会等论文多篇。
116
0
0
0
余俊晖
如何打造一个文档解析的多模态大模型?MinerU2.5架构、数据、训练方法
AI
大模型
机器学习
算法
不定期分享自然语言处理、大语言模型,文档智能等领域前沿技术及实践。作者:余俊晖,曾获CCF、Kaggle、ICPR、ICDAR等国内外近二十项算法竞赛/评测冠亚季军。曾发表sci、顶会等论文多篇。
297
0
0
0
余俊晖
端到端的多模态文档解析模型-DeepSeek-OCR架构、数据、训练方法
大模型
机器学习
算法
大模型
不定期分享自然语言处理、大语言模型,文档智能等领域前沿技术及实践。作者:余俊晖,曾获CCF、Kaggle、ICPR、ICDAR等国内外近二十项算法竞赛/评测冠亚季军。曾发表sci、顶会等论文多篇。
154
0
0
0
余俊晖
RAG各模块联合优化思路:多智能体协作建模-MMOA-RAG浅尝
AI
大模型
机器学习
算法
不定期分享自然语言处理、大语言模型,文档智能等领域前沿技术及实践。作者:余俊晖,曾获CCF、Kaggle、ICPR、ICDAR等国内外近二十项算法竞赛/评测冠亚季军。曾发表sci、顶会等论文多篇。
201
0
0
0