We're sorry but react app doesn't work properly without JavaScript enabled. Please enable it to continue.
文档
备案
控制台
登录
立即注册
首页
文章
问答
视频
活动
下载资源
团队号
镜像站
发布
NLP前沿
文章
专栏
问答
NLP前沿
deepseek-R2,leak了
大模型
大模型
向量数据库
机器学习
一手ai news分享 \x26amp; 热点paper解读
8
0
0
0
NLP前沿
ToolRL,训练llm更好的使用工具。
大模型
大模型
向量数据库
机器学习
一手ai news分享 \x26amp; 热点paper解读
15
0
0
0
NLP前沿
推理大模型并非一定要推理。
AI
大模型
向量数据库
云存储
一手ai news分享 \x26amp; 热点paper解读
12
0
0
0
NLP前沿
智谱开源,深度思考、deepresearch模型。
开源
大模型
向量数据库
云通信
一手ai news分享 \x26amp; 热点paper解读
10
0
0
0
NLP前沿
deepseek开源的新算法,浅析~
AI
大模型
向量数据库
机器学习
一手ai news分享 \x26amp; 热点paper解读
11
0
0
0
NLP前沿
llama 4, 开源!
开源
大模型
向量数据库
机器学习
Meta 开源 llama4, 原生多模态模型, 惯例,支持200多种语言,除了中文。
37
0
0
0
NLP前沿
SuperRAG, 百川也开源了。
AI
向量数据库
大模型
机器学习
强化学习用于RAG 检索增强推理六小虎-百川 开源 ReSearch,一个 RL 框架,从零开始教 LLMs
57
0
0
0
NLP前沿
Qwen原生多模态开源,浅析一下~
开源
大模型
向量数据库
云通信
Qwen2.5-Omni 7B开源,Qwen的第一个端到端的多模态模型,可以文本、图像、音频和视频输入,同时以
376
0
0
0
NLP前沿
deepseek-r1,论文番外篇~
AI
大模型
向量数据库
数据中台
一篇对deepseek r1 论文补漏的文章,做了很多额外的实验,内容很到位,标题:Understanding
49
0
0
0
NLP前沿
GRPO训练的坑,字节帮你淌了,DAPO开源
大模型
大模型
数据库
算法
今天分享下这几天很火的这个工作,字节的DAPO工作。
122
0
0
0
NLP前沿
字节复刻了一个manus,还开源了~
开源
大模型
向量数据库
NoSQL数据库
源于开源,回馈开源
599
0
0
0
NLP前沿
昆仑天工Skywork R1V开源,行业内首个多模态推理模型~
开源
大模型
向量数据库
云安全
Skywork R1V开源,行业内首个开源的多模态推理模型。
64
0
0
0
NLP前沿
Google狙击OpenAI新产品,成功!
AI
向量数据库
大模型
数据库
前2天,有小道消息,chatgpt似乎马上要支持视频和音频了。 极有可能在 3 月 14 日 ChatGPT 2 周年时发布。然后今天Google发布Gemini 2.0 版本的原生图文输出,效果非常炸裂,上限及高。而且今天studio还支持了扔 youtube 视频地址进去了,直接理解。对比起来,openai的新产品好像就那样啦~免费在线体验地址:https://aistudio.google.
52
0
0
0
NLP前沿
raptor + graphrag = HiRAG,开源~
云原生
向量数据库
大模型
关系型数据库
论文笔记, 标题:Retrieval-Augmented Generation with Hierarchical Knowledge, 代码开源:https://github.com/hhy-huang/HiRAGraptor的特色应该就是聚类【向量空间距离】,抽象更高级的特征。graphrag的特色是通过实体连接起不同位置的关系【物理连接】,得到实体级别更丰富特征。二者结合一下,应该就是这篇文
70
0
0
0
NLP前沿
清华开源大模型推理框架:赤兔,deepseek部署成本减半~
大模型
大模型
向量数据库
机器学习
Chitu (赤兔) 是一个专注于效率、灵活性和可用性的高性能大语言模型推理框架。下表是 A800 推理deepseek r1-671B,与vllm的对比。赤兔用3个节点跑f8,性能跟6个节点跑bf16,是差不太多的。同样6个节点,vllm关闭cuda graph才能跑,输出6.85 token/s。 赤兔可以开启cuda graph鸡血模式跑,达到29.8token/s。开大batch size
75
0
0
0
NLP前沿
R1思考+RAG = R1-Searcher,开源~
云原生
火山方舟
向量数据库
大模型
论文笔记,标题:R1-Searcher: Incentivizing the Search Capability in LLMsvia Reinforcement Learning,代码开源,https://github.com/SsmallSong/R1-Searcher整体内容很不错的一篇文章,可以回答很多常见问题。比如:字符串的答案怎么去设计规则奖励?强化学习怎么数据怎么构造,怎么分步去设计
98
0
0
0
NLP前沿
Google Gemma3 开源,多模态大模型!
开源
大模型
向量数据库
机器学习
刚刚,Gemma3 开源引入了多模态,支持视觉-语言输入和文本输出。4个尺寸,最长128k上下文,支持图文输入,文本输出。竞技场上评分最高的稠密模型。模型地址:https://huggingface.co/collections/google/gemma-3-release-67c6c6f89c4f76621268bb6d官方博客:https://developers.googleblog.com
59
0
0
0
NLP前沿
搜索 + RL = DeepRetrieval, 开源!
开源
向量数据库
大模型
数据库
一个新的开源项目,DeepRetrieval论文地址:https://arxiv.org/pdf/2503.00223github: https://github.com/pat-jj/DeepRetrieval咋把RL的思路用到搜索上呢?这个工作做的有点曲折。让LLM对query改写,用改写的query去搜索知识库,比较检索到的doc与真实doc的相似度,并赋予Reward。相当于使用DeepR
50
0
0
0
NLP前沿
bge开源新向量模型了,冲!
开源
向量数据库
大模型
NoSQL数据库
BGE昨天开源了新的多模态向量模型。论文地址:https://arxiv.org/abs/2412.14475项目主页:https://github.com/VectorSpaceLab/MegaPairs模型地址:https://huggingface.co/BAAI/BGE-VL-MLLM-S1多模态的架构意味着它可以,文本+图片 召回 文本/图片。支持图文多模态的检索,三个大小,base版本
69
0
0
0
NLP前沿
Mistral发布史上最强、最好用OCR模型
AI
向量数据库
大模型
数据中台
Mistral AI发布世界上最好用的OCR模型,专注于高精度的文档理解和信息提取,特别适用于 复杂 PDF、图像、表格、数学公式、多语言文档 等多种格式。在严格的基准测试中,Mistral OCR 的性能始终优于其他领先的 OCR 模型。它在文档分析的多个方面都具有出色的准确性,如下所示。按语言目前可以再Le Chat上免费测试,也可以调用 API mistral-ocr-latest,价格10
154
0
0
0