We're sorry but react app doesn't work properly without JavaScript enabled. Please enable it to continue.
文档
备案
控制台
登录
立即注册
首页
文章
问答
视频
活动
下载资源
团队号
镜像站
发布
NLP前沿
文章
专栏
问答
NLP前沿
deepseek v3 0526,leak了?
大模型
大模型
向量数据库
云安全
一手ai news分享 \x26amp; 热点paper解读
6
0
0
0
NLP前沿
高端的推理模型,仅需一个训练样本~
大模型
大模型
向量数据库
机器学习
一手ai news分享 \x26amp; 热点paper解读
9
0
0
0
NLP前沿
bge出新向量模型了,准备更新吗?
大模型
向量数据库
大模型
NoSQL数据库
一手ai news分享 \x26amp; 热点paper解读
10
0
0
0
NLP前沿
deepseek r1 开源100天,开源社区的所有努力梳理~
开源
大模型
向量数据库
算法
一手ai news分享 \x26amp; 热点paper解读
23
0
0
0
NLP前沿
deepseek-R2,leak了
大模型
大模型
向量数据库
机器学习
一手ai news分享 \x26amp; 热点paper解读
21
0
0
0
NLP前沿
ToolRL,训练llm更好的使用工具。
大模型
大模型
向量数据库
机器学习
一手ai news分享 \x26amp; 热点paper解读
27
0
0
0
NLP前沿
推理大模型并非一定要推理。
AI
大模型
向量数据库
云存储
一手ai news分享 \x26amp; 热点paper解读
23
0
0
0
NLP前沿
智谱开源,深度思考、deepresearch模型。
开源
大模型
向量数据库
云通信
一手ai news分享 \x26amp; 热点paper解读
19
0
0
0
NLP前沿
deepseek开源的新算法,浅析~
AI
大模型
向量数据库
机器学习
一手ai news分享 \x26amp; 热点paper解读
14
0
0
0
NLP前沿
llama 4, 开源!
开源
大模型
向量数据库
机器学习
Meta 开源 llama4, 原生多模态模型, 惯例,支持200多种语言,除了中文。
59
0
0
0
NLP前沿
SuperRAG, 百川也开源了。
AI
向量数据库
大模型
机器学习
强化学习用于RAG 检索增强推理六小虎-百川 开源 ReSearch,一个 RL 框架,从零开始教 LLMs
79
0
0
0
NLP前沿
Qwen原生多模态开源,浅析一下~
开源
大模型
向量数据库
云通信
Qwen2.5-Omni 7B开源,Qwen的第一个端到端的多模态模型,可以文本、图像、音频和视频输入,同时以
392
0
0
0
NLP前沿
deepseek-r1,论文番外篇~
AI
大模型
向量数据库
数据中台
一篇对deepseek r1 论文补漏的文章,做了很多额外的实验,内容很到位,标题:Understanding
56
0
0
0
NLP前沿
GRPO训练的坑,字节帮你淌了,DAPO开源
大模型
大模型
数据库
算法
今天分享下这几天很火的这个工作,字节的DAPO工作。
162
0
0
0
NLP前沿
字节复刻了一个manus,还开源了~
开源
大模型
向量数据库
NoSQL数据库
源于开源,回馈开源
733
0
0
0
NLP前沿
昆仑天工Skywork R1V开源,行业内首个多模态推理模型~
开源
大模型
向量数据库
云安全
Skywork R1V开源,行业内首个开源的多模态推理模型。
72
0
0
0
NLP前沿
Google狙击OpenAI新产品,成功!
AI
向量数据库
大模型
数据库
前2天,有小道消息,chatgpt似乎马上要支持视频和音频了。 极有可能在 3 月 14 日 ChatGPT 2 周年时发布。然后今天Google发布Gemini 2.0 版本的原生图文输出,效果非常炸裂,上限及高。而且今天studio还支持了扔 youtube 视频地址进去了,直接理解。对比起来,openai的新产品好像就那样啦~免费在线体验地址:https://aistudio.google.
54
0
0
0
NLP前沿
raptor + graphrag = HiRAG,开源~
云原生
向量数据库
大模型
关系型数据库
论文笔记, 标题:Retrieval-Augmented Generation with Hierarchical Knowledge, 代码开源:https://github.com/hhy-huang/HiRAGraptor的特色应该就是聚类【向量空间距离】,抽象更高级的特征。graphrag的特色是通过实体连接起不同位置的关系【物理连接】,得到实体级别更丰富特征。二者结合一下,应该就是这篇文
83
0
0
0
NLP前沿
清华开源大模型推理框架:赤兔,deepseek部署成本减半~
大模型
大模型
向量数据库
机器学习
Chitu (赤兔) 是一个专注于效率、灵活性和可用性的高性能大语言模型推理框架。下表是 A800 推理deepseek r1-671B,与vllm的对比。赤兔用3个节点跑f8,性能跟6个节点跑bf16,是差不太多的。同样6个节点,vllm关闭cuda graph才能跑,输出6.85 token/s。 赤兔可以开启cuda graph鸡血模式跑,达到29.8token/s。开大batch size
98
0
0
0
NLP前沿
R1思考+RAG = R1-Searcher,开源~
云原生
火山方舟
向量数据库
大模型
论文笔记,标题:R1-Searcher: Incentivizing the Search Capability in LLMsvia Reinforcement Learning,代码开源,https://github.com/SsmallSong/R1-Searcher整体内容很不错的一篇文章,可以回答很多常见问题。比如:字符串的答案怎么去设计规则奖励?强化学习怎么数据怎么构造,怎么分步去设计
113
0
0
0