NLP前沿
NLP前沿
大模型大模型向量数据库机器学习
一手ai news分享 \x26amp; 热点paper解读
8
0
0
0
大模型大模型向量数据库机器学习
一手ai news分享 \x26amp; 热点paper解读
15
0
0
0
AI大模型向量数据库云存储
一手ai news分享 \x26amp; 热点paper解读
12
0
0
0
开源大模型向量数据库云通信
一手ai news分享 \x26amp; 热点paper解读
10
0
0
0
AI大模型向量数据库机器学习
一手ai news分享 \x26amp; 热点paper解读
11
0
0
0
开源大模型向量数据库机器学习
Meta 开源 llama4, 原生多模态模型, 惯例,支持200多种语言,除了中文。
37
0
0
0
AI向量数据库大模型机器学习
强化学习用于RAG 检索增强推理六小虎-百川 开源 ReSearch,一个 RL 框架,从零开始教 LLMs
57
0
0
0
开源大模型向量数据库云通信
Qwen2.5-Omni 7B开源,Qwen的第一个端到端的多模态模型,可以文本、图像、音频和视频输入,同时以
376
0
0
0
AI大模型向量数据库数据中台
一篇对deepseek r1 论文补漏的文章,做了很多额外的实验,内容很到位,标题:Understanding
49
0
0
0
大模型大模型数据库算法
今天分享下这几天很火的这个工作,字节的DAPO工作。
122
0
0
0
开源大模型向量数据库NoSQL数据库
源于开源,回馈开源
599
0
0
0
开源大模型向量数据库云安全
Skywork R1V开源,行业内首个开源的多模态推理模型。
64
0
0
0
AI向量数据库大模型数据库
前2天,有小道消息,chatgpt似乎马上要支持视频和音频了。 极有可能在 3 月 14 日 ChatGPT 2 周年时发布。然后今天Google发布Gemini 2.0 版本的原生图文输出,效果非常炸裂,上限及高。而且今天studio还支持了扔 youtube 视频地址进去了,直接理解。对比起来,openai的新产品好像就那样啦~免费在线体验地址:https://aistudio.google.
52
0
0
0
云原生向量数据库大模型关系型数据库
论文笔记, 标题:Retrieval-Augmented Generation with Hierarchical Knowledge, 代码开源:https://github.com/hhy-huang/HiRAGraptor的特色应该就是聚类【向量空间距离】,抽象更高级的特征。graphrag的特色是通过实体连接起不同位置的关系【物理连接】,得到实体级别更丰富特征。二者结合一下,应该就是这篇文
70
0
0
0
大模型大模型向量数据库机器学习
Chitu (赤兔) 是一个专注于效率、灵活性和可用性的高性能大语言模型推理框架。下表是 A800 推理deepseek r1-671B,与vllm的对比。赤兔用3个节点跑f8,性能跟6个节点跑bf16,是差不太多的。同样6个节点,vllm关闭cuda graph才能跑,输出6.85 token/s。 赤兔可以开启cuda graph鸡血模式跑,达到29.8token/s。开大batch size
75
0
0
0
云原生火山方舟向量数据库大模型
论文笔记,标题:R1-Searcher: Incentivizing the Search Capability in LLMsvia Reinforcement Learning,代码开源,https://github.com/SsmallSong/R1-Searcher整体内容很不错的一篇文章,可以回答很多常见问题。比如:字符串的答案怎么去设计规则奖励?强化学习怎么数据怎么构造,怎么分步去设计
98
0
0
0
开源大模型向量数据库机器学习
刚刚,Gemma3 开源引入了多模态,支持视觉-语言输入和文本输出。4个尺寸,最长128k上下文,支持图文输入,文本输出。竞技场上评分最高的稠密模型。模型地址:https://huggingface.co/collections/google/gemma-3-release-67c6c6f89c4f76621268bb6d官方博客:https://developers.googleblog.com
59
0
0
0
开源向量数据库大模型数据库
一个新的开源项目,DeepRetrieval论文地址:https://arxiv.org/pdf/2503.00223github: https://github.com/pat-jj/DeepRetrieval咋把RL的思路用到搜索上呢?这个工作做的有点曲折。让LLM对query改写,用改写的query去搜索知识库,比较检索到的doc与真实doc的相似度,并赋予Reward。相当于使用DeepR
50
0
0
0
开源向量数据库大模型NoSQL数据库
BGE昨天开源了新的多模态向量模型。论文地址:https://arxiv.org/abs/2412.14475项目主页:https://github.com/VectorSpaceLab/MegaPairs模型地址:https://huggingface.co/BAAI/BGE-VL-MLLM-S1多模态的架构意味着它可以,文本+图片 召回 文本/图片。支持图文多模态的检索,三个大小,base版本
69
0
0
0
AI向量数据库大模型数据中台
Mistral AI发布世界上最好用的OCR模型,专注于高精度的文档理解和信息提取,特别适用于 复杂 PDF、图像、表格、数学公式、多语言文档 等多种格式。在严格的基准测试中,Mistral OCR 的性能始终优于其他领先的 OCR 模型。它在文档分析的多个方面都具有出色的准确性,如下所示。按语言目前可以再Le Chat上免费测试,也可以调用 API mistral-ocr-latest,价格10
154
0
0
0