We're sorry but react app doesn't work properly without JavaScript enabled. Please enable it to continue.
文档
备案
控制台
登录
立即注册
首页
文章
问答
视频
活动
下载资源
团队号
镜像站
发布
ArronAI
文章
专栏
问答
ArronAI
LLM之RAG实战(五十三)| 微调Embedding模型:终极指南
AI
向量数据库
大模型
机器学习
这就是微调的用武之地 !!一、Embedding概念理解嵌入对于许多 NLP 任务至关重要,例如:Semantic Similarity(语义相似性): 查找两个图像或文本的相似程度。Text Classification(文本分类): 根据数据的含义将数据分组到各个类别中。Question Answering(问答): 查找最相关的文档来回答问题。RAG ( 检索增强生成): 将用于检索的嵌入模
16
0
0
0
ArronAI
LLM之Agent(十五)| 使用Langchain实现模型上下文协议(MCP)
AI
大模型
向量数据库
云安全
LLM)应用程序的一个关键限制,即它们与外部数据源和工具的隔离。AI Agent/LLM 的应用程序集成到外部数据源。LLMs/AI Agent和外部资源之间实现无缝、安全和可扩展的数据交换。下面演示一下如何使用Langchain完成MCP全流程:首先,创建一个名为MCP_Demo虚拟环境然后,激活该虚拟环境再安装相关包和Openai API Key关闭文本文件,使用以下命令启动并运行服务器:此时
139
0
0
0
ArronAI
继DeepSeek后,Manus震动AI圈,一码难求!外挂大脑,Manus震动AI圈
大模型
大模型
向量数据库
机器学习
吊打Deepseek?全球首款通用 Agent——Manus来了,其能力堪称一绝。它能够独立思考、规划并执行复杂任务,直接交付完整成果。与以往我们接触的智能工具相比,Claude 的 Computer use 虽能处理多任务,有的能帮忙点外卖、订酒店,但 Manus 的能力覆盖范围更广,执行质量也更高。网上已经有博主做了测试,例如让Manus帮你做一个烧饼小游戏,你只需说:请帮我做一个烧饼小游戏。
22
0
0
0
ArronAI
LLM之Agent(十四)| 字节开源ComputerUse纯视觉驱动GUI 智能体模型 UI-TARS
AI
向量数据库
大模型
云通信
一、简介主要功能代理工作流:利用复杂的 agent 框架来创建 agent flow,帮助你完成任务的规划和执行 ,平滑地编排搜索 、 浏览 、 探索链接等任务,同时通过 Event Stream 与 UI 连接,并合成信息以产生最终输出;全工具支持(浏览器、CLI、文件等) :利用复杂的代理框架来执行复杂的浏览器任务,例如 Deep Research 和其他 Operator 功能。还可以利用模
59
1
0
0
ArronAI
LLM之RAG理论(十四)| RAG 最佳实践
AI
向量数据库
大模型
机器学习
本文将从以下三方面进行介绍:首先,介绍经典的 RAG 流程。然后,介绍RAG 的每个模块的最佳实践。最后,提供一个全面的评估。一、经典的RAG流程经典的 RAG 工作流程一般包括几个中间处理步骤:查询分类(确定输入查询是否需要检索)检索(高效获取相关文件)重新排名(根据相关性优化检索到的文档的顺序)重新打包(将检索到的文档组织成结构化格式)摘要(提取关键信息以生成响应并消除冗余)实现 RAG 还涉
592
0
0
0
ArronAI
LLM之RAG实战(五十二)| 如何使用混合搜索优化RAG 检索
大模型
向量数据库
大模型
云通信
一、使用 BM25 进行关键字搜索https://api.python.langchain.com/en/latest/_modules/langchain_community/retrievers/bm25.html#BM25Retriever),可以看到它使用了 rank_bm25 包中的 BM25Okapi 类,该类是 ATIRE BM25 算法的略微修改版本。N 是语料库中的文档数df_t
57
0
0
0
ArronAI
LLM(十七)| 阿里Marco-o1:OpenAI-o1 的开源替代品
AI
大模型
向量数据库
云存储
Marco-o1 YouTube视频介绍:https://youtu.be/R1w145jU9f8一、什么是阿里巴巴的 Marco-o1?例如:想象一下 Marco-o1 是一个超级聪明的问题解决者。大多数模型(如数学、物理或编码)都擅长具有固定答案的问题,例如“什么是 2+2”或“如何修复此代码?这些都很简单,因为我们知道它们什么时候是对的,什么时候是错的。但 Marco-o1 不止于此。它还试
35
0
0
0
ArronAI
RAG等数据增强型LLM应用的4个任务级别
AI
大模型
向量数据库
数据安全
了解RAG应用常见的4个任务级别及其技术应对
46
0
0
0
ArronAI
知乎热议 | 为什么说在中国做科研最忌讳踏实?
云原生
大模型
向量数据库
机器学习
对于很多人来说,写学术论文确实是一个让很多人感到无从下手的任务。学术写作就像是一场探险,你手中握着的是一张张文献地图,而你的目标是找到一条通往知识宝藏的路径。在这个过程中,你可能会迷失方向,不知道从哪里开始。 是先确定研究问题,还是先阅读大量文献?是先搭建论文框架,还是先收集数据? 这些问题像是一团乱麻,让人摸不着头脑。科研者的科研之路确实是困难重重的, 论文一次次被拒,自己找不到方法,也没人指导
30
0
0
0
ArronAI
LLM漫谈(十)| DeepSeek R1 微调指南
AI
大模型
向量数据库
机器学习
在本文中,我们将深入探讨使用 Python 微调 DeepSeek R1模型的过程。一、先决条件:unsloth:可以使 Llama-3、Mistral、Phi-4 和 Gemma 等大型语言模型的微调速度提高了 2 倍,使用的内存减少70%,关键是准确性没有降低!torch:使用 PyTorch 进行深度学习的基本构建块,它提供了一个强大的张量库,类似于 NumPy,但它具有 GPU 加速的额外
44
0
0
0
ArronAI
知乎热议 | 为什么说在中国做科研最忌讳踏实?
AI
大模型
向量数据库
机器学习
对于很多人来说,写学术论文确实是一个让很多人感到无从下手的任务。学术写作就像是一场探险,你手中握着的是一张张文献地图,而你的目标是找到一条通往知识宝藏的路径。在这个过程中,你可能会迷失方向,不知道从哪里开始。 是先确定研究问题,还是先阅读大量文献?是先搭建论文框架,还是先收集数据? 这些问题像是一团乱麻,让人摸不着头脑。科研者的科研之路确实是困难重重的, 论文一次次被拒,自己找不到方法,也没人指导
35
0
0
0
ArronAI
DeepSeek-R1模型架构深度解读(十)从零构建DeepSeek-R1
AI
大模型
向量数据库
数据中台
DeepSeek-R1 模型训练流程代码示例讲解
222
0
0
0
ArronAI
LLM漫谈(九)| DeepSeek NSA论文全文翻译
AI
大模型
向量数据库
机器学习
摘要引言(1)硬件对齐的推理加速 :将理论计算减少转化为实际速度提升,需要在预填充和解码阶段进行硬件友好的算法设计,以缓解内存访问和硬件调度瓶颈; (2)训练感知的算法设计 :通过可训练的操作符实现端到端计算,以减少训练成本,同时保持模型性能。这些要求对于实际应用实现快速长文本推理或训练至关重要。在考虑这两个方面时,现有方法仍存在明显差距。2.1. 高效推理的幻象阶段限制的稀疏性:例如 H2O(Z
58
0
0
0
ArronAI
1天接收!首篇 DeepSeek SCI 已发表,1区高分期刊!
大模型
大模型
向量数据库
机器学习
高执行力是真的能吃到发文红利!DeepSeek官宣开源,说干就干的科研人已经抓住DeepSeek风口发表SCI了!来自意大利的一个研究团队, 通过De epSeek模型在中科院1区6.5分的Resuscitation期刊上,发表了一篇Letter,投稿1天就接收了!图源:Resuscitation期刊在用deepseek写论文的过程中,如果你也遇到了以下的问题:不知道论文怎么写,选题、写作毫无思路
49
0
0
0
ArronAI
20万卡吞金兽Grok-3变身“地球上最聪明的AI”,超越DeepSeek-R1,思维链&深度思考全上齐!
AI
大模型
向量数据库
机器学习
马斯克号称【聪明得吓人】的Grok-3来袭,真的是“地表最强”?
107
0
0
0
ArronAI
LLM(十六)| s1:50美元大模型可以和DeepSeek R1媲美吗?
大模型
大模型
向量数据库
机器学习
本文翻译自: https://medium.com/@florian_algo/s1-explained-can-a-50-llm-rival-deepseek-r1-dc4b30c87837一、s1 真的匹配甚至超越 OpenAI o1 和 DeepSeek-R1 吗?图 1: s1-32B 是一个开放且样本高效的推理模型。如图 1 所示,s1 没有超过 o1 甚至 o1-mini。二、那么 s
65
0
0
0
ArronAI
LLM(十五)| Kimi k1.5:解锁语言模型强化学习新高度
大模型
大模型
向量数据库
机器学习
在设计和训练 Kimi k1.5 的过程中,研究团队做了不少创新:长上下文扩展团队把强化学习的上下文窗口扩展到了 128k。简单来说,就是模型在处理信息时能 “看” 到更长的文本内容。而且,他们还使用了部分滚动(partial rollouts)技术,避免从头生成新轨迹的高成本,提升了训练效率。研究发现,上下文长度是强化学习与大语言模型结合发展的关键因素。 2. 改进策略优化研究人员推导出了基于长
55
0
0
0
ArronAI
LLM(十三)| DeepSeek-R1论文全文翻译
大模型
大模型
向量数据库
云安全
论文题目:《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》论文地址 :https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf以下是论文的翻译内容:摘要第一章 引言1.1 贡献后训练:大规模强化学习在
148
0
0
0
ArronAI
LLM(十四)| DeepSeek-R1概况
大模型
大模型
向量数据库
云安全
一、DeepSeek官网 :https://www.deepseek.com/DeepSeek-R1论文链接 :https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdfDeepSeek-R1新闻发布 :https://api-docs.deepseek.com/zh-cn/news/news250120DeepSeek
174
0
0
0
ArronAI
如何利用AI大模型突破研究瓶颈,提升学术创新效率与成果质量——研究者高效赋能指南
AI
大模型
向量数据库
云存储
中国科学院人才交流开发中心主办“人工智能大模型赋能科学研究效能提升与创新实战高级研修班”,旨在通过系统化的培训,使教师掌握最先进的人工智能技术及其应用场景,特别是在科研和教学中的应用。同时,课程还特别强调实际操作能力和创新能力的培养,通过 案例分析和实战演练 ,确保教师能够将所学知识应用于日常工作中,进而推动整个教育体系向更加智能化、个性化的方向发展。2024年成功举办10期,参加培训人员达200
148
0
0
0