AI工程化
AI工程化
大模型大模型向量数据库机器学习
DeepSeek在领域内获得广泛关注的核心在于R1-Zero 仅通过强化学习(RL)便成功实现了推理能力的涌现,即发现Aha moment 。那么,在多模态领域,是否也能获得借鉴R1-Zero的思路呢?今天介绍的Vision-R1就是这一方面的探索的代表, 其目的就是研究如何有效利用 RL 来增强多模态大型语言模型(MLLM)的推理能力。然而,研究团队发现,由于缺乏大规模、高质量的多模态推理数据,
9
0
0
0
大数据大数据机器学习数据库
Gartner 近日在其数据与分析峰会上发布了2025 年数据与分析 (D&A) 领域顶级趋势的预测。分析师指出,这些趋势预示着 D&A 将从少数人的专属领域走向无处不在,同时也为企业带来了组织和人才等多方面的挑战。Gartner 分析师重点阐述了 IT 领导者必须理解并融入其数据与分析战略的以下顶级趋势:1. 高度可消费的数据产品: 为了充分利用数据产品,企业应聚焦于业务关键用例,关联并扩展数据
9
0
0
0
大模型大模型向量数据库机器学习
之前我们曾介绍过清华推出的KTransformers《KTransformers:让DeepSeek加速28倍的国产推理框架》,令人印象深刻,该项目也在持续更新中,刚刚宣布针对支持AMD GPU ROCm 平台及支持 unsloth 1.58/2.51 位权重和 IQ1_S/FP8 混合权重训练。近日,清华又一团队推出一个大模型推理引擎项目Chitu (赤兔) ,称可将DeepSeek推理成本降一
9
0
0
0
AI向量数据库大模型数据库
2025进入Agent开发的热度快速升温,OpenAI先前已经发布了Deep Research、Operator这样的Agent产品,但迟迟没有面向开发者提供Agent构建能力,而多agent构建的框架swarm也仅仅是一个原型展示版本(Swarm:一个OpenAI开源的multiAgent框架,简单哲学的代表),但开发者对Agent的热情,不得不让OpenAI加速了开放API的进程,今日凌晨,宣
14
0
0
0
AI大模型向量数据库机器学习
DeepSeek-671B 推理方案目前相对比较成熟,如何微调满血版本实践案例较少,今天介绍一个 由中国科学院自动化研究所与中科闻歌联合推出的 全参数微调开源项目,能够给开发者微调DeepSeek给予一些参考。该项目不仅提供了从模型训练到推理的完整代码和脚本,还分享了实际训练中的经验总结与优化建议。项目亮点包括:完整训练逻辑代码基于 DeepSeek-V3 论文,结合 DeepSeek-V2 代码
38
0
0
0
AI大模型向量数据库云存储
前天开始,一款名为 Manus 的泛任务 Agent 在网络上迅速走红,引发了褒贬不一的讨论。赞扬者欣赏其异步可视化的模式,认为它将原本抽象的 AGI 的具像化表现,更有人称这是继deepseek之后的又一大胜利;批评者则认为其技术创新有限,并指出国外早有类似产品。借助 Claude 等具备优秀规划和编程能力的大模型,再结合浏览器自动化(浏览器自动化工具 browser-use:让 AI 轻松操控
17
0
0
0
AI大模型向量数据库云安全
当前,LLM的应用场景已远不止简单的对话,而是扩展到需要多轮交互、复杂逻辑控制以及与外部环境集成的复杂任务。因此,在构建复杂、高效且可控的LLM应用仍然面临诸多瓶颈,比如:推理速度慢: 复杂的LLM应用通常需要多次调用模型,重复计算和数据传输导致整体延迟较高。控制性不足: 传统的方式难以精确控制LLM的生成过程,限制了应用的灵活性和可靠性。编程复杂性高: 缺乏专门为LLM应用设计的编程语言和工具,
82
0
0
0
大模型大模型向量数据库云通信
OpenAI 昨晚宣布推出其最新的预训练模型 GPT-4.5,这是一款在规模和知识水平上均达到新高度的产品,被OpenAI誉为其“迄今为止最大、知识最渊博的模型”,标志着无监督学习的又一次重大飞跃。 GPT-4.5 目前作为研究预览版,向 ChatGPT Pro 用户和开发者开放,预计下周将向 Plus 用户和其他用户开放。核心更新与特点预训练规模显著提升 :GPT-4.5 的预训练计算规模大约是
27
0
0
0
大模型大模型向量数据库机器学习
Anthropic 公司北京时间25日凌晨发布了 Claude 3.7 Sonnet,一款具备混合推理能力的大型语言模型,以及 Claude Code,一个面向开发者的智能编码助手。Anthropic 公司时隔四个月终于推出了自家的新模型Claude 3.7 Sonnet,这款模型最大的创新在于其“混合推理”能力,具体特性如下:混合推理能力:这是该模型最显著的特点,它允许模型在“即时响应”和“深度
36
0
0
0
AI大模型向量数据库云存储
Cline 近日宣布推出备受期待的 MCP 应用商店,这是一项改变游戏规则的功能,它简化了 AI 功能的安装和管理。 此版本的发布标志着让更广泛的受众(无论其技术专长如何)都能使用 AI 工具向前迈出了重要一步。MCP 应用商店的功能非常像 AI 的应用商店,允许用户只需单击一下即可发现并安装各种 MCP 服务器。 MCP(Model Context Protocol,模型上下文协议)是由Anth
86
0
0
0
云原生向量数据库大模型云通信
OpenAI的Deep Research工具横空出世后,各大厂商都推出了自研的Deep Research工具。所谓Deep Research,是和普通搜索比较的,简单的RAG检索生成一般只有一轮检索。然而Deep Research可以像人类一样,根据一个主题不断的检索,分析,再检索,再分析,直到达到研究目的。从这这个角度上讲,它本质上就是一个升级版的RAG应用,利用ReAct/Plan And S
378
0
0
0
AI大模型机器学习算法
近日,Unsloth 团队宣布对其微调框架进行了升级,优化了内存使用效率。现在,使用 Unsloth 微调 Qwen2.5-1.5B 模型仅需 5GB 显存,相比之前所需的 7GB 显存,内存占用减少了约 29%。延伸阅读:DeepSeek GRPO 技术揭秘:Unsloth 助力 7GB 显存体验“顿悟时刻”此次升级主要得益于 Unsloth Efficient GRPO 算法的推出,该算法在保
44
0
0
0
AI大模型向量数据库云通信
以前OpenAI CTO Mira Murati为CEO的新公司Thinking Machines Lab正式成立,一众OpenAI出走员工加入,这其中就包括前不久离职的北大才女Lilian Weng(翁荔),她提出的Agent公式(Agent=大模型+记忆+主动规划+工具使用)被业界广泛认可。除此之外,前OpenAI联合创始人兼关键领导者John Schulman加入公司任首席科学家,前Open
19
0
0
0
AIGPU大模型数据库
xAI 近日宣布推出 Grok 3,这是继 Grok 2 之后的又一重大更新。 Grok 3 在性能上实现了显著提升,据 Elon Musk 透露,其能力比 Grok 2 提升了整整一个数量级。Grok 3 的发布得益于 200K 个GPU 的计算能力,这一数字在短短 92 天内翻倍。 Grok 3 的训练量是 Grok 2 的10 倍,并在一月份完成了预训练。这一模型仍在不断训练中,预示着其未来
17
0
0
0
AI大模型向量数据库机器学习
OpenAI 的 CEO Sam Altman 在 社交媒体上分享了关于 GPT-4.5 和 GPT-5 的最新进展。OpenAI 承认目前的产品线对用户来说过于复杂,因此他们正在努力简化产品,目标是让 AI 能够“开箱即用”。GPT-4.5 (内部代号为 Orion) 将会是最后一个“非思维链模型”,而 GPT-5 则将整合包括 o3 在内的多项技术,成为一个集大成者。 未来,OpenAI 将不
23
0
0
0
AI大模型机器学习容器
今天介绍一款国产的推理加速框架,它让deepseek的推理速度又上一个档次。 它就是由清华大学 MADSys 团队和 Approaching.AI 共同开发一个新项目KTransformers(Quick Transformers),它是一个基于 Python 的框架,专注于提升 Hugging Face Transformers 的使用体验。 它通过先进的内核优化和并行策略,显著提高 LLM 的
231
0
0
0
AI大模型向量数据库云原生可观测
Windsurf Wave 3,Codeium 的最新更新,已于 2025 年2 月13 日发布,带来了多项新功能和改进。其中,Model Context Protocol (MCP) 的支持是亮点之一,它为用户提供了更多工具,以增强 Cascade 的功能。Wave 3 的主要更新包括:MCP 支持 :用户现在可以通过 Windsurf 设置面板指定 MCP 服务器,使 Cascade 能够调用
190
0
0
0
AIGPU机器学习算法
英伟达工程师最近用 DeepSeek-R1 模型加上“推理时扩展”技术,让 AI 自动生成 GPU 核心代码,也就是 GPU 内核。更让人惊讶的是,有些 AI 生成的代码甚至比工程师写的还要好!随着 AI 模型处理越来越复杂的任务,它们对计算资源的需求也在不断增长。 GPU 内核作为执行计算任务的关键部分,其优化程度直接关系到模型的性能。然而,传统的内核优化需要大量时间和专业知识,效率低下。NVI
19
0
0
0
AI大模型向量数据库数据中台
Anthropic 近日发布了其首个经济指数报告,旨在深入理解人工智能(AI)对劳动市场和经济的长期影响。该报告基于数百万匿名化的 Claude.ai 对话数据,揭示了 AI 在现代经济中如何被整合到实际任务中的最新情况。该公司还开源了该分析中使用的数据集,鼓励进一步的研究和合作。该经济指数的初步调查结果揭示了几个关键趋势:集中使用: AI的使用主要集中在软件开发和技术写作任务中。大约36%的职业
22
0
0
0
AI大模型向量数据库机器学习
Sam Altman 在其博客中分享了对 AGI发展的深刻见解和重要观察。以下是他博文的一些观点介绍。Altman 开篇即强调了 OpenAI 的核心使命:确保 AGI 能够造福全人类。他指出,虽然 AGI 的定义仍然模糊,但广义上可以理解为一个能够在多个领域解决越来越复杂问题,并达到人类水平的系统。在他看来,人类作为工具创造者,具有理解和创造的内在驱动力。每一代人都在前人发现的基础上创造更强大的
18
0
0
0