AI工程化
AI工程化
AI大模型向量数据库数据中台
昨日,AI届“汪峰”Qwen团队发布了Qwen2.5-VL-32B-Instruct,作为Qwen2.5-VL
2
0
0
0
大模型大模型向量数据库数据库
Google DeepMind昨日发布了其最新模型Gemini 2.5,首发版本为Pro Experimental,在多个基准测试中达到了业界领先水平。Gemini 2.5具有以下技术特点:推理能力:Gemini 2.5能够通过推理来处理问题,模仿人类思考过程,逐步解决问题,并选择最佳解决方案。多模态推理:该模型能够处理多种类型的数据,包括文本、图像和音频,使其在处理复杂任务时更加灵活。强大的处理
3
0
0
0
大模型大模型向量数据库云安全
在之前的文章里,我们介绍过 Apollo Research有关大模型的一些安全研究:Apollo最新报告:顶级大模型有了自己的“心机”,人类小心被算计最近,他们又发现一个令人惊讶的现象:AI模型,尤其是Claude Sonnet 3.7,在评估过程中能够意识到自己正在被测试。这一发现不仅对AI的安全评估提出了新的挑战,也引发了关于AI自我意识本质的深入思考。根据Apollo Research在社交
7
0
0
0
AI大模型
大模型已经进入生产落地时代,一些工程性问题逐渐暴露,从计算资源需求激增、内存瓶颈到分布式协调困难,传统的推理服务架构已难以应对。近日,NVIDIA 在其开发者大会推出 一个开源高性能推理框架——Dynamo,专为解决大规模分布式环境中的生成式AI模型服务难题而设计。它以Rust语言为主(55.5%)构建,同时融合Go(28.5%)和Python(9.3%),确保了高性能与易扩展性的完美结合。官方测
48
0
0
0
AI大模型向量数据库云通信
自从 2023 年 OpenAI 推出函数调用(function-call)功能以来,我们便开始思考如何构建一个真正繁荣的 AI Agent 和工具生态系统。然而,随着 AI 基础模型日益强大,一个意想不到的挑战浮出水面:每一种模型都需要有一套函数调用接口的规范,这导致了 AI 与外部世界的连接变得前所未有的割裂和碎片化。我们迫切需要一个统一的“通用语”,打破 AI 与工具之间的藩篱,实现无缝衔接
24
0
0
0
大模型大模型向量数据库机器学习
DeepSeek在领域内获得广泛关注的核心在于R1-Zero 仅通过强化学习(RL)便成功实现了推理能力的涌现,即发现Aha moment 。那么,在多模态领域,是否也能获得借鉴R1-Zero的思路呢?今天介绍的Vision-R1就是这一方面的探索的代表, 其目的就是研究如何有效利用 RL 来增强多模态大型语言模型(MLLM)的推理能力。然而,研究团队发现,由于缺乏大规模、高质量的多模态推理数据,
26
0
0
0
大数据大数据机器学习数据库
Gartner 近日在其数据与分析峰会上发布了2025 年数据与分析 (D&A) 领域顶级趋势的预测。分析师指出,这些趋势预示着 D&A 将从少数人的专属领域走向无处不在,同时也为企业带来了组织和人才等多方面的挑战。Gartner 分析师重点阐述了 IT 领导者必须理解并融入其数据与分析战略的以下顶级趋势:1. 高度可消费的数据产品: 为了充分利用数据产品,企业应聚焦于业务关键用例,关联并扩展数据
22
0
0
0
大模型大模型向量数据库机器学习
之前我们曾介绍过清华推出的KTransformers《KTransformers:让DeepSeek加速28倍的国产推理框架》,令人印象深刻,该项目也在持续更新中,刚刚宣布针对支持AMD GPU ROCm 平台及支持 unsloth 1.58/2.51 位权重和 IQ1_S/FP8 混合权重训练。近日,清华又一团队推出一个大模型推理引擎项目Chitu (赤兔) ,称可将DeepSeek推理成本降一
26
0
0
0
AI向量数据库大模型数据库
2025进入Agent开发的热度快速升温,OpenAI先前已经发布了Deep Research、Operator这样的Agent产品,但迟迟没有面向开发者提供Agent构建能力,而多agent构建的框架swarm也仅仅是一个原型展示版本(Swarm:一个OpenAI开源的multiAgent框架,简单哲学的代表),但开发者对Agent的热情,不得不让OpenAI加速了开放API的进程,今日凌晨,宣
26
0
0
0
AI大模型向量数据库机器学习
DeepSeek-671B 推理方案目前相对比较成熟,如何微调满血版本实践案例较少,今天介绍一个 由中国科学院自动化研究所与中科闻歌联合推出的 全参数微调开源项目,能够给开发者微调DeepSeek给予一些参考。该项目不仅提供了从模型训练到推理的完整代码和脚本,还分享了实际训练中的经验总结与优化建议。项目亮点包括:完整训练逻辑代码基于 DeepSeek-V3 论文,结合 DeepSeek-V2 代码
67
0
0
0
AI大模型向量数据库云存储
前天开始,一款名为 Manus 的泛任务 Agent 在网络上迅速走红,引发了褒贬不一的讨论。赞扬者欣赏其异步可视化的模式,认为它将原本抽象的 AGI 的具像化表现,更有人称这是继deepseek之后的又一大胜利;批评者则认为其技术创新有限,并指出国外早有类似产品。借助 Claude 等具备优秀规划和编程能力的大模型,再结合浏览器自动化(浏览器自动化工具 browser-use:让 AI 轻松操控
24
0
0
0
AI大模型向量数据库云安全
当前,LLM的应用场景已远不止简单的对话,而是扩展到需要多轮交互、复杂逻辑控制以及与外部环境集成的复杂任务。因此,在构建复杂、高效且可控的LLM应用仍然面临诸多瓶颈,比如:推理速度慢: 复杂的LLM应用通常需要多次调用模型,重复计算和数据传输导致整体延迟较高。控制性不足: 传统的方式难以精确控制LLM的生成过程,限制了应用的灵活性和可靠性。编程复杂性高: 缺乏专门为LLM应用设计的编程语言和工具,
115
0
0
0
大模型大模型向量数据库云通信
OpenAI 昨晚宣布推出其最新的预训练模型 GPT-4.5,这是一款在规模和知识水平上均达到新高度的产品,被OpenAI誉为其“迄今为止最大、知识最渊博的模型”,标志着无监督学习的又一次重大飞跃。 GPT-4.5 目前作为研究预览版,向 ChatGPT Pro 用户和开发者开放,预计下周将向 Plus 用户和其他用户开放。核心更新与特点预训练规模显著提升 :GPT-4.5 的预训练计算规模大约是
31
0
0
0
大模型大模型向量数据库机器学习
Anthropic 公司北京时间25日凌晨发布了 Claude 3.7 Sonnet,一款具备混合推理能力的大型语言模型,以及 Claude Code,一个面向开发者的智能编码助手。Anthropic 公司时隔四个月终于推出了自家的新模型Claude 3.7 Sonnet,这款模型最大的创新在于其“混合推理”能力,具体特性如下:混合推理能力:这是该模型最显著的特点,它允许模型在“即时响应”和“深度
41
0
0
0
AI大模型向量数据库云存储
Cline 近日宣布推出备受期待的 MCP 应用商店,这是一项改变游戏规则的功能,它简化了 AI 功能的安装和管理。 此版本的发布标志着让更广泛的受众(无论其技术专长如何)都能使用 AI 工具向前迈出了重要一步。MCP 应用商店的功能非常像 AI 的应用商店,允许用户只需单击一下即可发现并安装各种 MCP 服务器。 MCP(Model Context Protocol,模型上下文协议)是由Anth
95
0
0
0
云原生向量数据库大模型云通信
OpenAI的Deep Research工具横空出世后,各大厂商都推出了自研的Deep Research工具。所谓Deep Research,是和普通搜索比较的,简单的RAG检索生成一般只有一轮检索。然而Deep Research可以像人类一样,根据一个主题不断的检索,分析,再检索,再分析,直到达到研究目的。从这这个角度上讲,它本质上就是一个升级版的RAG应用,利用ReAct/Plan And S
462
0
0
0
AI大模型机器学习算法
近日,Unsloth 团队宣布对其微调框架进行了升级,优化了内存使用效率。现在,使用 Unsloth 微调 Qwen2.5-1.5B 模型仅需 5GB 显存,相比之前所需的 7GB 显存,内存占用减少了约 29%。延伸阅读:DeepSeek GRPO 技术揭秘:Unsloth 助力 7GB 显存体验“顿悟时刻”此次升级主要得益于 Unsloth Efficient GRPO 算法的推出,该算法在保
52
0
0
0
AI大模型向量数据库云通信
以前OpenAI CTO Mira Murati为CEO的新公司Thinking Machines Lab正式成立,一众OpenAI出走员工加入,这其中就包括前不久离职的北大才女Lilian Weng(翁荔),她提出的Agent公式(Agent=大模型+记忆+主动规划+工具使用)被业界广泛认可。除此之外,前OpenAI联合创始人兼关键领导者John Schulman加入公司任首席科学家,前Open
21
0
0
0
AIGPU大模型数据库
xAI 近日宣布推出 Grok 3,这是继 Grok 2 之后的又一重大更新。 Grok 3 在性能上实现了显著提升,据 Elon Musk 透露,其能力比 Grok 2 提升了整整一个数量级。Grok 3 的发布得益于 200K 个GPU 的计算能力,这一数字在短短 92 天内翻倍。 Grok 3 的训练量是 Grok 2 的10 倍,并在一月份完成了预训练。这一模型仍在不断训练中,预示着其未来
19
0
0
0
AI大模型向量数据库机器学习
OpenAI 的 CEO Sam Altman 在 社交媒体上分享了关于 GPT-4.5 和 GPT-5 的最新进展。OpenAI 承认目前的产品线对用户来说过于复杂,因此他们正在努力简化产品,目标是让 AI 能够“开箱即用”。GPT-4.5 (内部代号为 Orion) 将会是最后一个“非思维链模型”,而 GPT-5 则将整合包括 o3 在内的多项技术,成为一个集大成者。 未来,OpenAI 将不
26
0
0
0