AI工程化
AI工程化
AI大模型向量数据库数据安全
最近,以 deepSeek R1 为代表的推理模型成为热点,他们可以展示自己的思考过程,一步步解决复杂的问题,让原本黑盒模型变得具有可解释性,同时也为 AI 安全研究提供了窗口,便于发现潜在的不良行为。但一个核心问题是: 我们能相信 AI 思维链中呈现的内容吗?理想的思维链应既易懂又“忠诚”(Faithful),即真实反映模型的思考过程。然而,现实中我们无法保证这一点。模型可能无法用人类语言完全表
15
0
0
0
大模型大模型向量数据库GPU
开发者朋友,你是否感受到被AI浪潮裹挟的焦虑?大模型技术的爆发,以前所未有的速度重塑着技术格局。
9
0
0
0
AI大模型向量数据库云通信
AI Agent正在从Demo向真实场景迈进,它们能自动化处理工作流、辅助决策,甚至与外部工具交互。然而,将这些智能体部署到真实的生产环境并非易事,可靠性、性能和准确性常常面临严峻考验。当下在Agent设计上打好基础,关乎未来能否构建出真正可靠、安全的自主系统。Cohere团队基于自身实践经验,总结了开发者在打造AI Agent时最常遇到的五种挑战,并给出了切实可行的应对策略。这些建议将对于我们在
9
0
0
0
大模型大模型向量数据库GPU
开发者朋友,你是否感受到被AI浪潮裹挟的焦虑?大模型技术的爆发,以前所未有的速度重塑着技术格局。
10
0
0
0
开源向量数据库大模型机器学习
Nomic AI 近日发布了 Nomic Embed Multimodal 系列模型,这是一套开源的多模态嵌入模型,能够处理文本、图像、PDF 和图表等多种数据类型。该系列旨在提升对复杂文档的理解能力,并在视觉文档检索任务上取得了当前最佳(SOTA)性能。本次发布的核心亮点包括:原生多模态处理 :模型能直接处理图像和文本内容,无需 OCR 或预处理步骤,有效捕捉文档布局、视觉元素、图表和结构信息,
14
0
0
0
AI大模型向量数据库机器学习
AI Agent正在从Demo向真实场景迈进,它们能自动化处理工作流、辅助决策,甚至与外部工具交互。然而,将这些智能体部署到真实的生产环境并非易事,可靠性、性能和准确性常常面临严峻考验。当下在Agent设计上打好基础,关乎未来能否构建出真正可靠、安全的自主系统。Cohere团队基于自身实践经验,总结了开发者在打造AI Agent时最常遇到的五种挑战,并给出了切实可行的应对策略。这些建议将对于我们在
14
0
0
0
AI大模型向量数据库机器学习
随着模型能力的不断提升,Agent应用大量增多,如何更高效进行大模型工具调用成了关注重点。当前,基于 JSON 或特定文本格式的 API 调用,虽然实现了 Agent 与外部环境的基础交互,但随着任务复杂度的提升,其固有的局限性日益成为瓶颈:表达能力的限制: 预定义的工具集难以优雅地处理需要复杂控制流(如循环、条件分支)或数据流(变量传递与复用)的任务。这迫使 Agent 进行多次低效的 LLM
19
0
0
0
AI大模型向量数据库数据中台
昨日,AI届“汪峰”Qwen团队发布了Qwen2.5-VL-32B-Instruct,作为Qwen2.5-VL
29
0
0
0
大模型大模型向量数据库数据库
Google DeepMind昨日发布了其最新模型Gemini 2.5,首发版本为Pro Experimental,在多个基准测试中达到了业界领先水平。Gemini 2.5具有以下技术特点:推理能力:Gemini 2.5能够通过推理来处理问题,模仿人类思考过程,逐步解决问题,并选择最佳解决方案。多模态推理:该模型能够处理多种类型的数据,包括文本、图像和音频,使其在处理复杂任务时更加灵活。强大的处理
133
0
0
0
大模型大模型向量数据库云安全
在之前的文章里,我们介绍过 Apollo Research有关大模型的一些安全研究:Apollo最新报告:顶级大模型有了自己的“心机”,人类小心被算计最近,他们又发现一个令人惊讶的现象:AI模型,尤其是Claude Sonnet 3.7,在评估过程中能够意识到自己正在被测试。这一发现不仅对AI的安全评估提出了新的挑战,也引发了关于AI自我意识本质的深入思考。根据Apollo Research在社交
22
0
0
0
AI大模型
大模型已经进入生产落地时代,一些工程性问题逐渐暴露,从计算资源需求激增、内存瓶颈到分布式协调困难,传统的推理服务架构已难以应对。近日,NVIDIA 在其开发者大会推出 一个开源高性能推理框架——Dynamo,专为解决大规模分布式环境中的生成式AI模型服务难题而设计。它以Rust语言为主(55.5%)构建,同时融合Go(28.5%)和Python(9.3%),确保了高性能与易扩展性的完美结合。官方测
248
0
0
0
AI大模型向量数据库云通信
自从 2023 年 OpenAI 推出函数调用(function-call)功能以来,我们便开始思考如何构建一个真正繁荣的 AI Agent 和工具生态系统。然而,随着 AI 基础模型日益强大,一个意想不到的挑战浮出水面:每一种模型都需要有一套函数调用接口的规范,这导致了 AI 与外部世界的连接变得前所未有的割裂和碎片化。我们迫切需要一个统一的“通用语”,打破 AI 与工具之间的藩篱,实现无缝衔接
56
0
0
0
大模型大模型向量数据库机器学习
DeepSeek在领域内获得广泛关注的核心在于R1-Zero 仅通过强化学习(RL)便成功实现了推理能力的涌现,即发现Aha moment 。那么,在多模态领域,是否也能获得借鉴R1-Zero的思路呢?今天介绍的Vision-R1就是这一方面的探索的代表, 其目的就是研究如何有效利用 RL 来增强多模态大型语言模型(MLLM)的推理能力。然而,研究团队发现,由于缺乏大规模、高质量的多模态推理数据,
53
0
0
0
大数据大数据机器学习数据库
Gartner 近日在其数据与分析峰会上发布了2025 年数据与分析 (D&A) 领域顶级趋势的预测。分析师指出,这些趋势预示着 D&A 将从少数人的专属领域走向无处不在,同时也为企业带来了组织和人才等多方面的挑战。Gartner 分析师重点阐述了 IT 领导者必须理解并融入其数据与分析战略的以下顶级趋势:1. 高度可消费的数据产品: 为了充分利用数据产品,企业应聚焦于业务关键用例,关联并扩展数据
51
0
0
0
大模型大模型向量数据库机器学习
之前我们曾介绍过清华推出的KTransformers《KTransformers:让DeepSeek加速28倍的国产推理框架》,令人印象深刻,该项目也在持续更新中,刚刚宣布针对支持AMD GPU ROCm 平台及支持 unsloth 1.58/2.51 位权重和 IQ1_S/FP8 混合权重训练。近日,清华又一团队推出一个大模型推理引擎项目Chitu (赤兔) ,称可将DeepSeek推理成本降一
43
0
0
0
AI向量数据库大模型数据库
2025进入Agent开发的热度快速升温,OpenAI先前已经发布了Deep Research、Operator这样的Agent产品,但迟迟没有面向开发者提供Agent构建能力,而多agent构建的框架swarm也仅仅是一个原型展示版本(Swarm:一个OpenAI开源的multiAgent框架,简单哲学的代表),但开发者对Agent的热情,不得不让OpenAI加速了开放API的进程,今日凌晨,宣
37
0
0
0
AI大模型向量数据库机器学习
DeepSeek-671B 推理方案目前相对比较成熟,如何微调满血版本实践案例较少,今天介绍一个 由中国科学院自动化研究所与中科闻歌联合推出的 全参数微调开源项目,能够给开发者微调DeepSeek给予一些参考。该项目不仅提供了从模型训练到推理的完整代码和脚本,还分享了实际训练中的经验总结与优化建议。项目亮点包括:完整训练逻辑代码基于 DeepSeek-V3 论文,结合 DeepSeek-V2 代码
106
0
0
0
AI大模型向量数据库云存储
前天开始,一款名为 Manus 的泛任务 Agent 在网络上迅速走红,引发了褒贬不一的讨论。赞扬者欣赏其异步可视化的模式,认为它将原本抽象的 AGI 的具像化表现,更有人称这是继deepseek之后的又一大胜利;批评者则认为其技术创新有限,并指出国外早有类似产品。借助 Claude 等具备优秀规划和编程能力的大模型,再结合浏览器自动化(浏览器自动化工具 browser-use:让 AI 轻松操控
34
0
0
0
AI大模型向量数据库云安全
当前,LLM的应用场景已远不止简单的对话,而是扩展到需要多轮交互、复杂逻辑控制以及与外部环境集成的复杂任务。因此,在构建复杂、高效且可控的LLM应用仍然面临诸多瓶颈,比如:推理速度慢: 复杂的LLM应用通常需要多次调用模型,重复计算和数据传输导致整体延迟较高。控制性不足: 传统的方式难以精确控制LLM的生成过程,限制了应用的灵活性和可靠性。编程复杂性高: 缺乏专门为LLM应用设计的编程语言和工具,
209
0
0
0
大模型大模型向量数据库云通信
OpenAI 昨晚宣布推出其最新的预训练模型 GPT-4.5,这是一款在规模和知识水平上均达到新高度的产品,被OpenAI誉为其“迄今为止最大、知识最渊博的模型”,标志着无监督学习的又一次重大飞跃。 GPT-4.5 目前作为研究预览版,向 ChatGPT Pro 用户和开发者开放,预计下周将向 Plus 用户和其他用户开放。核心更新与特点预训练规模显著提升 :GPT-4.5 的预训练计算规模大约是
53
0
0
0