AI工程化
AI工程化
AI大模型向量数据库数据中台
进入2025 年,企业级AI应用将走向何方?近日,曾成功预测2024年AI趋势的行业专家Sanjeev Mohan,再次对2025年企业AI做了预测,他认为智能体将从概念走向主流应用,成为企业运营的核心驱动力;数据平台将持续演进,为智能体的运行提供坚实的基础设施支撑;同时,一些前瞻的“登月计划”将推动技术边界不断拓展,重塑行业格局,并重新定义人机交互的未来形态。我们将从 应用 AI、数据与运营以及
46
0
0
0
AI大模型向量数据库数据库
RAG 的核心思想是在生成内容的过程中,从外部知识库检索相关信息,并将其作为输入提供给 LLM。然而,随着应用场景的复杂化,RAG 的弊端也逐渐显现:实时检索带来的延迟、文档选择的潜在错误、以及系统架构的复杂性都制约了其效率和准确性。近日,有一篇名为《Don’t Do RAG: When Cache-Augmented Generation is All You Need for Knowledg
32
0
0
0
AI大模型向量数据库云安全
近日,Hugging Face 最近开源的一个Agent项目:。相较于其它框架,它的理念和实现都比较简单。基于python开发,核心设计理念是 “少即是多”。相比市面上动辄几万行代码的 Agent 框架,它保持了极简的风格,核心代码仅有数千行,但功能却毫不逊色。Hugging Face 团队希望通过这种方式,降低 Agent 开发的门槛,让更多开发者能够快速上手。设计亮点 的最大亮点在于其对“代码
18
0
0
0
AI大模型向量数据库云安全
Anthropic于去年10月底提出了“computer use”概念后,有很多这样的工具和框架随之出现,之前介绍过很多computer-use方面的Agent工具。重磅消息:Claude 3.5 系列模型大更新及革命性增加计算机使用能力最快体验 Claude 3.5 Sonnet 控制电脑方法来了!“computer use”赛道战火将起,哪个模型最强,这个评估平台可以了解一下今天介绍一款操作浏
122
0
0
0
AI大模型微服务容器
近日,英伟达在CES大会上不仅发布硬件产品,还联合合作伙伴推出的 Agentic AI Blueprints,旨在帮助开发者构建agentic应用,帮助企业自动化工作流程。 它们都基于 NVIDIA AI Enterprise 平台,结合了 NVIDIA NIM 微服务和 NeMo 框架,提供高效、低延迟的 AI 工作流。 通过与 CrewAI 、LangChain 、LlamaIndex 等头部
14
0
0
0
AI大模型机器学习图像处理
近日,曾在温哥华NIPS大会获得广泛关注的最强开源微型视觉理解模型(VLM)Moondream迎来更新,项目提供两个版本:2B 和0.5B 模型,其中0.5B版本号称全球最小的视觉语言模型。该模型能够在各类设备上高效运行,实现图像理解、文本识别、目标检测、定位等多种功能。其中,2B版本性能接近QWen2-VL 2B,但是它需要的内存却只有4.3G,而0.5B要求就更低了。它不仅能够在个人电脑就可运
23
0
0
0
AI大模型向量数据库数据中台
2024年,人工智能领域风起云涌,各类实验性项目层出不穷。2024不论是基座模型还是LLM应用开发领域都发生了很多的事情。LLM in 2024!19项洞察,回顾AI巨变之年那么,步入2025年,AI将如何发展?海外科技媒体VentureBeat的报道指出,2025年很可能成为AI编排之年,AI应用的大规模落地、编排框架的兴起以及更智能的智能体协作将成为关键趋势。让我们一起解读这三大趋势,探寻AI
24
0
0
0
AI大模型数据库机器学习
GitHub 和Microsoft 日前联合宣布推出 GitHub Copilot 免费计划,所有开发者只需一个 GitHub 账号即可在 VS Code 中免费使用这款 AI 编程助手,无需信用卡,无需订阅。这一免费计划为用户每月提供 2000 次代码补全和 50 次聊天请求额度。用户可以使用 GPT-4o 和Claude 3.5 Sonnet 两种 AI 模型,基本满足日常开发需求。如需更多功
79
0
0
0
AI大模型向量数据库机器学习
一定要看!
26
0
0
0
数据库向量数据库关系型数据库NoSQL数据库
当前,向量数据库已经成了一个红海市场,新兴的还是传统数据库厂商都在做这方面的工作。然而,在嵌入式,端上的向量数据库比较少,chromaDB算是其中一个,但它不算是一个纯原生、深度优化的的嵌入式向量数据库,仍采用parquet格式(读一行数据需要读取整个块解压,比较慢,另外副本占用空间),功能也比较少,那有没有更好的选择呢?很多人自然想到关系型嵌入式数据库王者——Sqlite,奈何它的向量版本 sq
51
0
0
0
AI向量数据库大模型数据库
cusror前些日子,在0.43版本为了应对windsurf的挑战,上线了Agent功能。近日,Cursor 又发布了 0.44 版本更新,重点针对Agent功能进行了细致优化,全面提升Agent的能力。本次更新的核心亮点包括:终端支持增强 :Agent 现在能够读取终端退出代码,后台运行命令,并支持命令编辑。自动修复错误 :Agent 可读取 linter 错误,自动修复代码问题。Yolo 模式
38
0
0
0
AI大模型向量数据库云通信
AI 应用正在从单 Agent 向多 Agent 架构演进,就如同人类组织一样,AI 面对的业务问题越复杂,专业分工是必然,这时,如何管理协调这些分工Agent就越重要。正是这一原因,各家公司都发布了自家的 multiAgent 框架来解决这一问题,如 OpenAI 的 Swarm,微软的 AutoGen 等。延伸阅读:Swarm:一个OpenAI开源的multiAgent框架,简单哲学的代表一文
37
0
0
0
AI向量数据库大模型微服务
最近,Artem Zakirullin的一篇名为《 Cognitive load is what matters 》的文章引起了广泛关注,文章散获得Karpathy的转载和马斯克认同。我们来一起看看这篇散发着“KISS”味道的文章讲了什么? 认知负荷说白了就是"开发人员需要动多少脑子才能完成一项任务"。人的工作记忆有限,一般只能同时记住约4个信息块。当你阅读代码时,需要记住变量值、控制流逻辑、调用
85
0
0
0
AI大模型机器学习算法
OpenAI 董事会今日(美西12.26)宣布正在评估公司结构重大调整,计划将现有营利性实体转变为特拉华州(Delaware)公共利益公司(PBC),以更好地推进确保 AGI(通用人工智能)造福全人类的使命。本次结构调整的核心目标包括:通过 PBC 结构筹集更大规模资本,按传统条款发行普通股票加强非营利组织的可持续性,使其成为历史上资源最丰富的非营利组织之一优化双重结构职能,让营利与非营利部门各司
20
0
0
0
AI机器学习算法图像处理
Ultralytics 近日发布了 YOLOv11,这是其 YOLO 系列目标检测模型的最新版本。YOLOv11 在架构和训练方法上进行了重大改进,旨在提供更精确、更快速和更高效的物体检测能力。主要更新增强型特征提取 :YOLOv11 采用改进的骨干和颈部架构,增强了特征提取能力,从而实现更精确的目标检测和复杂任务性能。优化效率和速度 :YOLOv11 引入了完善的架构设计和优化的训练管道,提供更
41
0
0
0
大模型大模型向量数据库机器学习
昨日,OpenAI直播活动第五日,Sam Altman终于出现,宣布了苹果产品全面接入OpenAI 模型服务,但这一日热度却掉到开播以来最低。这是什么原因呢?首先,苹果联姻OpenAI早已不是什么新消息,更重要的是,在开播前一小时,Google CEO Picha 对外宣布Gemini 2.0发布,将原本在OpenAI上的吸引力都转移了过去。要说Google模型升级已经不是第一次,在此之前都是Sa
32
0
0
0
AI操作系统大模型数据库
它来了!昨天我们还在谈 Gemini 2.0可能会带来的交互革命:什么样的魔力让Gemini 2.0 爆冷抢了OpenAI风头,开辟LLM应用2025新方向。而现在,Google正式发布了面向混合现实设备的新操作系统Android XR,并宣布将与三星合作推出代号为"Project Moohan"的智能头显设备。当年富有科幻感Google Glass受限于技术问题不得不折戟沉沙,现在大模型及虚拟现
27
0
0
0
AI大模型向量数据库机器学习
前OpenAI 联合创始人、SSI创始人 Ilya Sutskever 近日在温哥华的神经信息处理系统会议上发表重要观点:大语言模型(LLMs)在预训练阶段的规模扩展已达到瓶颈。虽然计算能力在不断提升,但数据增长已趋缓,新数据和合成数据也难以带来突破性进展。Sutskever 用人类大脑发展做了一个生动的类比:就像人类大脑在体积上停止生长后,人类智慧仍在进步一样,AI 的未来发展将转向在现有大语言
29
0
0
0
云原生Kubernetes容器数据库
在笔者前文《什么样的魔力让Gemini 2.0 爆冷抢了OpenAI风头,开辟LLM应用2025新方向》 提到,OpenAI在直播第5日(美西12/11 15:16至19:38 )发生了宕机,持续长达4个多小时,当时有很多人猜测可能是与接入苹果生态带来的压力所致。美西时间12日,OpenAI给出了官方解释,他们犯了所有互联网公司都曾犯过的错。原来这次故障是因为升级导致的。他们本意是想提升集群的可观
29
0
0
0
AI大模型数据库机器学习
微软近期发布的 Phi-4 大语言模型震撼 AI 社区,这款仅 14B 参数的轻量级模型以其卓越的性能,挑战了现有大型 AI 模型的性能极限。Phi-4 最引人注目的成就是在数学推理领域展现出令人惊叹的能力。在 AMC 10/12 数学竞赛问题上,模型达到了 91.8%的惊人准确率,不仅超越了,甚至与 GPT-4o-mini 和Llama-3.3-70B 的性能相当。这一成就背后,是微软工程师在数
44
0
0
0