AI工程化
AI工程化
AIGPU大模型数据库
xAI 近日宣布推出 Grok 3,这是继 Grok 2 之后的又一重大更新。 Grok 3 在性能上实现了显著提升,据 Elon Musk 透露,其能力比 Grok 2 提升了整整一个数量级。Grok 3 的发布得益于 200K 个GPU 的计算能力,这一数字在短短 92 天内翻倍。 Grok 3 的训练量是 Grok 2 的10 倍,并在一月份完成了预训练。这一模型仍在不断训练中,预示着其未来
1
0
0
0
AI大模型向量数据库机器学习
OpenAI 的 CEO Sam Altman 在 社交媒体上分享了关于 GPT-4.5 和 GPT-5 的最新进展。OpenAI 承认目前的产品线对用户来说过于复杂,因此他们正在努力简化产品,目标是让 AI 能够“开箱即用”。GPT-4.5 (内部代号为 Orion) 将会是最后一个“非思维链模型”,而 GPT-5 则将整合包括 o3 在内的多项技术,成为一个集大成者。 未来,OpenAI 将不
5
0
0
0
AI大模型机器学习容器
今天介绍一款国产的推理加速框架,它让deepseek的推理速度又上一个档次。 它就是由清华大学 MADSys 团队和 Approaching.AI 共同开发一个新项目KTransformers(Quick Transformers),它是一个基于 Python 的框架,专注于提升 Hugging Face Transformers 的使用体验。 它通过先进的内核优化和并行策略,显著提高 LLM 的
92
0
0
0
AI大模型向量数据库云原生可观测
Windsurf Wave 3,Codeium 的最新更新,已于 2025 年2 月13 日发布,带来了多项新功能和改进。其中,Model Context Protocol (MCP) 的支持是亮点之一,它为用户提供了更多工具,以增强 Cascade 的功能。Wave 3 的主要更新包括:MCP 支持 :用户现在可以通过 Windsurf 设置面板指定 MCP 服务器,使 Cascade 能够调用
19
0
0
0
AIGPU机器学习算法
英伟达工程师最近用 DeepSeek-R1 模型加上“推理时扩展”技术,让 AI 自动生成 GPU 核心代码,也就是 GPU 内核。更让人惊讶的是,有些 AI 生成的代码甚至比工程师写的还要好!随着 AI 模型处理越来越复杂的任务,它们对计算资源的需求也在不断增长。 GPU 内核作为执行计算任务的关键部分,其优化程度直接关系到模型的性能。然而,传统的内核优化需要大量时间和专业知识,效率低下。NVI
6
0
0
0
AI大模型向量数据库数据中台
Anthropic 近日发布了其首个经济指数报告,旨在深入理解人工智能(AI)对劳动市场和经济的长期影响。该报告基于数百万匿名化的 Claude.ai 对话数据,揭示了 AI 在现代经济中如何被整合到实际任务中的最新情况。该公司还开源了该分析中使用的数据集,鼓励进一步的研究和合作。该经济指数的初步调查结果揭示了几个关键趋势:集中使用: AI的使用主要集中在软件开发和技术写作任务中。大约36%的职业
5
0
0
0
AI大模型向量数据库机器学习
Sam Altman 在其博客中分享了对 AGI发展的深刻见解和重要观察。以下是他博文的一些观点介绍。Altman 开篇即强调了 OpenAI 的核心使命:确保 AGI 能够造福全人类。他指出,虽然 AGI 的定义仍然模糊,但广义上可以理解为一个能够在多个领域解决越来越复杂问题,并达到人类水平的系统。在他看来,人类作为工具创造者,具有理解和创造的内在驱动力。每一代人都在前人发现的基础上创造更强大的
5
0
0
0
AI向量数据库大模型机器学习
这是一篇h uggingface社区Ksenia Se的投稿文章, 文章探讨了有关AI记忆的相关议题,包括:早期认知架构SOAR、记忆类型、生成式智能体中的记忆应用、LLM的记忆模式以及AI对人类记忆的潜在影响。在人工智能领域,Agentic Workflow 中的记忆 (Memory) 扮演着至关重要的角色。记忆与知识 (Knowledge) 和画像 (Profiling) 密切相关,但又在功能
23
0
0
0
AI大模型数据库云安全
GitHub 近日宣布对其 AI 编程助手 Copilot 进行重大升级,推出多项革新性功能,其中最引人注目的是全新的 Agent 模式和 Copilot Edits 正式版。这些更新标志着 AI 辅助开发进入了一个更智能、更自主的新阶段。本次更新的核心亮点包括:Agent 模式(预览版)具备代码自我迭代和错误修复能力可以建议并执行终端命令支持运行时错误分析和自我修复Copilot Edits 正
82
0
0
0
AI大模型向量数据库机器学习
DeepSeek 最新模型 R1 横空出世,春节期间迅速走红,短短 20 天日活用户突破 2000 万,刷新 ChatGPT 纪录,成为史上增长最快的 AI 应用,引发全球瞩目。 其成功的秘诀,除了 MLA、MOE 等工程优化大幅降低训练成本外,更在于其揭示了 LLM 推理过程中的“顿悟时刻”—— 一种类似于模型训练时参数量达到一定程度产生的“智能涌现”现象。 而这一切的幕后功臣,正是 GRPO
34
0
0
0
AI大模型向量数据库机器学习
Vectara 公司近期发布了一份 AI 大语言模型幻觉评测榜单,对当前主流 AI 模型在文本摘要任务中产生幻觉的情况进行了系统评测。该榜单使用 Vectara 自研的 HHEM-2.1 评测模型,通过让 AI 模型对 831 篇短文进行摘要来测试其产生幻觉的概率。在最新榜单中,Google 的Gemini 2.0 Flash 以0.7% 的幻觉率位居榜首,其次是 Gemini 2.0 Pro 和
93
0
0
0
AI大模型向量数据库云存储
OpenAI 前研究员 Andrej Karpathy 最近提出了一个新颖的编程概念——"vibe coding"(氛围编程)。这是一种依托大语言模型(LLM)的全新编程方式,让开发者能以更轻松自然的方式完成编程任务。这种编程方式的核心在于完全沉浸于编程的“感觉”中,甚至忘记了代码的存在。极简交互开发者只需通过语音或文字描述需求无需深入代码细节大量使用"Accept All"等快捷操作LLM 驱动
9
0
0
0
AI大模型向量数据库机器学习
OpenAI 刚刚宣布对 ChatGPT 的Canvas 功能进行了重大更新,现在 Canvas 支持 HTML 和React 代码的渲染。这一更新使得用户能够在 Canvas 中直接查看和编辑 HTML 和React 代码,极大地提升了开发效率和用户体验。Canvas 现在可以通过选择 OpenAI 的o1 模型并使用工具箱图标或“/canvas”命令来使用。对于 Pro 、Plus 和Team
11
0
0
0
大模型大模型数据库机器学习
DeepSeek 团队又发新模型,28日凌晨推出了创新型多模态框架 Janus-Pro,这是一个能同时处理多模态理解和生成任务的统一模型。该模型基于 DeepSeek-LLM-1.5b-base/DeepSeek-LLM-7b-base 构建,支持 384 x 384 的图像输入,并使用特定的 tokenizer 进行图像生成。最大特点是将视觉编码分为独立通道,同时保持单一 transformer
20
0
0
0
AI大模型机器学习数据安全
DeepSeek让一向低调著称的Anthropic CEO Dario Amodei 不低调了,刚刚为此撰写长文《On DeepSeek and Export Controls》谈了他对DeepSeek的崛起以及美国对华芯片出口管制政策的看法。他认为,DeepSeek 的技术进步并未削弱美国对华芯片出口管制政策的合理性,反而使其变得更加重要。Amodei 认为,出口管制的核心目标是确保美国在人工智
29
0
0
0
AI大模型向量数据库云存储
Y Combinator 近期发布了 2025 年春季创业机会清单(RFS),这份清单不仅反映了当前科技领域的最新趋势,更为创业者指明了未来几年的发展方向。 YC 合伙人 Garry Tan 表示,过去几个月的 AI 技术突破为创业者解锁了大量新机会。从 OpenAI 的O1/O3 到Deepseek R1,AI 系统已经能够使用计算机,并在某些领域超越人类。这些技术进步不仅带来了新的计算基础设施
51
0
0
0
AI大模型数据库机器学习
吴恩达近日刊文对DeepSeek及其影响发表了自己的看法,下面是他文章的翻译全文:亲爱的朋友们:本周,DeepSeek引发的热议让人们清楚地认识到几个重要的发展趋势:(1)中国在生成式人工智能领域正在赶上美国,这对人工智能供应链产生影响。(2)开放权重模型正在使基础模型层商品化,这为应用程序开发者创造了机会。(3)扩大规模并不是人工智能进步的唯一途径。尽管人们非常关注和炒作算力,但算法创新正在迅速
26
0
0
0
AI大模型数据库机器学习
今天介绍一个有趣的项目DeepClaude,这个项目巧妙地将 DeepSeek R1 的推理能力与 Claude 的代码生成能力完美结合,可进一步提升AI编程水平。DeepClaude 的核心价值在于整合两个顶级 AI 模型的独特优势:DeepSeek R1 擅长深度推理,能够实现类似“元认知”的自我纠正和边缘情况思考。然而,它在代码生成、创造力和对话技能方面有所欠缺。相比之下,Claude 3.
150
0
0
1
AI大模型向量数据库机器学习
Computer Use赛道拥挤,有创业黑马、也有巨头大佬,现在OpenAI也杀了进来。Eko:电脑、浏览器都能操作的前端Agent框架,自然语言就能操控OpenAI 今日重磅发布了名为 Operator 的智能体系统,这是首个能够像人类一样自主操作电脑的 AI 系统。该系统标志着人工智能向 AGI 迈出了关键一步。Operator 由"计算机使用智能体"(Computer-Using Agent
12
0
0
0
AI大模型向量数据库机器学习
Eko:电脑、浏览器都能操作的前端Agent框架,自然语言就能操控OpenAI 发布 Operator 智能体,“hybrid Internet”升级拉开帷幕字节跳动也加入了ComputerUse大战,近日开源了一款重量级 GUI 智能代理模型 UI-TARS,这是一款专为图形界面自动化交互设计的原生Agent模型。该模型能像人类一样通过观察屏幕进行操作,具备出色的感知、推理和交互能力。UI-TA
54
0
0
0