文档
备案
控制台
首页
AI 大模型体验中心
动手实验室
Agent 评测集
AI 案例广场
火山杯大赛
学习中心
社区
去发布
首页
AI 大模型体验中心
动手实验室
Agent 评测集
AI 案例广场
学习中心
社区
技术狂潮AI
文章
专栏
问答
技术狂潮AI
Context Engineering:大模型时代的技术突破
大模型
大模型
向量数据库
机器学习
,,,还在纠结要不要自己训练大模型?Manus团队用几千万美元的实战经验告诉你:Context Engineering才是王道!\x0a\x0a💡 核心洞察 \x0a• KV缓存命中率提升10倍成本优化 • 工具掩码策略避免动态加载陷阱\x0a• 文件系统作为AI超级外挂记忆 • 错误容忍机制让Agent自我进化\x0a\x0a🎯 企业价值 \x0a✅ 产品迭代从周级缩短到小时级 \x0a✅
127
0
0
0
技术狂潮AI
开源 vLLM Ascend 在昇腾NPU上的首秀表现,与 MindIE 各有千秋
AI
大模型
向量数据库
云通信
大模型技术应用入门|实战指南!我们专注于人工智能、LLM、RAG等前沿技术,探索大模型业务场景落地,分享技术干货、研究报告和IT技术资料。 关注我们,玩转大模型,赋能未来!
3812
0
0
0
技术狂潮AI
20种RAG技术全景解析!
AI
大模型
向量数据库
容器
,,,兄弟们!今天给大家科普一个超火的AI技术——RAG!💻✨\x0a🤔 什么是RAG? 简单说就是让AI先\x26quot;查资料\x26quot;再回答,就像我们考试前先复习一样!这样AI就不会胡说八道啦~ \x0a\x0a📚 20种技术大盘点:\x0a🔸 入门级(必须懂): • Standard RAG:最基础的查资料+回答模式 • Corrective RAG:会自己检查答案对不对
238
0
0
0
技术狂潮AI
yyds!一个大模型的新方向,彻底爆发了!!
AI
大模型
向量数据库
云通信
大模型技术应用入门|实战指南!我们专注于人工智能、LLM、RAG等前沿技术,探索大模型业务场景落地,分享技术干货、研究报告和IT技术资料。 关注我们,玩转大模型,赋能未来!
160
0
0
0
技术狂潮AI
RAG技术演进:从基础检索到智能体生态
AI
向量数据库
大模型
数据库
,,,🔍 RAG技术的未来发展趋势\x0a随着技术的不断进步,检索增强生成(RAG)技术正在从简单的“检索-生成”模式,逐步演进为智能知识生态系统。2023-2025年,RAG技术的发展路线图清晰地勾勒了这一过程。\x0a\x0a📈 五大阶段技术演进\x0a1️⃣ 基础RAG:基于静态向量检索,适用于简单问答场景。\x0a2️⃣ 高级RAG:引入混合检索与多查询策略,提升检索的准确性与多样性。
351
0
0
0
技术狂潮AI
三大Agent框架对比分析✨开发者必看
AI
大模型
数据库
容器
,,,🔥最近AI智能体(Agent)开发太火了!但你知道该选择哪个框架吗?\x0a\x0a今天给大家带来三大主流Agent框架的超详细对比分析👇\x0a\x0a📌 为什么要关注Agent框架? 随着AI大模型从简单对话机器人向具备自主决策能力的智能体转变,选择一个好的开发框架至关重要!特别是在MCP和A2A这两个核心协议推出后,Agent开发进入了标准化时代。\x0a\x0a🌟 Googl
855
0
0
0
技术狂潮AI
Claude 4震撼发布:重新定义AI编程与推理新标杆
大模型
大模型
企业应用
数据库
,,,近日,Anthropic 公司正式发布了全新一代 Claude 4 大模型,包括面向高端需求的 Claude Opus 4 和主打日常应用的 Claude Sonnet 4。这两款模型在编码能力、推理能力及智能代理方面均树立了行业新标杆。\x0a\x0a🔹 双模式混合推理:快速与深度兼得\x0aClaude 4 系列首次引入 “混合推理模式”,用户可在“即时响应”和“深度思考”两种模式间灵
197
0
0
0
技术狂潮AI
RAG-MCP:突破大模型工具调用瓶颈,告别Prompt膨胀
AI
向量数据库
大模型
数据库
大模型技术应用入门|实战指南!我们专注于人工智能、LLM、RAG等前沿技术,探索大模型业务场景落地,分享技术干货、研究报告和IT技术资料。 关注我们,玩转大模型,赋能未来!
1603
0
0
1
技术狂潮AI
RAG与推理的协同融合:突破大语言模型的认知边界
AI
向量数据库
大模型
云通信
大模型技术应用入门|实战指南!我们专注于人工智能、LLM、RAG等前沿技术,探索大模型业务场景落地,分享技术干货、研究报告和IT技术资料。 关注我们,玩转大模型,赋能未来!
867
0
0
0
技术狂潮AI
重磅升级!AI大模型又起飞了!
AI
大模型
向量数据库
云安全
2025开年,AI技术打得火热,正在改变程序员的职业命运:阿里云核心业务全部接入Agent体系;字节跳动30%后端岗位要求大模型开发能力;腾讯、京东、百度开放招聘技术岗,80%与AI相关……大模型正在重构技术开发范式,传统CRUD开发模式正在被AI原生应用取代!最残忍的是,业务面临转型,领导要 求用RAG优 化知识库检索,你不会;带AI团队,微调大模型要准备多少数据,你不懂;想转型大模型应用开发工
198
0
0
0
技术狂潮AI
封神了!全体程序员彻底狂欢吧!这波惊喜来的太突然!
AI
大模型
向量数据库
云安全
最近,Deepseek全球爆火让AI技术又一次进入了快速发展期!百度、字节、腾讯等等巨头互联网公司,纷纷接入DeepSeek,加速落地AI应用!这让「大模型应用开发工程师」一跃成为炙手可热的岗位!DeepSeeK甚至还开出1 **54W的高薪** ,挖掘会大模型技术、懂落地的AI人才!作为技术人,如何不被时代抛弃,享受AI技术带来的就业红利?!知乎知学堂特发起:行业前沿资源——「大模型应用开发工程
149
0
0
0
技术狂潮AI
DeepSeek私有部署最全攻略:异构多机分布式、满血版、蒸馏版,国产GPU支持,总有一款适合你!
开源
大模型
容器
数据库
GPUStack 是一个低门槛、易上手、开箱即用的私有大模型服务平台。它可以轻松整合并利用各种异构 GPU 资源,方便快捷地为生成式 AI 应用和应用开发人员部署所需的各种 AI 模型。
3544
1
0
1
技术狂潮AI
为什么说 PydanticAI 是下一代 AI 开发框架?
AI
大模型
向量数据库
云通信
PydanticAI 是一个正在快速崭露头角的 AI 应用开发框架。作为新一代 AI 开发工具,它在工程化实践中展现出了显著优势。
1060
0
0
0
技术狂潮AI
KV Cache量化技术详解:深入理解LLM推理性能优化
AI
大模型
向量数据库
数据库
在大模型技术快速发展的浪潮中,LLM的私有化部署与应用已成为各行业的刚需。然而,随着企业深入探索大模型应用场景,GPU资源消耗所带来的高昂部署成本,始终是制约大模型落地的关键瓶颈。
2555
0
0
0
技术狂潮AI
Knowledge Graph Studio:让知识图谱构建更简单、更智能
AI
向量数据库
大模型
NoSQL数据库
WhyHow Knowledge Graph Studio 的开源标志着知识图谱技术迈向了一个更加开放和协作的新时代。通过其强大的技术架构和丰富的功能模块,KG Studio 为用户提供了构建和管理知识图谱的一站式解决方案
1410
1
0
1
技术狂潮AI
突破性能瓶颈!LazyGraphRAG如何革新传统知识图谱检索
AI
大模型
向量数据库
机器学习
LazyGraphRAG是一种革新性的图形增强检索方法,采用"延迟处理"策略,通过动态调整搜索范围和推迟LLM使用,实现了成本与性能的最优平衡。这种创新方法不仅降低了部署门槛,还显著提升了查询效率。
329
0
0
0
技术狂潮AI
中国生成式AI大会即将登陆上海,全解大模型、AI Infra、端侧AI、视频生成和具身智能,40+位重磅嘉宾抢先看!
AI
大模型
向量数据库
容器
2024中国生成式AI大会(上海站)12月5-6日举办~
354
0
0
0
技术狂潮AI
Agentic RAG: 构建自主决策型检索增强系统
AI
向量数据库
大模型
数据中台
随着应用场景的日益复杂化和用户需求的不断提升,传统RAG技术所展现出的局限性也愈发明显。在这个背景下,一种革新性的技术范式 - Agentic RAG应运而生,它不仅打破了传统RAG的能力边界,更为未来AI应用的发展开辟了新的可能性。
1379
0
0
0
技术狂潮AI
揭秘大模型提升秘诀:RAG系统中的文本分块策略
AI
向量数据库
大模型
机器学习
文本分块策略在RAG系统中具有关键作用,直接影响到向量数据库的构建质量和大模型回答的准确性。合理的分块策略需要在保持文本语义完整性的同时,兼顾向量化模型和大模型的性能限制。选择适合的文本分块方法,需要考虑文本的格式、结构、内容,以及应用场景
1474
0
0
1
技术狂潮AI
AI时代,我们真的会被取代吗?——从不可言说知识看软件工程的未来
AI
大模型
NoSQL数据库
算法
为什么说 AI 时代,程序员不会被取代,反而会更加重要?因为软件工程的本质并非简单的代码堆砌,它更像是一门艺术,需要程序员充分理解业务需求、设计合理的架构、选择合适的算法,并最终用简洁优雅的代码将这一切串联起来。
361
0
0
0