We're sorry but react app doesn't work properly without JavaScript enabled. Please enable it to continue.
文档
备案
控制台
登录
立即注册
首页
文章
问答
视频
活动
下载资源
开发者计划
团队号
镜像站
发布
火山引擎云安全产品
文章
专栏
问答
火山引擎云安全产品
诱导大模型 | 新型“回音室”攻击和对抗技术
AI
大模型
云安全
技术解析
“回音室攻击”(Echo Chamber)的新型越狱方法,可诱骗几乎所有主流大语言模型生成不良内容,Neural Trust 研究员Ahmad Alobaid在一份报告中指出:“与依赖对抗性提示或字符混淆的传统越狱方法不同,回音室攻击利用间接引用、语义引导和多步推理进行攻击”。虽然当今主流大模型已经逐步采用各种防护措施来对抗快速注入和越狱攻击,但是“回音室攻击”都能有效的让大模型产生有害的内容,比
13
0
0
0
火山引擎云安全产品
AI时代身份验证 | 智能体身份和访问控制思考
AI
AI开放平台
大模型
安全
随着AI大模型在各行各业的应用,智能体将作为AI终端参与到数字生活中,身份认证作为核心安全问题,对于智能体来说也不例外,需要一套完善的身份系统来确保智能体之间安全、高效的交互。在本文中,火山引擎云安全团队将分享当前对智能体的身份分析及我们所做的一些访问控制的实践。在企业环境中引入了智能体业务,智能体在运行过程中是作为一个服务身份来运行,还是需求额外的身份?智能体在响应用户请求时是“扮演”用户,还是
93
0
0
0
火山引擎云安全产品
一文搞懂 | 大模型为什么出现幻觉?从成因到缓解方案
AI
大模型
安全
技术解析
随着大模型(Large Language Models, 以下简称LLM)迅猛发展的浪潮中,幻觉(Hallucination)问题逐渐成为业界和学术界关注的焦点。所谓模型幻觉,指的是模型在生成内容时产生与事实不符、虚构或误导性的信息。比如,当你询问“世界上最长的河流是哪条?”模型可能一本正经地回答:“是亚马逊河,位于非洲”,而实际上亚马逊河在南美洲,同时也并不是最长的河流。又或者,当你让LLM介绍
198
0
0
0
火山引擎云安全产品
猎影计划:从密流中捕获 Cobalt Strike 的隐秘身影
AI
网络安全
大模型
最佳实践
在由 SSL/TLS 编织的现代网络“静默区”中,黑客的指令如同加密电台中的摩尔斯电码般悄然传输。传统安全设备如同戴着眼罩的卫兵,只能听见电流的白噪音。直到我们用模型为攻击行为刻下无法伪造的“行为指纹”,赋予了机器“听见加密心跳”的能力,Cobalt Strike 这个深度潜伏的“隐身刺客”才彻底暴露在安全防护的视野之下,再无藏身之所。在某大型企业的SOC中心,安全工程师注意到一台员工终端设备会访
2096
1
0
0
火山引擎云安全产品
AI 大脑如何被 “套路”?— 揭秘大模型提示词攻防
大模型
大模型
系统安全
云安全
在人工智能技术爆发式发展的当下,大模型(Large Language Models, 以下简称LLM)凭借其强大的自然语言处理能力,广泛渗透于智能助手、内容创作、代码生成等诸多关键领域,深度重塑着人们的生活与工作范式。然而,随着 LLM 应用场景的持续拓展与深化,一系列严峻的安全挑战接踵而至,其中提示词攻击已逐渐演变为威胁人工智能系统安全的核心隐患,亟待深入剖析与应对。提示词攻击是指攻击者精心构思
83
0
0
0
火山引擎云安全产品
当AI智能体学会“欺骗”,我们如何自保?来自火山的MCP安全答卷
大模型
MCP
大模型
云安全
本文旨在阐述火山引擎在模型上下文协议(Model Context Protocol, MCP)全生命周期中的安全保障实践。首先介绍MCP的核心概念、技术原理及生态发展现状,随后通过一个交互案例详细剖析其工作流程。核心部分深入分析了MCP面临的七种主要安全风险,包括传统Web服务风险及工具描述投毒、间接提示词注入等新型威胁,并结合具体案例进行说明。最后,本文提出了火山引擎针对性的MCP安全架构与保障
513
1
0
0