AI不听话?试试这套提示词系统

大模型

最近,字节搞了一场开发者闭门会。

除了升级版的豆包大模型:

picture.image

还发布了一款好东西 -- PromptPilot

简言之,就是一款提示词优化工具。

但是,不是老生常谈的那种,而是一整套系统化的解决方案。

实操之后,有一说一:大模型厂商中,字节还是非常扎实地深入到行业中的。

遍地开花的大模型,一到业务场景就拉跨,即便 SOTA 刷上天,又有何用?

相信用大模型做过业务的朋友,都深有体会:让大模型完全理解意图,听话照做,是一件多么难的事。

这里,Prompt 是关键!

今日分享,一款提示词优化方案,并给出三个实操案例,希望给有需要的朋友一点帮助。

1. PromptPilot 简介

1.1 直击痛点

首先,

模型越来越强,答案不再稀缺,会提问才稀缺!

但是并非所有人都能快速掌握提问的本领,这个需求需要被满足!

其次,

现实生活中,很多问题的定义一开始就是模糊的,怎么让模型更好理解需求,是需要逐渐优化的。

那么,PromptPilot是如何帮助我们从碰运气精准调控的?

picture.image

2.2 解决方案

面对一个新的业务场景,你也无法清晰描述最终想要什么。

所以,PromptPilot 不强迫你写出完美的提示词。

它主要以两个功能模块,逐步帮你理清头绪:

picture.image

你只需要一个初步想法,

然后开始实操👇

2. PromptPilot 实操

传送门:[https://promptpilot.volcengine.com/](https://promptpilot.volcengine.com/)

以下为三个不同场景的实操案例:

2.1 文本理解任务

场景:我肚子疼得难受,到底该挂哪个科?

痛点:病人到了医院,不会挂号、挂错号、排队浪费时间!

为此,一个症状→科室的智能分诊助手的需求出现了。

step 1: Prompt生成

picture.image

也许,你能想到的更具体一点的提示词:

假设你是一位专业医生,请针对病情的描述来诊断疾病类别,然后分至对应的科室,请输出json格式。
 
病情的描述:{{user_prompt}}
输出:

picture.image

优化后,是不是更具体了?

但是还不够,因为没有具体的科室信息,大模型可能会胡说八道。

这时,需要加上知识库:

picture.image

picture.image

结合知识库,进一步优化 Prompt:

picture.image

最终得到的 Prompt 如下:

假设你是一位专业医生,参考以下候选疾病分类及对应的科室设置,针对病情的描述来诊断疾病类别,然后分至对应的科室,请输出json格式。

科室设置:
医院设有心内科、肾内科、呼吸与危重症医学科、消化内科、内分泌科、血液内科、风湿免疫科、干部保健科、神经内科、外科普外科、ICU、胸外科、神经外科、泌尿外科、血管外科、妇产科、儿科,眼科、口腔科等科室,其中脊柱外科、创伤骨科、手外科、 矫形骨科、小儿骨科、骨肿瘤科、运动医学科、特需病房、特需医疗部、北京创伤骨科研究,烧伤,烧伤整形科为医院特色科室、心理行为医学科、医疗美容科、心脏大血管外科

候选疾病
1. 内科系统疾病
心血管系统疾病:冠心病、高血压、心律失常、心力衰竭、心肌炎等。
呼吸系统疾病:肺炎、慢性阻塞性肺疾病(COPD)、哮喘、肺结核、肺癌等。
消化系统疾病:胃炎、胃溃疡、肝炎、肝硬化、肠炎、胰腺炎等。
泌尿系统疾病:肾炎、尿路感染、肾衰竭、肾结石等。
血液系统疾病:贫血、白血病、淋巴瘤、血小板减少性紫癜等。
内分泌与代谢疾病:糖尿病、甲状腺功能亢进 / 减退、肥胖症、痛风等。
神经系统疾病:脑梗死、癫痫、帕金森病、偏头痛、脑膜炎等。
免疫系统疾病:类风湿性关节炎、系统性红斑狼疮、干燥综合征等。
2. 外科系统疾病
普通外科疾病:阑尾炎、胆囊炎、胃肠肿瘤、疝气、甲状腺疾病等。
骨科疾病:骨折、关节炎、腰椎间盘突出、骨质疏松、骨肿瘤等。
心胸外科疾病:先天性心脏病、胸腺瘤、肺癌、食管癌等。
神经外科疾病:脑肿瘤、脑出血、颅脑损伤、椎管内肿瘤等。
泌尿外科疾病:前列腺增生、尿路结石、睾丸肿瘤、泌尿系统损伤等。
整形外科疾病:创伤修复、畸形矫正、美容手术相关疾病等。
3. 妇产科疾病
妇科疾病:阴道炎、宫颈炎、子宫肌瘤、卵巢囊肿、子宫内膜异位症等。
产科疾病:妊娠高血压、早产、产后出血、胎儿窘迫、妊娠糖尿病等。
4. 儿科疾病
新生儿疾病:新生儿黄疸、早产儿并发症、先天性畸形等。
儿童常见疾病:肺炎、腹泻、热性惊厥、小儿哮喘、发育迟缓等。
5. 五官科疾病
眼科:白内障、青光眼、近视、角膜炎、视网膜病变等。
耳鼻喉科:中耳炎、鼻炎、鼻窦炎、扁桃体炎、耳聋等。
口腔科:龋齿、牙髓炎、牙周病、口腔溃疡、颌面部肿瘤等。

病情的描述:{{user_prompt}}
输出:

怎么样,够明确了吧~

当然,还可以继续优化!

step 2: Prompt调优

Prompt调优支持两种模式,由于任务比较简单,这里选择第二种:

picture.image

填写变量,让AI帮忙生成一个:

picture.image

此时,模型生成了两个回答,选择一个更好的并给出理由,系统会根据你的反馈,进一步优化提示词:

picture.image

2.2 视觉理解任务

场景:根据生产车间的图片,判断是否存在违规行为

痛点:人工巡检效率低,主观判断差异大,违规行为多样

为此,一个AI 视觉->违规行为预警系统的需求出现了。

step 1: Prompt生成

也许,你的最初想法是这样的:

picture.image

继续优化:

picture.image

step 2: Prompt调优

由于这个任务比较复杂,这里选择评分模式

picture.image

这里选择视觉理解:

picture.image

因为需要识别图片,注意要选择一个多模态模型:

picture.image

生成模型回答,得到结构化输出:

picture.image

然后让模型生成多个回答,选择一个最理想的回答:

picture.image

最后,保存到评测集:

picture.image

为了让 AI 更好理解这个复杂任务,可以多给它看几个 case,为此可以选择右上角的批量评测

picture.image

把 case 整理到一个 Excel 表格中,然后点击上传文件

picture.image

注意表格标题栏保持和前端界面一致:

picture.image

点击生成模型回答:

picture.image

然后,对模型的回答进行打分:

picture.image

全部评分完成后,让AI生成评估标准:

picture.image

有了人为参与评估,并给出了标准,AI就可以进一步智能优化了:

picture.image

picture.image

稍等优化完成,可以发现优化后的 Prompt, 回答质量显著提升:

picture.image

picture.image

从 3->4.7分,完全符合预期。

拿到最终版的 Prompt 如下:

你的任务是根据生产车间的图片的url,判断生产车间是否存在违规操作设备和未佩戴安全防护用具的情况。请仔细阅读以下生产车间图片的url:
<图片的url>
{{图片的url}}
</图片的url>
在判断时,请考虑以下违规标准:
1. 违规操作设备:包括但不限于未按操作规程使用设备、在设备运行时进行危险操作等。以及设备放置不符合规范、周围存在危险隐患(如杂乱无章可能导致危险)等情况也视为违规操作设备;在高空作业场景下,如未按规范固定身体、作业姿势不符合安全操作规程等也属于违规操作设备;设备处于危险状态仍在运行(如设备附近有高温、火花、异常声响等可能暗示设备危险运行的迹象)也属于违规操作设备。
2. 未佩戴安全防护用具:如未戴安全帽、安全手套、护目镜等。

请先在<思考>标签中详细分析图片内容,说明判断的依据和推理过程。(注意:标签请使用英文尖括号,且标签名称为‘思考’,如<思考>...</思考>)
然后在<判断>标签中给出判断结果,使用“存在违规”或“不存在违规”。
最后,在<违规类别>标签中列出具体的违规类别(如果存在违规),若不存在违规则写“无”。

请确保你的判断客观公正,并基于给定的标准和图片内容。

2.3 多轮对话任务

场景:情感陪伴智能体,需要一个角色扮演模型

痛点:角色“出戏”频繁,价值观与安全边界模糊

对于这个场景而言,除了让系统帮我们生成提示词以外,还可以基于对话内容,进一步调优提示词。

添加正反馈:

picture.image

添加负反馈:

picture.image

2.4 提示词管理

最后,这里,存放了所有提示词:

picture.image

终于,再也不用四处翻找提示词了;收藏在这个仓库里,随取随用!

写在最后

在大模型时代,学会提问才是核心能力。

而 PromptPilot,则是把这项能力,进行原子化拆解(版本管理、数据回流、量化评估),并系统化呈现给你我。

提示词不应是魔法咒语,更应是可以沉淀、迭代、共享的工程资产。

如果你也曾被AI不听话 提示词越长越飘困扰,不妨试试 PromptPilot 这个提示词 DevOps。

愿你我都能在 AI 落地这条路上,少踩坑、多复用,把精力留给真正的业务创新。

如果对你有帮助,不妨点赞收藏备用。

0
0
0
0
关于作者

文章

0

获赞

0

收藏

0

相关资源
大模型解决方案白皮书:社交陪伴场景全流程落地指南
随着大模型技术持续突破,AI正加速重塑社交娱乐的形态与体验。其中,陪伴式聊天因用户黏性强、互动频次高,成为大模型商业化落地的关键赛道。随着模型能力跃升至万亿参数级,AI从工具属性正迈向情感交互生态,现象级产品的诞生条件逐渐成熟。 本白皮书聚焦AI陪伴聊天应用开发,面向“从何起步、如何落地”的新手困惑,系统拆解从需求定义到产品上线的关键流程。我们结合工程化实践路径,打造模块化知识体系与渐进式开发框架,帮助开发者在30天内完成从技术认知到产品原型的跃升,快速构建具备基础交互能力的Web或App应用,迈出大模型
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论