论文题目:A Systematic Survey of Prompt Engineering in Large Language Models: Techniques and Applications
论文链接:https://arxiv.org/pdf/2402.07927.pdf
这篇综述性论文为研究人员和实践者提供了一个宝贵的资源,系统地分类了
29种不同的提示工程技术
,并根据其功能、应用、模型和数据集进行了分析,揭示了每种方法的优势和局限性。
主要研究了大型语言模型(LLMs)和视觉-语言模型(VLMs)中的提示工程(Prompt Engineering)技术。 提示工程是一种通过特定任务的指令(即提示)来增强模型效能的方法,而无需修改核心模型参数。 这种方法允许预训练模型通过给定的提示无缝集成到下游任务中,从而在不更新模型参数的情况下,仅基于提示来引导模型行为。
详细分类并概述了从零样本(Zero-shot)提示到最新进展的各种提示技术,包括推理和逻辑链(Chain-of-Thought, CoT)提示、自动链式思考(Auto-CoT)提示、自我一致性(Self-Consistency)提示、逻辑链式思考(LogiCoT)提示等。这些技术旨在解决LLMs在复杂推理任务中的挑战,提高模型在数学、常识推理等领域的性能。
29种不同的提示工程技术:
- Zero-shot Prompting(零样本提示)
- Few-shot Prompting(少样本提示)
- Chain-of-Thought (CoT) Prompting(链式思考提示)
- Automatic Chain-of-Thought (Auto-CoT) Prompting(自动链式思考提示)
- Self-Consistency(自我一致性)
- Logical Chain-of-Thought (LogiCoT) Prompting(逻辑链式思考提示)
- Chain-of-Symbol (CoS) Prompting(符号链提示)
- Tree-of-Thoughts (ToT) Prompting(思维树提示)
- Graph-of-Thought (GoT) Prompting(思维图提示)
- System 2 Attention Prompting(系统2注意力提示)
- Thread of Thought (ThoT) Prompting(思维线索提示)
- Chain of Table Prompting(表格链提示)
- Retrieval Augmented Generation (RAG)(检索增强生成)
- ReAct Prompting(反应提示)
- Chain-of-Verification (CoVe) Prompting(验证链提示)
- Chain-of-Note (CoN) Prompting(笔记链提示)
- Chain-of-Knowledge (CoK) Prompting(知识链提示)
- Active-Prompt(主动提示)
- Automatic Prompt Engineer (APE)(自动提示工程师)
- Automatic Reasoning and Tool-use (ART)(自动推理与工具使用)
- Contrastive Chain-of-Thought (CCoT) Prompting(对比链式思考提示)
- Emotion Prompting(情感提示)
- Scratchpad Prompting(草稿纸提示)
- Program of Thoughts (PoT) Prompting(思维程序提示)
- Structured Chain-of-Thought (SCoT) Prompting(结构化链式思考提示)
- Chain of Code (CoC) Prompting(代码链提示)
- Optimization by Prompting (OPRO)(通过提示优化)
- Rephrase and Respond (RaR) Prompting(重述并回应提示)
- Take a Step Back Prompting(退一步提示)
基于以下因素的大型语言模型(LLMs)中流行的提示技术总结: 应用、提示获取、提示轮次、语言模型、数据集和指标。
论文还探讨了减少幻觉(Reduce Hallucination)的技术,如检索增强生成(Retrieval Augmented Generation, RAG)和链式验证(Chain-of-Verification, CoVe)提示,以及用户交互、微调和优化、基于知识的推理和生成、提高一致性和连贯性、管理情感和语调、代码生成和执行、优化和效率、理解用户意图、元认知和自我反思等方面的技术。
最后,论文总结了提示工程领域的挑战,包括偏见、事实不准确和可解释性差距,并强调了未来研究的方向,如元学习和混合提示架构。同时,论文强调了在开发和部署这些技术时需要考虑的伦理问题,以确保它们能够积极地融入我们的生活。