一文彻底搞懂大模型 - Prompt Engineering、Function Calling、RAG、Fine-tuning - 文章 - 开发者社区

picture.image

在日新月异的生成式AI领域，几个核心的专业术语不仅频繁出现在讨论、博客和会议中，更是技术发展的关键驱动力。它们分别是： “Prompt Engineering（提示工程）”、“Function Calling（函数调用）”、“RAG（检索增强生成）”和“Fine-tuning（微调）”。

一、 Prompt Engineering（提示工程）

什么是Prompt Engineering** ？**

Prompt Engineering，即提示工程，是指 设计和优化输入给大型语言模型（LLM）的文本提示（Prompt） 的过程。 这些提示旨在引导LLM生成符合期望的、高质量的输出。

它能够根据特定任务需求优化输入提示，引导大语言模型生成更准确、全面、符合格式要求的输出，从而提升模型在多样化应用场景中的性能和实用性。

picture.image

Prompt Engineering

Prompt Engineering的核心要素在于通过明确的指示、相关的上下文、具体的例子以及准确的输入来精心设计提示，从而引导大语言模型生成符合预期的高质量输出。

Prompt Engineering

指示（Instructions）：明确告诉模型需要执行的任务或生成的内容类型。这些指示应该清晰、具体，避免歧义。
上下文（Context）：为模型提供与任务相关的背景信息。上下文可以帮助模型更好地理解任务，并生成更加准确和相关的输出。
例子（Examples）：通过给出具体示例来展示期望的输出格式或风格。例子可以极大地提高模型的生成质量，因为它为模型提供了一个明确的参考框架。
输入（Input）：任务的具体数据或信息。这是模型生成输出的基础，输入的质量直接影响到输出的质量。
输出（Output）：虽然输出不是Prompt Engineering的直接组成部分，但它是Prompt设计的最终目标。通过不断优化Prompt，我们可以引导模型产生更加符合期望的输出。

picture.image

Prompt Engineering

二、 Function Calling（函数调用）

什么是Function Calling？ 在生成式AI的上下文中，函数调用通常指的是LLM在生成响应时，能够识别并执行特定的函数或API调用，以获取额外的信息或执行特定的任务。

函数调用增强了LLM的扩展性和实用性，使其能够跨越语言模型的边界，与数据库、Web服务等外部系统无缝交互，从而提供更加全面和实时的信息。

Function Calling

Function Calling在智能助手和自动化流程中的应用场景中，LLM通过调用外部API或预设函数来集成多样化服务与复杂操作，以满足用户请求并自动化执行流程。

在构建智能助手时，LLM可能需要根据用户的请求调用外部服务（ 如天气查询API、数据库查询等 ），并将结果整合到其响应中。
在自动化流程中，LLM可以通过调用预设的函数来执行一系列复杂的操作， 如数据处理、文件生成等。

picture.image

Function Calling

以查询天气为例，以下是LLM调用外部天气API的具体流程：

用户输入：用户向LLM询问“今天北京的天气怎么样？”
理解需求：LLM解析用户输入，识别出用户的意图是查询天气。
决定是否使用工具：LLM判断需要调用外部天气API来获取准确信息。
准备调用信息：LLM生成调用天气API所需的参数，如城市（北京）和日期（今天）。
发送请求：LLM将调用信息封装成HTTP请求，发送给天气API。
接收响应：天气API返回当前北京的天气信息给LLM。
结合结果进行回复：LLM解析天气信息，并生成易于理解的回复给用户，如“今天北京天气晴朗，温度25°C，适宜外出。”

picture.image

Function Calling

三、 RAG（检索增强生成）

什么是RAG？RAG（Retrieval Augmented Generation，检索增强生成） 是一种结合检索和生成的技术，旨在提高LLM在生成响应时的准确性和信息量。它通过从外部知识库中检索相关信息，并将这些信息作为LLM生成响应的额外输入。

精准检索：RAG通过信息检索技术，从大规模的文档集合或知识库中检索出与给定输入最相关的信息。 这种检索方式比传统的关键词匹配更加精准，能够捕捉到更丰富的上下文信息。
高效检索：RAG利用索引和检索算法，如向量数据库和查询检索器，快速地从文本数据中提取相关内容。 这大大提高了信息检索的效率，使得模型能够在短时间内处理大量数据。

picture.image