前文介绍了通过LangChain大模型开发框架进行了简单的模型调用开发，也了解了PromptTemplate也是模型调用的关键一环。因此如何有效的调用大语言模型的能力也是需要了解的。本文将通过提示工程的六大原则帮您了解如何建立有效的Prompt模板，以便于最大化调动模型能力。

策略一

写下清晰明确的指令或说明

方法

在查询中包含详细信息和预期以获得更相关的答案

为了让模型获得高度相关的响应，请确保请求提供任何重要的详细信息或上下文。否则，你将让模型来猜测你的意思。

方法

在查询中要求模特采用角色以获得更相关的答案

通过设定系统的Prompt内容，用于指定模型在其回复中使用的角色。

方法

在查询中使用分隔符来清楚地指示输入的不同部分

三引号、XML标签、章节标题等分隔符可以帮助划定文本部分，以区别对待。

方法

在查询中使用指定完成任务所需的步骤

一些任务最好指定为一系列步骤。明确地编写步骤可以使模型更容易遵循它们。

方法

在查询中使用可以帮助模型理解的示例

提供适用于所有示例的一般说明通常比通过示例演示任务的所有排列更有效，但在某些情况下，提供示例可能更容易。例如，如果您打算让模型复制响应用户查询的特定样式，这很难明确描述。这被称为“少弹”提示。

结果如下：

可见模型按照了相同的模式输出了内容。

方法

在查询模型时详细描述，增加限定词

您可以要求模型生成给定目标长度的输出。目标输出长度可以通过单词、句子、段落、项目符号等的计数来指定。然而，请注意，指示模型生成特定数量的单词并不能高精度地工作。该模型可以更可靠地生成具有特定数量的段落或要点的输出。

策略二

提供完整的参考文本

方法

指导模型使用参考清晰明确的文本进行回答

如果我们能够提供与当前查询相关的可信信息的模型，那么我们可以指示模型使用提供的信息来编写其答案。

结果如下：

方法

指示模型用参考文本的引文来回答

如果输入已辅以相关知识，则直接要求模型通过引用所提供文档中的段落来在其答案中添加引文。请注意，然后可以通过提供文档中的字符串匹配以编程方式验证输出中的引文。

结果如下：

策略三

拆分为简单的子任务

方法

使用意图分类来识别用户查询最相关的说明

对于需要大量独立指令集来处理不同情况的任务，首先对查询类型进行分类，并使用该分类来确定需要哪些指令是有益的。这可以通过定义与处理给定类别中任务相关的固定类别和硬编码指令来实现。这个过程也可以递归地应用于将任务分解成一系列阶段。这种方法的优点是，与使用单个查询执行整个任务相比，每个查询将仅包含执行任务下一阶段所需的指令，这可能会导致更低的错误率。这也可能导致成本降低，因为较大的提示运行成本更高。

例如，假设对于客户服务应用程序，查询可以有效地分类如下：

根据客户查询的分类，可以向模型提供一组更具体的说明，以处理后续步骤。例如，假设客户需要“故障排除”方面的帮助。

请注意，模型已被指示发出特殊的字符串来指示对话状态何时发生变化。这使我们能够将我们的系统变成一个状态机，其中状态决定注入哪些指令。通过跟踪状态，哪些指令与该状态相关，以及可以选择允许从该状态进行哪些状态过渡，我们可以围绕用户体验设置护栏，而使用结构化程度较低的方法很难实现。

方法

多轮对话的对话应用程序，总结或过滤之前的对话

由于模型具有固定的上下文长度，用户和助手之间的对话，其中整个对话包含在上下文窗口中，不能无限期地继续。

这个问题有各种变通方法，其中之一是总结对话中之前的转折。一旦输入的大小达到预定的阈值长度，这可能会触发一个查询，该查询总结了部分对话，并且之前对话的摘要可以作为系统消息的一部分。或者，在整个对话过程中，可以在后台异步总结之前的对话。

另一种解决方案是动态选择与当前查询最相关的对话的前几个部分。如“使用基于嵌入的搜索来实现高效的知识检索”的策略

方法

总结长文档，并递归构建完整摘要

由于模型具有固定的上下文长度，因此它们不能用于在单个查询中总结长度超过上下文长度减去生成摘要长度的文本。

要总结一个非常长的文档，如一本书，我们可以使用一系列查询来总结文档的每个部分。章节摘要可以连接和总结，产生摘要摘要。这个过程可以递归进行，直到总结整个文档。如果有必要使用有关早期章节的信息来理解后续章节，那么另一个有用的技巧是包括书中任何给定点之前的文本的运行摘要，同时在该点总结内容。

策略四

给模型时间“思考”

方法

指导模型在匆忙得出结论之前制定自己的解决方案

有时，当我们明确指示模型在得出结论之前从第一原则进行推理时，我们会得到更好的结果。假设例如，我们想要一个模型来评估学生对数学问题的解决方案。解决这个问题最明显的方法是简单地询问模型学生的解决方案是否正确。

但学生的解决方案实际上是不正确的！我们可以通过提示模型首先生成自己的解决方案来让模型成功注意到这一点。

方法

使用内部独白或一系列查询来隐藏模型的推理过程

前面的策略表明，模型在回答特定问题之前，有时对问题进行详细推理很重要。对于某些应用程序，模型用于得出最终答案的推理过程不适合与用户共享。例如，在辅导申请中，我们可能希望鼓励学生制定自己的答案，但模型对学生解决方案的推理过程可以向学生揭示答案。

内心独白是一种可以用来缓解这种情况的策略。内部独白的想法是指导模型将旨在向用户隐藏的部分输出转换为结构化格式，使解析它们变得容易。然后，在向用户显示输出之前，对输出进行解析，并且只显示部分输出。

或者，这可以通过一系列查询来实现，其中除最后一个查询外，所有查询的输出都向最终用户隐藏。

首先，我们可以要求模型自己解决问题。由于这个初始查询不需要学生的解决方案，因此可以省略。这提供了额外的优势，即模型的解决方案不太可能因学生尝试的解决方案而产生偏差。

接下来，我们可以让模型使用所有可用信息来评估学生解决方案的正确性。

最后，我们可以让模型使用自己的分析，以有用的导师的身份构建回复。

方法

通过提示模型遗漏的内容以提示模型

假设我们正在使用一个模型来列出与特定问题相关的来源摘录。在列出每个摘录后，模型需要确定它是否应该开始编写另一个或是否应该停止。如果源文档很大，模型通常会过早停止，无法列出所有相关摘录。在这种情况下，通常可以通过提示模型进行后续查询来找到它在之前的通道中遗漏的任何摘录来获得更好的性能。

策略五

使用外部工具

方法

使用基于嵌入的搜索来实现高效的知识检索

如果作为其输入的一部分提供，模型可以利用外部信息来源。这可以帮助模型产生更知情和最新的响应。例如，如果用户询问有关特定电影的问题，将有关电影的高质量信息（例如演员、导演等）添加到模型的输入中可能会有用。嵌入可用于实现高效的知识检索，以便在运行时动态地将相关信息添加到模型输入中。

文本嵌入是一个可以测量文本字符串之间相关性的向量。相似或相关的字符串将比不相关的字符串更接近。这一事实以及快速向量搜索算法的存在意味着嵌入可用于实现高效的知识检索。特别是，文本语料库可以拆分为块，每个块都可以嵌入和存储。然后可以嵌入给定的查询，并执行矢量搜索，以从语料库中找到与查询最相关的嵌入文本块（即在嵌入空间中最接近）。