定义

提示工程(Prompt Engineering)是设计和优化输入给大型语言模型(LLM)的文本提示,以引导模型生成准确、有用、符合预期输出的技术学科。它是人机交互与 NLP 的交叉领域,涉及清晰表达意图、提供上下文、设定约束和示例选择。

“Prompt 工程是迭代过程。不充分的提示可能导致模糊、不准确的响应,阻碍模型提供有意义的输出。” —— Google 白皮书

核心要素

根据 Anthropic、OpenAI 和 Google 的共识,有效提示包含七个核心组件:

组件作用示例
Role/Persona激活领域知识”你是财富 500 强公司的高级数据科学家”
Task Context背景和受众信息”结果将呈现给董事会”
Clear Instructions核心请求”用 3 个要点总结”
Sequential Steps确保执行顺序编号步骤列表
Few-shot Examples演示期望格式3-5 个相关多样化示例
Output Format响应结构”返回 JSON,字段包括…”
Constraints限制输出空间”200字以内,不使用术语”

主要技术

基础技术

  • Zero-Shot:无示例直接提问,适用于简单任务
  • Few-Shot:提供 3-5 个示例引导模型学习模式
  • Role Prompting:分配角色以激活特定知识域
  • Contextual Prompting:提供任务特定背景信息

高级技术

  • Chain-of-Thought (CoT):要求模型展示推理步骤,显著提升数学和逻辑任务表现
    • 注意:现代推理模型(GPT-5、Claude 4、Gemini 3)内部自动思考,显式 CoT 可能反而有害
  • Self-consistency:多次采样取最一致的答案
  • Tree of Thoughts (ToT):同时探索多条推理路径
  • ReAct:结合推理(Reasoning)与行动(Acting)的代理范式
  • Step-back Prompting:先问一般性问题再解决具体任务

范式演变

Prompt Engineering → Context Engineering

2024-2025 年领域的重要转变:

  • 过去:专注于单个提示的词句优化
  • 现在:理解为”上下文工程”——策划系统提示、工具、外部数据和消息历史的最优 token 集合

“最佳提示不是最复杂的,而是用最少的必要上下文达成目标的。” —— Anthropic

最佳实践

  1. 具体明确:每个词都应帮助 AI 准确理解需求
  2. 简洁优先:研究表明 150-300 词是最佳长度,超过 3,000 tokens 性能显著下降
  3. 使用分隔符:XML 标签(<context>, <task>)或 Markdown 标题
  4. 示例质量胜过数量:3-5 个高质量、多样化示例优于大量雷同示例
  5. 指令优于约束:说”做 X”比”不要做 Y”更有效
  6. 迭代优化:基于输出反馈持续改进

模型特定注意事项

模型特点建议
Claude 4.x字面理解指令明确表达期望行为,使用 XML 标签
GPT-4.1/5对冲突指令敏感避免矛盾指令,注意推理模型不要 CoT
Gemini 3内置思考机制简化提示,thinking_level: "high"

关联连接