上下文工程的六大核心组件（可视化解析）-育师

大家好，我是玄姐。

以下是决定 AI 应用输出质量的大致占比：

很多团队都在纠结那无关紧要的 25%，却忽视了真正的关键所在。这也正是 “上下文工程（Context Engineering）” 悄然成为当今 AI 应用工程领域最重要技能的原因。它是一门在正确的时间、以正确的格式，向模型提供正确信息的艺术。如下图所示，它包含六大核心组件：

1. 提示词技术（Prompting Techniques）

这是大多数人会停留的阶段，但即便如此，其深度也远超人们的认知。

传统提示词技术基于模式识别：你给模型提供示例，它就能学习你想要的格式、风格和逻辑。对于结构化任务，少样本提示词（Few-shot prompting）依然效果显著。

而高级提示词技术才是真正的亮点所在。

像思维链提示词（Chain-of-thought prompting）这样的技术，能给模型留出 “思考空间”。不直接要求模型给出答案，而是让它一步步推理，这个简单的改变能大幅提升复杂问题的求解准确率。

用户在写查询时往往很 “懒惰”。

当有人输入 “我的 API 调用一直失败，该怎么解决？” 这样的问题时，对于检索系统来说几乎毫无用处。

查询增强通过多种技术解决这一问题：

查询增强技术	核心作用
查询重写（Query Rewriting）	利用大语言模型（LLM）将模糊的问题转化为清晰、精准的表述（混乱→规整）
查询扩展（Query Expansion）	添加相关术语和同义词，扩大检索范围（拓宽搜索网）
查询分解（Query Decomposition）	将复杂问题拆分为可独立解答的子问题
查询智能体（Query Agents）	利用智能体根据初始结果动态决定如何重新构建查询

示例：“API 调用失败怎么办？”→ 扩展为 “API 调用失败原因：认证问题、速率限制、超时、人工智能神经网络相关故障”

假设一个代理和用户进行了一场愉快的对话，用户分享了自己的偏好、相关背景和历史信息，但会话结束后，这些信息就全部丢失了。

长期记忆通过外部存储解决这一问题：

记忆的类型也至关重要：

Mem0/Zep/MemOS/Cognee 等开源工具让这一切变得触手可及，你无需从零构建。

短期记忆本质上就是对话历史。这一点看似显而易见，但往往管理不当。很多团队会在以下方面出错：

大多数团队会将其等同于检索增强生成（RAG），但这过于狭隘了。RAG 只是其中一种模式，而非全部。

真正的核心问题是：如何将你的 AI 与企业数据连接起来？

这些知识分散在各个角落：文档、维基百科、数据库、Notion 和 Google Drive 等 SaaS 工具、API 以及代码仓库等等。

检索流水线包含三个层面：

Airweave 等开源工具提供了端到端的解决方案。无需为每个数据源构建自定义连接器，你只需同步知识库，就能统一访问 Notion、Google Drive、数据库等各类数据。

传统 RAG 流水线	智能体驱动的上下文工程
硬编码的索引和检索流程	为智能体打造的双时间语义知识层
查询 → 数据源 A 连接器 → 向量 → 向量数据库 → 上下文 → 最终响应	查询 → Airweave → 关键词扩展 + 向量 → Airweave 向量数据库 → 重新排序 → 上下文 → 最终响应
（需为数据源 B、C 重复构建连接器）	（统一对接所有数据源）

无需更换模型，只需优化文档拆分策略或妥善同步知识来源，检索质量就能提升 10 倍。

工具能拓展模型的能力边界，如果没有工具，模型只能依赖自身权重和上下文窗口中的信息。

而智能体则负责决定何时以及如何使用这些工具。

智能体基本工作流程如下：查询 → 思考 → 行动 → 观察 →（重复直至达成目标）→ 响应

单智能体架构（Single-agent architecture）：适用于简单任务，大多数聊天机器人和辅助工具都属于这一类。
多智能体架构（Multi-agent architecture）：更适合复杂工作流。由多个专业智能体协作完成，例如一个负责调研、一个负责撰写、一个负责审核，它们之间相互协作、移交工作。

智能体通信协议（MCPs）则将这一模式推向了新高度！

智能体通信协议（MCP）的强大之处：