语境工程与智能体

前言

当你使用 Claude、Cursor 或各类 AI 助手时,是否遇到过「上下文太长就变笨」、多轮对话后答非所问、或接入工具后表现不稳定?这些现象背后,往往与语境(Context) 如何被组织、压缩与投喂给模型密切相关。

Agent-Skills-for-Context-Engineering 是 GitHub 上专注于语境工程的开源技能库,被学术界引用为静态技能架构的基础性工作。本文基于该仓库内容,用通俗方式梳理:什么是语境工程、为什么重要、以及如何用一套可复用的 Skills 体系来设计和优化 AI 智能体。

什么是语境工程?

语境工程(Context Engineering) 关注的是:在有限的「注意力预算」内,如何整体规划进入模型视野的所有信息——系统提示、工具定义、检索文档、对话历史、工具输出等。

它和提示工程(Prompt Engineering) 的区别可以简单理解为:

  • 提示工程:写好「说明书」和单轮指令,让模型知道要做什么。
  • 语境工程:在整段对话、多轮交互、多工具调用的场景下,管理好所有进入模型的信息,避免信息过载、丢失或冲突。
graph LR
    A[提示工程] --> A1[单轮指令]
    A --> A2[角色与任务描述]
    B[语境工程] --> B1[系统提示]
    B --> B2[工具定义]
    B --> B3[检索文档]
    B --> B4[对话历史]
    B --> B5[工具输出]

模型的能力不仅受「能塞多少 token」限制,更受注意力机制影响:上下文越长,容易出现「中间信息被忽略」(lost-in-the-middle)、注意力呈 U 形分布、以及注意力稀缺导致的性能下降。有效的语境工程,就是在保证效果的前提下,用尽量少、尽量高信号的 token 来驱动模型做出正确决策。

技能体系总览

该仓库把语境工程拆成多类 Skill,按「基础 → 架构 → 运营 → 方法论 → 认知架构」组织,便于按需加载、渐进学习。

基础技能(Foundational)

建立对「语境」的共识和常见失败模式的认识:

技能 说明
context-fundamentals 理解语境是什么、为何重要、在智能体系统中的组成
context-degradation 识别语境失效:lost-in-middle、投毒、干扰、冲突等
context-compression 设计并评估长会话的压缩策略

架构技能(Architectural)

面向多智能体、记忆、工具和持久化等结构设计:

技能 说明
multi-agent-patterns 编排器、对等、层级等多智能体架构
memory-systems 短期 / 长期 / 图结构记忆设计
tool-design 设计智能体易用、可组合的工具
filesystem-context 用文件系统做动态语境发现、结果卸载与计划持久化
hosted-agents 沙箱 VM、预置镜像、多人在线等托管式编码智能体

运营与评估(Operational)

日常优化与质量保障:

技能 说明
context-optimization 压缩、掩码、缓存等优化手段
evaluation 智能体系统的评估框架
advanced-evaluation LLM-as-a-Judge:打分、对比、 rubric、偏差缓解

开发方法论与认知架构

技能 说明
project-development 从想法到上线的 LLM 项目设计与部署
bdi-mental-states 用 BDI(信念-愿望-意图)把外部 RDF 转为可推理的智能体心智状态
graph TB
    subgraph 基础
        F1[context-fundamentals]
        F2[context-degradation]
        F3[context-compression]
    end
    subgraph 架构
        A1[multi-agent-patterns]
        A2[memory-systems]
        A3[tool-design]
    end
    subgraph 运营
        O1[context-optimization]
        O2[evaluation]
        O3[advanced-evaluation]
    end
    基础 --> 架构
    架构 --> 运营

设计哲学:渐进披露与平台无关

渐进披露(Progressive Disclosure)

技能按「先轻后重」加载:启动时只加载技能名称与简短描述,仅在与任务相关时再加载完整内容,从而节省上下文与 token。

渐进披露:按需加载技能

平台无关(Platform Agnosticism)

原则和模式不绑定具体厂商,适用于 Claude Code、Cursor、Codex 以及任何支持自定义指令或 Skill 的智能体平台。

概念 + 可运行示例

用 Python 伪代码和脚本演示概念,尽量不依赖复杂环境即可理解与试验。

使用方式概览

Claude Code

仓库可作为 Claude Code 插件市场 使用:

  1. 添加市场源:/plugin marketplace add muratcankoylan/Agent-Skills-for-Context-Engineering
  2. 按需安装插件,例如:
    • context-engineering-fundamentals(基础 + 优化)
    • agent-architecture(多智能体、记忆、工具、文件系统、托管智能体)
    • agent-evaluationagent-developmentcognitive-architecture

Cursor / Codex / 其他 IDE

将技能内容复制到项目的 .rules 或专属 Skills 目录,作为智能体的上下文与规范,即可在本地复用同一套语境工程思路。

自建框架

仅抽取其中的原则与模式,在自研的 Agent 框架中实现即可,技能本身是刻意保持平台无关的。

实战示例简析

仓库在 examples/ 下提供了多个完整示例,把多种技能组合成可运行的系统:

示例 简介 涉及技能
digital-brain-skill 面向创作者的个人操作系统:6 模块、4 自动化脚本 语境基础、优化、记忆、工具、多智能体、评估、项目开发
x-to-book-system 监控 X 账号并生成每日合成书的多智能体系统 多智能体、记忆、语境优化、工具、评估
llm-as-judge-skills TypeScript 实现的 LLM 评估工具,19 个通过测试 高级评估、工具设计、语境基础、评估
book-sft-pipeline 按作者风格训练小模型(含案例,约 $2 成本) 项目开发、语境压缩、多智能体、评估

示例项目与技能组合

这些示例通常包含:PRD、架构决策、技能映射说明和实现指引,适合作为「语境工程 + 智能体设计」的模板。

技能结构规范

每个技能遵循统一的目录与文件约定:

1
2
3
4
skill-name/
├── SKILL.md # 必选:说明与元数据
├── scripts/ # 可选:演示概念的代码
└── references/ # 可选:延伸阅读与参考

SKILL.md 建议控制在 500 行以内,便于在保持完整性的同时控制上下文占用。

小结与延伸

  • 语境工程 解决的是「在有限注意力下,如何组织与精简进入模型的信息」,是构建可靠、可扩展 AI 智能体的基础能力。
  • Agent-Skills-for-Context-Engineering 把该能力拆成可组合的 Skills:从基础概念、退化模式、压缩与优化,到多智能体、记忆、工具、评估和 BDI 认知架构,覆盖从设计到运营的完整链路。
  • 通过渐进披露平台无关的设计,同一套思路可以复用在 Claude Code、Cursor 或自研系统中;配合官方示例,能快速把「语境工程」从理论落到可运行的智能体项目。

若你正在做多轮对话、多工具调用或多智能体协作,不妨从 context-fundamentalscontext-degradation 入手,先建立共同语言,再按需深入架构与评估类技能。


参考