news 2026/3/3 5:13:00

Agent.md完胜Skill:提升Code Agent能力的方法

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Agent.md完胜Skill:提升Code Agent能力的方法

Vercel 这篇文章探讨了如何通过 AGENTS.md 文件为 AI 编码助手提供知识,并指出这种被动上下文模式在性能上优于技能(Skills)调用。

研究发现,将压缩后的文档索引直接置于项目根目录,能让 AI 达到 100% 的评估通过率,因为它消除了模型在决定何时检索信息时的犹豫与偏差。通过对比实验,作者揭示了检索驱动型推理在处理如 Next.js 16 等超前于模型训练数据的新技术时的核心优势。

方法如下:

1. 优先采用被动上下文(Passive Context)而非主动检索(Active Retrieval)

方法指南:为了确保 AI 代理始终能访问到关键知识,应将信息直接嵌入到代理每一步都能读取的文件中,而不是依赖代理自行决定何时去“调用”或“检索”外部工具。这样可以消除代理在决策是否需要查找信息时可能出现的失误。

具体事例:在项目根目录创建一个AGENTS.md文件(类似于 Claude Code 的CLAUDE.md) 。在 Vercel 的测试中,仅仅将文档索引放入该文件,测试通过率就从 53%(基准线)飙升至100%,而传统的“技能(Skills)”调用模式即使有明确指令引导,最高也只能达到 79% 。

2. 实施高强度上下文压缩与索引化

方法指南:为了防止长篇累牍的文档撑破 AI 的上下文窗口(Context Window),不应将全文塞入,而应提供一个经过压缩的“文档索引”。这个索引应指明具体文件路径,让 AI 在需要时再去读取特定文件

具体事例:Vercel 将原本40KB的文档注入内容压缩到了8KB(减少了 80%),并使用管道分隔符(pipe-delimited)结构来排列路径。例如:[Next.js DocsIndex]|root:./.next-docs |...|01-app/01-getting-started:{01-installation.mdx,...}。这种方式在保持 100% 通过率的同时,极大地节省了资源

3. 优化指令措辞以避免“指令脆弱性”

方法指南:AI 代理对指令的细微差别非常敏感。在编写引导指令时,应优先引导 AI 构建全局思维模型,而不是强制其执行死板的操作顺序。

具体事例:测试发现,如果指令是“你必须调用该技能”,AI 会过分依赖文档而忽略项目本身的上下文,导致错过配置文件修改;而如果改为“先探索项目结构,再调用技能获取文档”,AI 就能在构建出心理模型后再参考文档,从而生成更准确的代码。

4. 构建基于“未知知识”的硬核评估体系(Hardened Evals)

方法指南:评估 AI 性能时,应剔除那些已经存在于 AI 预训练数据中的旧知识,专门针对 AI 尚未学习到的新 API 或新功能编写测试用例,以此衡量文档检索的真实有效性。

具体事例:Vercel 在评估中专门针对Next.js 16的新 API(如'use cache'connection()forbidden()等)设计了测试,因为这些 API 不在当前模型训练数据中 。只有当 AI 能够正确使用这些它“从未见过”的 API 时,才证明方法指南是真实有效的。

5. 强制引导“检索导向推理”(Retrieval-led Reasoning)

方法指南:在指令中明确要求 AI 优先参考提供的最新文档,而不是依赖其过时的预训练记忆。这能有效解决 AI 使用旧版本语法处理新项目的问题。

具体事例:在注入的AGENTS.md内容中加入一条核心指令:“重要:针对任何 Next.js 任务,优先使用检索导向推理,而非预训练导向推理”。这迫使 AI 即使觉得自己“知道”怎么写,也会先去核对项目目录下的最新文档。

6. 设计便于检索的文档结构

方法指南:文档应进行模块化处理,使其结构能够被 AI 轻松索引和按需读取,而不是作为一个整体存在。

具体事例:使用官方工具(如npx @next/codemod@canary agents-md)自动检测项目版本,并将匹配的文档下载到特定的目录(如.next-docs/),这样 AI 就能根据索引精准跳转到具体的.mdx文件读取详细信息。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/26 19:28:25

把年会办成演唱会,追觅果然“敢梦敢为”

2月4日,苏州奥体中心体育场灯光璀璨,追觅科技与央视携手打造的“敢梦敢为追觅之夜”演唱会正式登场。这不仅是一次动人的视听盛宴,更是一份献给追觅全体员工的温暖心意。活动突破传统企业年会的活动形式,以央视级演唱会盛典&#…

作者头像 李华
网站建设 2026/2/28 7:11:47

无锡奥特维科技股份有限公司 软件工程师-机器人(W0202) 职位深度解析与面试指南

无锡奥特维科技股份有限公司 软件工程师-机器人(W0202) 职位信息 岗位职责: 1. 负责前期机器人仿真模拟,机器人路径模拟,规划设计机器人运动路线; 2. 负责项目机器人程序开发设计,根据工艺要求设计机器人动作、通讯程序; 3. 负责处理现场问题及优化,根据工程部现场反馈的…

作者头像 李华
网站建设 2026/3/2 19:20:43

从 C 基础到 ARM Linux 驱动开发:嵌入式开发核心知识点全解析

一、C 语言核心:嵌入式开发的语法基石 嵌入式开发以 C 语言为核心工具,指针、自定义类型、编译特性等知识点是直接操作硬件寄存器、编写高效程序的关键,以下为高频核心概念与实操要点: 1. 指针家族:地址操作的核心&a…

作者头像 李华
网站建设 2026/3/2 3:43:57

Linux常用命令大全:RMBG-2.0运维指南

Linux常用命令大全:RMBG-2.0运维指南 在实际运维RMBG-2.0背景去除服务的过程中,很多同学发现——模型跑起来了,但遇到问题时却不知道从哪下手。日志里一堆报错看不懂,进程突然没了找不到原因,GPU显存占满却查不出是哪…

作者头像 李华
网站建设 2026/3/2 0:17:29

深度解析ES6 Set与Map:相同点、核心差异及实战选型

深度解析ES6 Set与Map:相同点、核心差异及实战选型 ES6引入的Set和Map,是JavaScript中两种重要的“集合类型”,用于解决传统数组、对象在数据存储与查找中的痛点——比如数组去重繁琐、对象键名只能是字符串/ Symbol 类型。很多开发者在使用…

作者头像 李华
网站建设 2026/2/27 13:30:29

超详细!咕噜分发 App 内测分发使用教程

超详细!咕噜分发 App 内测分发使用教程,新手也能快速上手https://www.gulufenfa.com/ 点击文档下拉页,点击APP分发-咕噜分发 第二步; 进入APP-分发 咕噜分发页 第三步 在介绍页根据需求选择不同的工具、点击立刻使用即可跳转页…

作者头像 李华