news 2026/6/26 23:02:55

对Harness的理解

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
对Harness的理解

如果把大模型比喻成大脑,那么当今它所能控制的躯干就是目前所提及的Agent、MCP、Tool……
如果从人体的构造来说,人类的大脑并不能完全控制自身身体。我们并不能控制自己的心率,也不能控制血压,也不能通过不呼吸憋死自己。
这放在软件领域也是一样的,人工智能的发展的确体现了其智能性。但是真正具备“生命力”的软件,必然要同时受到传统代码逻辑的强大约束。
过去,我们通过Prompt的方式告诉LLM约束行为,例如: 必须输出json,绝对不要输出解释性内容,数据计算一定要精准… 但是实际情况并非100%如人意,即便我们在开头和结尾频繁的强调仅输出json格式的文件,当上下文窗口达到一定程度后,LLM仍会产生幻觉、返回错误结果。
现在,从系统架构设计角度,Harness 层必须像脑干一样,在损害发生前强制介入。

什么是 Harness?

Harness,直译为"线束",原是机械工程中将电线、管路捆扎成有序整体的结构件——它本身不产生能量,却决定了能量流向何处、以何种方式流动。

在 AI 系统中,Harness 扮演的正是这个角色:大模型与现实世界之间的神经接口层。它不替代 LLM 思考,但它决定 LLM 的输出能产生什么效果、触达哪些系统、在什么条件下被允许执行。

  1. 输出校验(Output Validation)
    LLM 返回的内容在真正被消费之前,先经过结构校验、类型检查、业务规则验证。JSON Schema、正则匹配、甚至二次 LLM 裁判——这些都是 Harness 的工具。大脑可以"想错",但肌肉记忆却能最不绕弯,最直白,稳稳的接住你。

  2. 执行边界(Execution Boundary)
    Agent 能调用哪些 Tool、能访问哪些数据、能执行哪些操作——这些权限不由 LLM 在 prompt 中自我声明,而由 Harness 在架构层硬性约束。

  3. 异常兜底(Fallback & Circuit Breaker)
    当 LLM 超时、幻觉、输出不合规时,Harness 触发降级策略——回退到规则引擎、返回缓存结果、或直接拒绝执行——而不是将错误静默传播到下游系统。

  4. 审计追踪(Audit & Observability)
    每一次 LLM 调用、每一个 Tool 执行、每一笔数据读写,都在 Harness 层留下可追溯的记录。这是企业级 AI 落地的合规基础,也是出现问题时定位根因的唯一依据。

以上仅是个人对harness的初步理解。实际应当如何应用,仍需在实践中不断总结。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/26 23:02:31

跨平台绘图新选择:如何用免费工具彻底告别Visio依赖

跨平台绘图新选择:如何用免费工具彻底告别Visio依赖 【免费下载链接】drawio-desktop Official electron build of draw.io 项目地址: https://gitcode.com/GitHub_Trending/dr/drawio-desktop 还在为团队协作中的绘图工具碎片化而烦恼吗?当Windo…

作者头像 李华
网站建设 2026/6/26 23:00:30

Windows系统文件d3dx10_38.dll丢失找不到问题解决

在使用电脑系统时经常会出现丢失找不到某些文件的情况,由于很多常用软件都是采用 Microsoft Visual Studio 编写的,所以这类软件的运行需要依赖微软Visual C运行库,比如像 QQ、迅雷、Adobe 软件等等,如果没有安装VC运行库或者安装…

作者头像 李华
网站建设 2026/6/26 22:54:42

痛苦的根因的庖丁解牛

它的本质是:**痛苦不是“外部伤害”,而是 “内部模型与现实数据之间的校验失败” (Validation Failure Between Internal Model and Reality Data)。 核心矛盾:人类大脑是一个 预测引擎 (Prediction Engine),它基于过去的经验构建…

作者头像 李华
网站建设 2026/6/26 22:49:16

惠州管道阀门:城市命脉的守护者

在惠州这座快速发展的湾区城市,高楼拔地而起,工业园昼夜不停,供水、排水、燃气、化工管线如血管般密布地下。而阀门,正是这些血管上的“心脏瓣膜”——一旦失效,轻则泄漏停产,重则引发安全事故。近年来&…

作者头像 李华
网站建设 2026/6/26 22:45:28

AWVS实战:构建自动化扫描与手动验证的Web漏洞评估闭环

1. 项目概述:从“扫”到“测”的完整漏洞评估闭环在Web安全评估的日常工作中,我们常常面临一个两难选择:是依赖自动化工具的快速覆盖,还是投入大量时间进行深度手动测试?AWVS(Acunetix Web Vulnerability S…

作者头像 李华