news 2026/3/8 3:32:23

Agent开发本质揭秘:将人类任务理解转化为AI执行过程的三大范式

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Agent开发本质揭秘:将人类任务理解转化为AI执行过程的三大范式

文章介绍了Agent开发的本质是将人对任务的理解转化为AI可执行的过程,并详细阐述了三种主流开发范式:1.工作流编排:结构化执行,适合任务理解清晰的场景;2.ReAct范式:迭代式推理循环,通过观察-思考-行动决策,适合理解不完整的场景;3.Vibe Coding范式:Code as Action,让模型直接生成代码,适合需求频繁变化的场景。


Agent开发的本质,是把人对任务的理解,翻译成AI可以执行的过程。

我们对任务的理解程度不同,翻译方式就不同。业界普遍有三种Agent开发范式:

  • • 工作流编排:对任务理解很清晰,我知道每一步该做什么
  • • React:理解不完整,我知道目标,但不确定具体路径,用ReAct让AI边做边探索
  • • vibecoding:需求场景经常变,无法穷举所有情况,用Vibe Coding让AI现场写代码解决

一、工作流编排

工作流编排的核心是结构化执行——通过定义任务的执行顺序,每个节点的输入输出、流转条件都是确定的。

在吴恩达的Agentic课程内容中,工作流有两种呈现形态:

形态特点流程控制
预定义流程开发者设计好所有步骤,AI只是执行者人定结构
动态规划流程AI先生成计划,再按计划顺序执行AI生成结构

通过下面的例子来理解这两种形态。

形态一:预定义流程

开发者预先设计好所有步骤,AI按部就班执行。

案例1:翻译工作流

将中文技术文档翻译成英文的场景中,如果直接让大模型翻译,容易出现直译腔、专业术语错误。

工作流的编排逻辑:

    1. 第一步:初译,模型先翻译一遍
    1. 第二步:审校,模型的角色是审核者,对照原文找问题、提建议
    1. 第三步:改进,模型根据建议生成出最终版

通过拆解步骤和"反思修正",优化单次翻译的效果。

案例2:企业知识库问答

企业内部知识库问答,简单的"检索+生成"经常回答不准确。

工作流的编排逻辑:

    1. 第一步:改写问题,口语化提问转为搜索关键词
    1. 第二步:分流,"查数据"的情况走数据库,"查政策"的情况走文档库
    1. 第三步:检索,在对应的库里搜索
    1. 第四步:质量检查,不相关则修改关键词重试(最多3次)

通过条件分支 + 循环重试,构建稳定可靠的检索系统。

形态二:动态规划流程

AI先生成计划,再按计划执行——计划是动态的,但执行仍是结构化的。

案例:电商客服Agent

面对客户提出不同问题的解法,当客户问"有没有100美元以下的圆框太阳镜?"时,Agent会根据问题先生成计划:

    1. Step 1: 查商品描述,筛选出圆框太阳镜
    1. Step 2: 查库存,确认有货
    1. Step 3: 查价格,筛选100美元以下

再按照该计划逐步调用工具去执行。

对不同问题生成不同计划,比预定义流程更灵活,执行时仍有条理。

多Agent场景

多Agent协作的场景中,本质上也是一种工作流编排。

比如构建一个太阳镜营销活动的场景,可以预定义构建三个子agent:

角色任务工具
研究员分析市场趋势网络搜索
设计师创建广告素材图像生成
文案撰写营销文案-

再由主Agent根据任务动态分配,并汇总结果。

二、ReAct范式

ReAct =Reasoning(推理)+ Acting(行动)

与工作流的结构化执行不同,ReAct本质是迭代式推理循环——每一步的决策都基于上一步的执行结果,没有预设的固定路径。

怎么设定"基于上一步的执行结果"?通过观察-思考-行动来设定规则:

    1. 观察(Observation):现在在哪?环境是什么样的?
    1. 思考(Thought):离目标还有多远?下一步该做什么?
    1. 行动(Action):执行操作
    1. 回到第1步,观察操作后的结果

以WebVoyager 浏览器操作的Agent来感受下ReAct的设计:

案例:WebVoyager网页浏览Agent

面对动态变化的网页环境,AI必须"边看边做"。

当用户说"帮我在京东上找一款100元以下的蓝牙耳机",怎么让大模型知道"哪里能点"?

WebVoyager的解决方式就是给网页元素"打标签":

    1. 往网页里注入脚本,提取所有可交互元素(按钮、输入框、链接)
    1. 过滤噪音:太小的元素丢掉,嵌套冗余的只保留外层
    1. 给每个有效元素标上编号(1、2、3…)

这样大模型看到的就是:“标签5是搜索框,标签12是搜索按钮”,而不是一堆看不懂的HTML代码。

过程执行的效果如下:

    1. 第一轮:
      观察:当前在京东首页,标签5是搜索框,标签12是搜索按钮
      思考:我需要先搜索"蓝牙耳机"
      动作:type(5, “蓝牙耳机”),然后 click(12)
    1. 第二轮
      观察:搜索结果页出来了,有很多商品,但没看到价格筛选
      思考:我需要找到价格筛选功能
      动作:scroll(down) 往下翻找筛选栏
    1. 第三轮
      观察:看到了价格筛选,标签23是"100元以下"
      思考:点击这个筛选条件
      动作:click(23)
    1. 第四轮
      观察:筛选后的结果出来了,第一款是某品牌蓝牙耳机,89元
      思考:找到了符合条件的商品,任务完成
      动作:answer(“找到一款89元的蓝牙耳机”)

工作流的场景是:“我知道该怎么做”,ReAct是:“我不确定,我需要感知当下的环境去尝试,以达到目标”。

三、Vibe Coding范式

Vibe Coding =Code as Action

吴恩达的Agentic课程中,对于函数和Agent都显著提到了“代码即一切”的思想,即:不再预定义工具函数,而是让模型直接生成可执行代码。代码本身就是工具、计划和执行动作的统一体。

与其定义不同情况的执行方案,不如只通过代码运行解决问题,AI利用训练时学到的海量代码库(math、pandas、numpy…),在运行时现场创造解决方案。

这个范式的实践方式,就是用现有的vibecoding智能体的代码能力,去解决场景变化的问题。

解决时,不去限定解决问题的方法,让coding去自定义探索,这个范式需要去更清楚的描述定义和边界。

AI大模型从0到精通全套学习大礼包

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

只要你是真心想学AI大模型,我这份资料就可以无偿共享给你学习。大模型行业确实也需要更多的有志之士加入进来,我也真心希望帮助大家学好这门技术,如果日后有什么学习上的问题,欢迎找我交流,有技术上面的问题,我是很愿意去帮助大家的!

如果你也想通过学大模型技术去帮助就业和转行,可以扫描下方链接👇👇
大模型重磅福利:入门进阶全套104G学习资源包免费分享!

01.从入门到精通的全套视频教程

包含提示词工程、RAG、Agent等技术点

02.AI大模型学习路线图(还有视频解说)

全过程AI大模型学习路线


03.学习电子书籍和技术文档

市面上的大模型书籍确实太多了,这些是我精选出来的


04.大模型面试题目详解

05.这些资料真的有用吗?

这份资料由我和鲁为民博士共同整理,鲁为民博士先后获得了北京清华大学学士和美国加州理工学院博士学位,在包括IEEE Transactions等学术期刊和诸多国际会议上发表了超过50篇学术论文、取得了多项美国和中国发明专利,同时还斩获了吴文俊人工智能科学技术奖。目前我正在和鲁博士共同进行人工智能的研究。

所有的视频由智泊AI老师录制,且资料与智泊AI共享,相互补充。这份学习大礼包应该算是现在最全面的大模型学习资料了。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。


智泊AI始终秉持着“让每个人平等享受到优质教育资源”的育人理念‌,通过动态追踪大模型开发、数据标注伦理等前沿技术趋势‌,构建起"前沿课程+智能实训+精准就业"的高效培养体系。

课堂上不光教理论,还带着学员做了十多个真实项目。学员要亲自上手搞数据清洗、模型调优这些硬核操作,把课本知识变成真本事‌!


如果说你是以下人群中的其中一类,都可以来智泊AI学习人工智能,找到高薪工作,一次小小的“投资”换来的是终身受益!

应届毕业生‌:无工作经验但想要系统学习AI大模型技术,期待通过实战项目掌握核心技术。

零基础转型‌:非技术背景但关注AI应用场景,计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能 ‌突破瓶颈:传统开发者(Java/前端等)学习Transformer架构与LangChain框架,向AI全栈工程师转型‌。

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/5 14:42:52

快手AutoThink模型:动态调节推理深度的AI神器

快手AutoThink模型:动态调节推理深度的AI神器 【免费下载链接】KwaiCoder-AutoThink-preview 项目地址: https://ai.gitcode.com/hf_mirrors/Kwaipilot/KwaiCoder-AutoThink-preview 导语:快手Kwaipilot团队发布业内首个公开的AutoThink大语言模…

作者头像 李华
网站建设 2026/3/3 1:01:31

三步打造个性化iOS动态壁纸:Nugget工具全攻略

三步打造个性化iOS动态壁纸:Nugget工具全攻略 【免费下载链接】Nugget Unlock the fullest potential of your device 项目地址: https://gitcode.com/gh_mirrors/nug/Nugget 还在为静态壁纸单调发愁?想要让你的iOS设备桌面焕发独特生命力&#x…

作者头像 李华
网站建设 2026/3/1 23:28:34

5大维度构建戴森球计划高效工厂:从蓝图选择到环境适配指南

5大维度构建戴森球计划高效工厂:从蓝图选择到环境适配指南 【免费下载链接】FactoryBluePrints 游戏戴森球计划的**工厂**蓝图仓库 项目地址: https://gitcode.com/GitHub_Trending/fa/FactoryBluePrints 在戴森球计划的宇宙探索中,高效工厂的构建…

作者头像 李华
网站建设 2026/3/2 6:38:41

如何通过AI智能分析实现投资决策的精准化与高效化

如何通过AI智能分析实现投资决策的精准化与高效化 【免费下载链接】Kronos Kronos: A Foundation Model for the Language of Financial Markets 项目地址: https://gitcode.com/GitHub_Trending/kronos14/Kronos 在金融投资领域,投资者常面临三大核心挑战&a…

作者头像 李华