news 2026/3/1 20:39:10

大模型Agent开发秘籍:五大框架类别全解析,打造模块化、高自由度的AI利器!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
大模型Agent开发秘籍:五大框架类别全解析,打造模块化、高自由度的AI利器!

简介

Agent开发框架正从全栈向模块化方向发展,解决早期框架过度设计问题。文章将框架分为全栈开发、流程编排、模型交互、外部工具和低代码五类,每类各有特点和适用场景。开发者应根据业务需求、开发语言和项目规模选择合适框架,模块化、高自由度和维护友好是现代Agent开发框架的关键特征。


每每提及 Agent 开发框架,总绕不开要把 Langchain 拉出来鞭尸一番。作为公认的过度设计典型案例,Langchain 那些不必要的抽象和封装、过度耦合的架构,以及毁灭式的版本更迭,种种人为制造的 Agent 开发门槛曾在很长一段时间内让开发者们谈 Agent 框架色变。

大部分 Agent 本质上就是带循环的大模型工作流,再加上与外部信息(向量数据库/工具)的交互。对于熟悉开发的人来说,实现这种范式并不困难,因此许多开发者直接选择手搓轮子,不依赖任何框架直接开干。然而在这个过程中,大量重复性的工作诸如:提示词与工具变更迭代、状态管理、日志监控、错误处理、质量评估、故障定位和跟踪复现等等重要但 dirty 的琐事实实在在地拖累着项目进度。

上述功能通常是既有的成熟框架会考虑到的,它们历经无数开发者的上千 commit 和 PR 的迭代打磨才逐步完善。而开发者在首次启动 Agent 项目时时往往更专注核心功能和流程的实现,对于后期的维护和质量评估则想不到那么多,最终不可避免地造成各种麻烦。到了这个阶段,开发者开始寻求专注于特定功能的模块化开发框架,避免大包干式的单一框架强耦合依赖,而是在高自由度和维护友好之间寻找平衡点,例如专注于流程编排的 PocketFlow、专注于简化模型调用和结果分析的 Ell,以及专注于模型验证和依赖注入的 Pydantic AI 等等。它们不试图做所有事,但以解决某一类问题为导向,模块化按需组合的思路,逐渐成为 Agent 开发框架演进的重要方向。这一开发框架层面的迭代,实质上反映了开发者对不同抽象层级粒度需求的变化*(当然,考虑到 Langchain 是强行喂给开发者的,它是否真正代表过开发者的需求尚未可知)*。

在开始介绍前,我们还是先拉通对齐一下颗粒度,聊聊Workflow和Agent这两个边界略有争议的范式在本文中的定义。

当我们在谈论 Agent 时,我们在谈论什么?

Workflows v.s. Agents

Workflow 是针对固定任务遵循既定范式的流程,它的每一个原子化任务都严格遵循预设路径,不会出现流程上的偏差;

相比之下,Agent 拥有更多的Agency(自主性)与自由度,它能够根据环境反馈自主调度和编排工具,这使得其原子化的任务路径不再固定,在执行范式上呈现出更多的动态性与随机性。

具体到设计模式上,参考PocketFlow Cookbook中的定义,最基础的 Chat 模式本质上是一个处理输入输出的循环加上对话历史记录,而 RAG 和 Chat Memory 模式则在此基础上引入了向量数据库,分别用于检索外部知识库和存储长期的对话记忆。

为了解决复杂的逻辑问题,通常采用 CoT + ReAct 范式,它在循环中增加了“思考历史”的存储,让模型能够在行动前进行推理;

而针对长上下文或大规模任务,Map-Reduce 模式采用了系统领域的映射规约思想,通过“分而治之”将大任务拆解并行处理后再进行合并。

当系统需要处理非线性流程时,通用的 Agent 模式采用循环 + 分支结构,允许系统根据判断走向不同路径,包括调用工具,以及调用预定义流程的 sub-agent 并发异步完成任务。更复杂的 Multi-Agent 系统通常利用发布/订阅(Pub/Sub)机制实现多智能体协作,或者采用 Supervisor 模式,由一个上层管理者负责Plan and Execute,将复杂任务层层嵌套并分发给下级子 Agent 完成。

Agent Design Patterns - 图源: PocketFlow Github Repo

针对复杂的Agent范式和任务场景,从构建可落地、方便迭代管理的大型 Agent 系统角度出发,选择恰当的开发框架是有必要的,而具体框架的选择还需根据业务需求、开发语言和项目规模来定。以下列出一些典型的开发框架,供开新坑时参考选取。

具体的分类并不完全严谨,这里以各框架最突出的优势作为其分类的关键字。

一、全栈开发框架

涵盖 Agent 从开发、维护、监测、到前端落地的全栈开发框架。

LangGraph

https://github.com/langchain-ai/langgraph

**开发语言:**Python。

LangGraph 是由 Langchain 团队开发的一个基于图论的编排框架,其核心特性是将智能体流程建模为带有状态的有向循环图(StateGraph)。它支持循环逻辑、状态持久化和人在回路控制,允许开发者定义细粒度的分支与合并逻辑 。该框架适用于需要高度确定性控制、复杂错误恢复机制以及长时运行的生产级应用场景,如能够自动修正错误的编码助手 。其优势在于对复杂逻辑的精确控制,但需要开发者显式定义状态模式和图结构 。

基于图的 Agent 开发思路很新颖,将Agent 开发包装成了Graph 设计,比较符合直觉和逻辑,在Agent自由度(Agency)方面略有欠缺,学习成本依然较高。

from langgraph.graph import START,StateGraphfrom typing_extensions import TypedDictclass State(TypedDict): text:strdef node_a(state:State)->dict: return{"text":state["text"]+"a"}def node_b(state:State)->dict: return{"text":state["text"]+"b"}graph=StateGraph(State)graph.add_node("node_a",node_a)graph.add_node("node_b",node_b)graph.add_edge(START,"node_a")graph.add_edge("node_a","node_b")print(graph.compile().invoke({"text":""}))# {'text': 'ab'}

通过 Langchain 家族的其他产品如 LangSmith 等实现具备监测和前端的生产级应用。

CrewAI

https://github.com/crewAIInc/crewAI

**开发语言:**Python。

CrewAI 是一个精简、速度极快的 Python 框架,完全从零开始构建, 与 LangChain 或其他代理框架完全独立 。它赋予开发者高层次的简洁性和精确的底层控制能力。

相比竞品 LangGraph,CrewAI主打Agent自由度(Agency)和 Multi-Agents 角色扮演协作,通过YAML 配置文件来定义 Agents(分离了逻辑和 Prompt)。

# src/my_project/config/agents.yamlresearcher: role:> {topic} Senior Data Researcher goal: > Uncover cutting-edge developments in {topic} backstory: > You're a seasoned researcher with a knack for uncovering the latest developments in {topic}. Known for your ability to find the most relevant information and present it in a clear and concise manner.reporting_analyst: role: > {topic} Reporting Analyst goal: > Create detailed reports based on {topic} data analysis and research findings backstory: > You're a meticulous analyst with a keen eye for detail. You're known for your ability to turn complex data into clear and concise reports, making it easy for others to understand and act on the information you provide.

通过其套件CrewAI AOP Suite还可快速实现带前端的原型应用产品化。

Haystack

https://github.com/deepset-ai/haystack

**开发语言:**Python。

一个用于构建可定制、可用于生产环境的生命周期管理 (LLM) 应用的 AI 编排框架。它可以将组件(模型、向量数据库、文件转换器)连接到管道或代理,从而与您的数据进行交互。凭借先进的检索方法,它最适合构建红绿灯 (RAG)、问答系统、语义搜索或对话式聊天机器人。

来自德国的一个侧重生产级的应用框架,从README中没能抓到该框架的侧重点和主要优势,可能是出的比较早,相比于当时的Langchain更简洁。

import osfrom haystack.components.agents import Agentfrom haystack.components.generators.chat import OpenAIChatGeneratorfrom haystack.dataclasses import ChatMessagefrom haystack.tools import ComponentToolfrom haystack.components.websearch import SerperDevWebSearchos.environ["OPENAI_API_KEY"] = "<YOUR OPENAI API KEY>"os.environ["SERPERDEV_API_KEY"] = "<YOUR SERPERDEV API KEY>"search_tool = ComponentTool(component=SerperDevWebSearch())basic_agent = Agent( chat_generator=OpenAIChatGenerator(model="gpt-4o-mini"), system_prompt="You are a helpful web agent.", tools=[search_tool],)result = basic_agent.run(messages=[ChatMessage.from_user("When was the first version of Haystack released?")])print(result['last_message'].text)

一直在更新,更多的大模型学习和面试资料已经上传带到CSDN的官方了,有需要的朋友可以扫描下方二维码免费领取【保证100%免费】👇👇

二、流程编排框架

定义:主要专注于对 Agent 逻辑功能的编排,封装Pipeline设计,以实现一套工作流为目的。

相比于全栈开发框架,这种框架往往较为轻量级,主要解决并发逻辑和可读性问题,为Agent 开发提供一套逻辑自洽的抽象封装。

PocketFlow

https://github.com/The-Pocket/PocketFlow

**开发语言:**多语言(Python, Typescript, Java, C++, Go, Rust and PHP)。

仅有 100 行代码的极简 LLM 框架,主张零依赖,通过嵌套有向图抽象来处理Agent 编排过程中的批处理、并行和异步操作。

PocketFlow 就是为了应对 Agent 框架过度臃肿而提出的,本质上就是一组Abstract Class,通过抽象出节点(Node)和 流(Flow)的概念,来帮助开发者更清晰的实现流行的设计模式,具体抽象定义如下所示:

精简的代码还有另一个好处,就是在 Vibe Coding 时让 AI 更好的阅读和理解你项目的设计模式,所以与其说是给开发者造的轮子,不如说是给 AI 规定的项目规范。不过根据我在用这个框架时的观察,大部分 LLM 完全理解并用好这压缩到100行的抽象模型还是存在困难的。

该框架实际上并不能“减轻”开发者的负担,而是优化了所开发的 Agent 项目的编码规范,提高了项目的可读性和逻辑性。具体的常用实现,如模型流式调用、会话管理、日志记录、分块、工具组织和调用、提示词工具迭代,这些负担较重的 dirty works 仍然需要从头实现,仍免不了屎山堆砌的可能,不建议没有经验的新开发者作为唯一框架使用。

microsoft-agent-framework

https://github.com/microsoft/agent-framework/

**开发语言:**Python, C# ( .NET)。

一个用于构建、编排和部署 AI 代理和多代理工作流的框架

微软自用的 Agent 开发框架,填补 C# 的 Agent 框架开发真空和推销自家 Azure 可能是主要目的。

也是基于图的Agent 工作流编排,还包装了流式传输、Checkpoint(状态)、Human-in-the-loop 和时间回溯等功能,通过DevUI 扩展包可以构建前端用户界面,内置 OpenTelemetry 集成,可以实现分布式追踪、监控和调试,并设置了中间件的概念,拦截Agent运行/函数调用/Chat Request 来实现功能增添迭代,是生产级的 Agent 开发框架,比较重量级和冗杂。

三、模型交互框架

定义:以包装大模型提供商的路由、错误重放、token用量分析、模型响应反序列化等功能为主要目的的开发框架。

通常可以与流程编排框架相集成。

ELL

https://github.com/MadcowD/ell

开发语言:Python。

ELL是一个轻量级、功能强大的提示工程框架,将所有提示词视为代码(Prompt as code),以提示词函数为索引,通过可视化的LLM 调用记录来追踪 Agent 应用的表现。

最早提出提示词即代码概念的框架,用 f-string 处理Prompt设置,主要优势是提高了代码可读性并方便了后续分析 LLM 回复内容、版本迭代对比。

不过随着 Agent 范式的发展,ELL 库所主打的 LMP(语言模型编程)概念关注度不高,已经基本弃置,半年没有再迭代,但该库作为LLM可视化日志系统用还是可以的。

import ell@ell.simple(model="gpt-4o")def hello(world : str): """You are a helpful assistant that writes in lower case.""" # System Message return f"Say hello to {world[::-1]} with a poem." # User Messagehello("sama")

Strands

https://github.com/strands-agents/sdk-python

**开发语言:**Python,Typescript。

Strands Agents 是一款简单而强大的 SDK,它采用模型驱动的方法来构建和运行 AI 代理。从简单的对话助手到复杂的自主工作流,从本地开发到生产部署。

from strands import Agentfrom strands_tools import calculatoragent=Agent(tools=[calculator])agent("What is the square root of 1764")

主要为开发者封装了模型调用、工具依赖注入、观察调试这三方面的功能,具体的Agent逻辑和流程编排交由开发者实现,这种抽象粒度和自由度还是比较合适的。

下面是用 strands 框架实现的一个完整的SWE-Agent(注:非官方示例),通过 bash 进行代码生成等任务的 Agent,总共仅需 10 行:

import subprocess, sysfrom strands import Agent, toolfrom strands.models.openai import OpenAIModel as OAI@tooldef bash(cmd: str) -> str: """Run a bash command and returns results""" return subprocess.run(["bash", "-lc", cmd], capture_output=True)Agent(tools=[bash], model=OAI(model_id="gpt-5.2"))(f"One-shot SWE agent: {sys.argv[1:]}")

运行:

uv run python pico.py "create a simple calculator website"

Pydantic AI

https://github.com/pydantic/pydantic-ai/

**开发语言:**Python。

Pydantic AI 是一个 Python 代理框架,旨在帮助开发者快速、自信、轻松地使用生成式 AI 构建生产级应用程序和工作流程,将 FastAPI 的感觉带入 GenAI 应用和代理的开发中。

从Pydantic 的数据验证功能出发看待和 LLM 模型交互进行输出结果的验证,在依赖注入方面做的很符合直觉(也很Golang),缓解了因为增删工具/变更功能而手动迭代提示词的压力,并带有完整的LLM 日志追踪和分析功能。

from dataclasses import dataclassfrom pydantic import BaseModel, Fieldfrom pydantic_ai import Agent, RunContextfrom bank_database import DatabaseConn@dataclassclass SupportDependencies: customer_id: int db: DatabaseConn class SupportOutput(BaseModel): support_advice: str = Field(description='Advice returned to the customer') block_card: bool = Field(description="Whether to block the customer's card") risk: int = Field(description='Risk level of query', ge=0, le=10)support_agent = Agent( 'openai:gpt-5', deps_type=SupportDependencies, output_type=SupportOutput, instructions=( 'You are a support agent in our bank, give the ' 'customer support and judge the risk level of their query.' ),)@support_agent.instructions async def add_customer_name(ctx: RunContext[SupportDependencies]) -> str: customer_name = await ctx.deps.db.customer_name(id=ctx.deps.customer_id) return f"The customer's name is {customer_name!r}"@support_agent.tool async def customer_balance( ctx: RunContext[SupportDependencies], include_pending: bool) -> float: """Returns the customer's current account balance.""" return await ctx.deps.db.customer_balance( id=ctx.deps.customer_id, include_pending=include_pending, )... async def main(): deps = SupportDependencies(customer_id=123, db=DatabaseConn()) result = await support_agent.run('What is my balance?', deps=deps) print(result.output) """ support_advice='Hello John, your current account balance, including pending transactions, is $123.45.' block_card=False risk=1 """ result = await support_agent.run('I just lost my card!', deps=deps) print(result.output) """ support_advice="I'm sorry to hear that, John. We are temporarily blocking your card to prevent unauthorized transactions." block_card=True risk=8 """

四、外部工具模板

安全的工具实现、复用和调用方式。

这块我还发现有专门的开发框架(MCP 勉强算,他不是主要面向开发者的,对于无需考虑外接自定工具的小型项目来说太重量级),但是对于 Agent 应用的安全性非常重要,一个关键工具如 bash、文件系统操作等的实现应当非常注重访问控制等方面的安全实践,以免 Agent 无意或被操纵执行rm -rf /等危险命令。

🤖: *<thinking…&*gt;
✅ 你说的绝对正确!
⚠️ 刚刚的命令确实能够将D盘下的全部文件夹和文件递归地删除!
🔍 需要我为你查找数据恢复方案吗?

stands-agents/tools

https://github.com/strands-agents/tools

是 strands 的一个生态库,里面集成了常用工具的安全实现,可以对照或直接从里面copy代码,避免自己写的工具存在安全问题。

awesome-mcp-servers

https://github.com/punkpeye/awesome-mcp-servers

多语言的 MCP 服务器收集,每个服务器就是一个 tool 的 MCP 标准化封装,因此当不确定一个工具应如何安全实现时,可以参考相关 MCP 服务器的实现。

五、低代码开发框架

这些框架的共同特性是支持开发者通过拖拽等方式排布 LLM Agent 的工作流,无需编程地快速实现一套带前端可视化展示的业务应用,并集成了多种业务工作流模板以供快速开发。

Dify

https://github.com/langgenius/dify

用于开发智能体工作流的生产就绪型平台,集成了智能体 AI 工作流程、RAG 管道、智能体功能、模型管理、可观测性功能。提供了多样的工作流模板,针对不同的业务场景方便一键导入部署。

n8n

https://github.com/n8n-io/n8n

可低代码/无代码构建的工作流自动化平台。

能够与Slack 等办公软件集成,国外用的比较多。

各种 n8n 工作流模板,47k+的 stars

https://github.com/Zie619/n8n-workflows

RAGFlow

https://github.com/infiniflow/ragflow

RAGFlow 是以数据理解为核心的 RAG兼智能体引擎,其显著特性是集成了 DeepDoc 文档解析技术,能够精确处理复杂的 PDF 布局和表格 。它结合了基于图的任务编排与可视化的工作流编辑器,支持“检索-生成-分类-重写”等复杂模式 。该框架特别适合法律、医疗、金融等依赖深度文档分析和知识库问答的场景,能够构建具备自我反思和查询优化能力的知识密集型智能体。

Langflow

https://github.com/langflow-ai/langflow

拖拽式构建和部署 AI 驱动的代理和工作流。

六、如何系统的学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

一直在更新,更多的大模型学习和面试资料已经上传带到CSDN的官方了,有需要的朋友可以扫描下方二维码免费领取【保证100%免费】👇👇

01.大模型风口已至:月薪30K+的AI岗正在批量诞生

2025年大模型应用呈现爆发式增长,根据工信部最新数据:

国内大模型相关岗位缺口达47万

初级工程师平均薪资28K(数据来源:BOSS直聘报告)

70%企业存在"能用模型不会调优"的痛点

真实案例:某二本机械专业学员,通过4个月系统学习,成功拿到某AI医疗公司大模型优化岗offer,薪资直接翻3倍!

02.大模型 AI 学习和面试资料

1️⃣ 提示词工程:把ChatGPT从玩具变成生产工具
2️⃣ RAG系统:让大模型精准输出行业知识
3️⃣ 智能体开发:用AutoGPT打造24小时数字员工

📦熬了三个大夜整理的《AI进化工具包》送你:
✔️ 大厂内部LLM落地手册(含58个真实案例)
✔️ 提示词设计模板库(覆盖12大应用场景)
✔️ 私藏学习路径图(0基础到项目实战仅需90天)





第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/25 22:30:27

纪念币预约自动化工具:5分钟搞定预约难题

还在为抢不到纪念币而烦恼吗&#xff1f;这款纪念币预约自动化工具将彻底改变您的预约体验&#xff01;只需简单配置&#xff0c;就能实现全自动预约&#xff0c;让您轻松获得心仪的纪念币收藏品。&#x1f680; 【免费下载链接】auto_commemorative_coin_booking 项目地址:…

作者头像 李华
网站建设 2026/2/28 22:17:48

LeagueAkari游戏辅助工具使用指南:从基础配置到高级功能

LeagueAkari游戏辅助工具使用指南&#xff1a;从基础配置到高级功能 【免费下载链接】LeagueAkari ✨兴趣使然的&#xff0c;功能全面的英雄联盟工具集。支持战绩查询、自动秒选等功能。基于 LCU API。 项目地址: https://gitcode.com/gh_mirrors/le/LeagueAkari League…

作者头像 李华
网站建设 2026/2/27 18:37:25

League Akari实战指南:智能化游戏辅助工具深度解析

League Akari实战指南&#xff1a;智能化游戏辅助工具深度解析 【免费下载链接】LeagueAkari ✨兴趣使然的&#xff0c;功能全面的英雄联盟工具集。支持战绩查询、自动秒选等功能。基于 LCU API。 项目地址: https://gitcode.com/gh_mirrors/le/LeagueAkari 在英雄联盟的…

作者头像 李华
网站建设 2026/3/1 16:32:38

终极x86硬件调优指南:Universal-x86-Tuning-Utility完全教程

想要让你的电脑性能瞬间提升30%吗&#xff1f;Universal-x86-Tuning-Utility&#xff08;简称UXTU&#xff09;就是那个能帮你实现这个目标的秘密武器&#xff01;这款开源工具专为AMD Zen架构和Intel 4代及以上处理器设计&#xff0c;让你的设备像专业跑车一样驰骋在性能赛道上…

作者头像 李华