news 2026/2/26 2:27:39

终于搞懂 LLM、RAG 和 AI Agent 了

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
终于搞懂 LLM、RAG 和 AI Agent 了

用了 AI 这么久,搞懂 LLM、RAG 和 AI Agent 这三个的关系。

他们不是竞争对手,而是相辅相成的存在。

LLM:大型语言模型

RAG:检索增强生成

AI Agent:也就是经常说到的 AI 智能体。

如果把AI系统比作一个人,大多数人只给了它一个“大脑”(LLM),却忘了给它“长期记忆”(RAG)和能决策行动的“手脚”(AI Agent)。

大脑(LLM)

大型语言模型(LLM)是这个智能堆栈的“大脑”。它拥有强大的推理、写作和理解自然语言的能力。我们平时用聊天方式使用ChatGPT、Gemini、豆包这些 APP,基本上都是在和一个有智慧的大脑进行沟通。

然而,它有一个致命的弱点,那就是它的知识是静止的,被完全冻结在了训练完成的时间点。

假设有一个大模型是在今年5月份发布的,那这个大模型只知道5月份之前的信息。你让它对6月份的某个事件发表建议,它是不知道的,只能胡编。

因为这个限制的存在,导致 LLM 虽然强大,却与现实世界脱节,或者说与现实世界不同步。

记忆系统(RAG)

RAG 本意是检索增强生成。

它的核心作用,就是将那个“静止的大脑”(LLM)与外部的、实时的知识数据库连接起来。

当用户提出问题时,RAG 会先在外部数据库中搜索并提取最相关的文档,然后将这些信息作为上下文一同提供给 LLM。

例如我在DeepSeek中询问“北京明天的天气”时,如果开启联网搜索的话,基本上能回答正确(有误差),可以看到右侧是 DeepSeek 查询的几个网页。

这个搜索网页的动作就是 RAG 。

而如果不勾选联网搜索呢?DeepSeek 就诚实的告诉你,它知道你想干什么,但是它办不到。

RAG 的加入,让 LLM 功力大增。

动态更新能力: 静态的 LLM 突然间拥有了访问全新数据的能力,能够获取真实、及时的信息,而这一切都无需对模型本身进行重新训练。

准确性与可审计性: 模型不再依赖其固有的、可能过时的训练数据进行“猜测”。相反,它基于实际检索到的信息进行推理。这不仅让准确率“立竿见影”,还意味着你可以精确地审核每个答案的来源是哪些文档。

AI Agent

尽管我们有了能思考的“大脑”和能记忆的“知识库”,但整个系统仍然比较被动。

它无法与世界互动。这时候,就轮到 AI Agent 登场了,它带来了动手能力,让智能不再是缸中之脑。

一个代理能够感知一个设定的目标,然后自主地规划步骤、执行行动,并根据结果进行反思和调整。

它不仅仅是回答问题,它还能执行复杂的多步骤任务,例如“研究主题、提取数据、生成报告并发送电子邮件”、自动修bug并提交代码。

使用场景

在实际的应用中,它们不是必须同时搭配使用的,而是有各自擅长的领域。

单独使用 LLM:当你的任务是纯粹的语言处理时,比如写作、总结或解释概念,单独使用 LLM 就足够了。

添加 RAG:当准确性至关重要时,就要加入 RAG 技术了。适用于需要从内部文档、技术手册或特定领域知识库中获取精确答案的场景。

AI Agent:当你需要系统具备真正的自主性时,就应该使用 Agent 了。例如那种需要比较复杂的流程才能完成的事情。比如用 Coze、n8n 搭建工作流,前段时间看到的“假如书籍会说话”这个工作流,输入一本书,最后产出的是一个有画面、有讲解、有字幕的完整视频。


读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用

对于0基础小白入门:

如果你是零基础小白,想快速入门大模型是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

作为一名老互联网人,看着AI越来越火,也总想为大家做点啥。干脆把我这几年整理的AI大模型干货全拿出来了。
包括入门指南、学习路径图、精选书籍、视频课,还有我录的一些实战讲解。全部免费,不搞虚的。
学习从来都是自己的事,我能做的就是帮你把路铺平一点。资料都放在下面了,有需要的直接拿,能用到多少就看你自己了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以点击文章最下方的VX名片免费领取【保真100%】

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/26 1:34:13

开源大模型微调和部署

什么是开源大模型?开源大模型与传统开源代码虽然都带有"开源"二字,但本质上存在很大差异。 开源大模型是指公开模型权重和架构的人工智能模型,比如LLaMA、Qwen、DeepSeek等。这些模型通常有数十亿甚至上千亿参数,能够处…

作者头像 李华
网站建设 2026/2/23 14:06:37

从零搭建AutoGLM环境,完整安装流程详解,助你抢占AI自动化学科先机

第一章:AutoGLM与智能自动化前沿AutoGLM 是新一代面向智能自动化任务的大语言模型框架,融合了生成式AI与自动化流程控制能力,旨在实现从自然语言指令到可执行自动化脚本的端到端转换。该系统不仅能够理解复杂语义,还能结合上下文动…

作者头像 李华
网站建设 2026/2/25 18:18:20

大多数“BI+AI”只是噱头?一文看懂 Tableau 的 AI 路线有何不同

目前,Tableau 正在产品内部以及面向用户自建 AI Agent 两个方向,持续加码 AI 创新投入。 如今,每家企业都在争相迈向“Agentic 驱动型企业”,即让人与 AI Agent 无缝协作,共同驱动业务成果。 但有一个关键挑战常被忽视…

作者头像 李华
网站建设 2026/2/25 6:57:31

灵遁者科普:意识层次的简要划分

意识是人的神经反应,当人出生时意识就与生命同在,是一种自我感受、自我存在感与对外界感受的综合体现,意识的基础是个体具有自我意识与对自身认知能力、对自身行使能力的认可的综合。因此产生一个疑问:“我认为我的意识存在&#…

作者头像 李华
网站建设 2026/2/25 11:45:38

Open-AutoGLM赋能智能终端实战(AI芯片集成全解析)

第一章:Open-AutoGLM赋能智能终端实战(AI芯片集成全解析)Open-AutoGLM 是新一代面向边缘计算场景的开源大模型推理框架,专为在AI芯片上高效部署语言模型而设计。其核心优势在于自动图优化、低延迟调度与硬件感知编译能力&#xff…

作者头像 李华