news 2025/12/17 5:02:20

揭秘 AI 记忆、RAG 演进与自我进化的工程实践!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
揭秘 AI 记忆、RAG 演进与自我进化的工程实践!

在 2025 年的今天,我们必须承认,当我们要构建一个复杂的 AI 系统时,仅仅会写“你是一个 XX 专家”是远远不够的。我们面临着更本质的系统工程挑战

  • 记忆缺失:Agent 如何像人一样拥有“短期记忆”和“长期记忆”,而不是聊几句就忘?

  • 检索瓶颈:RAG 不仅仅是向量搜索,面对海量非结构化数据,如何解决多租户、低成本与高精度的不可能三角?

  • 认知固化:真正的智能体(AI Scientist)能否在任务执行中“自我反思”并动态更新策略,而不是机械执行?

Context Engineering(上下文工程)正是大模型系统的“RAM”与“前额叶”。

为了确保内容的深度与硬核程度,在AICon 北京站上,我们特邀Zilliz 合伙人 & 研发 VP 栾小凡担任本专题的出品人。作为 LF AI & Data 基金会技术咨询委员会成员,并曾在阿里云(Lindorm)、Oracle 等顶级团队深耕多年的数据库与存储专家,他以其深厚的技术视野,对议题进行了层层甄选与严苛的质量品控,目标只有一个:剔除浅层的 Prompt 技巧,只交付能支撑 AI 系统理解与推理的工程架构。我们最终锁定了来自金山软件、Zilliz、腾讯、灵犀量子的四位技术专家。他们将从信息流转、湖仓一体、Spec-Coding 到动态认知进化,为你拼出一张完整的上下文工程技术地图。

欢迎大家扫码报名,见证 AI 系统架构的代际升级!

1金山软件:Agent 不是传声筒,而是“信息流转”的处理器

架构痛点

目前的很多 Agent 极其脆弱,本质上只是一个“大模型接口的封装”。在面对复杂业务时,它们缺乏对信息的“消化”能力——不知道什么该记入长期记忆,不知道如何组装短期上下文,导致任务执行混乱。

嘉宾解法

金山软件 AI 产品中心应用落地研发负责人陈斌,将从“信息流转的第一性原理”出发,分享 Agent 架构设计的工程规范。

  • 核心观点:Agent 应当从被动的信息处理器,进化为能驱动复杂任务的智能力量。

  • 关键技术:

    • 记忆工程规范:深入拆解External Memory(RAG/ 工具)Working Memory(工作记忆)的划分原理。

    • 长短期记忆调度:探讨在实际业务中,如何平衡记忆检索的“速度”与“深度”,实现信息的高效流转与智能组装。

    • 落地实践:分享在金山办公等真实业务场景中打磨出的上下文构建经验。

2Zilliz:RAG 的下半场,是 Context Engineering 的基础设施

架构痛点

RAG(检索增强生成)已经成为标配,但核心挑战已从“这就跑通”变成了“大规模落地”。如何解决 Long Context 带来的昂贵成本?如何在多租户场景下平衡写入与查询的放大效应?

嘉宾解法

Zilliz 研发总监兼 Milvus 负责人刘力,将带来 Milvus 在 Context Engineering 中的湖仓一体实践。

  • 核心观点:Informational Context 的核心矛盾在于“质量 vs 数量”。RAG 必须进化,解决非结构化数据全生命周期的管理问题。

  • 关键技术:

    • 搜索策略演进:既然单纯的向量搜索不够准,那就引入混合搜索、ColBERT、聚合搜索等新式方法,保证 Context 的“质”。

    • 多租户挑战:揭秘在海量数据下,如何在写入和查询放大间取得平衡,实现性能与成本的最优解。

    • 湖仓一体闭环:展示从 Data Mining 到 Model Training 再到在线服务的非结构化数据生命周期管理方案。

3腾讯:拒绝模糊需求,用“上下文工程 2.0”重构开发流

架构痛点

企业级开发中最大的内耗来自“需求模糊”和“协作断层”。AI 辅助编程如果只是补全代码,无法解决核心的工程一致性问题。如何让 AI 理解整个项目的“上下文”?

嘉宾解法

腾讯资深技术产品专家汪晟杰将带来 CodeBuddy 的落地实战,提出 “Spec-Coding”的新范式。

  • 核心观点:上下文工程 2.0 是将“需求→规则→实现”打通为可闭环链路。

  • 关键技术:

    • Spec-Coding 引擎:利用SpecKit将自然语言需求结构化为任务、约束与验收标准。

    • 自动化闭环:也就是Rule Engine + Context Orchestrator。AI 不再是瞎写代码,而是基于工程规则库自动拆解任务、生成代码并执行测试。

    • 实效数据:实践表明,该方案可使开发周期缩短 30%~50%,显著降低缺陷密度。

4灵犀量子:迈向 AI Scientist,智能体的“自我进化”之路

架构痛点

通用大模型在面对医学科研等高度专业、长周期的任务时,往往表现出“知识固化”和“规划脆弱”。静态的 Prompt 无法应对动态的科研探索,AI 需要像科学家一样,从失败中学习。

嘉宾解法

灵犀量子医疗科技总经理王则远博士,将分享一种前沿的 AI Scientist 架构,聚焦于“动态上下文优化”。

  • 核心观点:从In-Context Learning进化到In-Task Learning。建立一个随任务进程自适应更新的“行动手册”。

  • 关键技术:

    • “模式探索 - 过程反思”双循环:这是一个元认知系统。在线挖掘高价值行动模式,离线对失败路径进行因果归因(Process Reflection)。

    • 动态重规划:规划器(Planner)不再是一次性的,而是根据环境反馈进行局部路径的动态调整与剪枝。

    • 工具接地(Tool Grounding):AI 不再是简单调用 API,而是理解工具的副作用与参数语义,实现真正的 Tool Manipulation。

5结语

从金山的信息流转架构,到 Zilliz 的数据底座;从腾讯的研发效能落地,到灵犀量子的前沿认知探索

这四场演讲,代表了 Context Engineering 在不同维度的技术实践。如果你关注如何构建可信赖、可扩展、可控的复杂 AI 系统,这一场论坛绝对不容错过。👇 扫码报名,见证 AI 系统架构的代际升级。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2025/12/17 4:59:33

Spring AI 最新实战系列(一)完成一个简单的AI项目

使用前介绍 我们以 Alibaba 的百炼平台作为Spring-AI的模型讲解,以最新稳定版作为架构。 spring-ai 的最新版本 1.1.2 ;alibaba-spring-ai 的最新版本 1.1.0.0-RC1。 需要注意一点:最新版本的 Spring Boot 4.0.0 不能适配,需要降低…

作者头像 李华
网站建设 2025/12/17 4:59:18

LobeChat智谱ChatGLM接入全流程:Zhipu AI API对接

LobeChat 智谱 ChatGLM 接入全流程:Zhipu AI API 对接 在智能对话系统快速普及的今天,越来越多企业和开发者希望构建既具备专业能力又符合本地化需求的 AI 助手。然而,直接使用境外大模型服务常面临中文表达生硬、数据出境合规风险、网络延迟…

作者头像 李华
网站建设 2025/12/17 4:59:16

EmotiVoice能否实现语音情感渐变过渡?动态控制探索

EmotiVoice能否实现语音情感渐变过渡?动态控制探索 在虚拟偶像直播中,一个角色从担忧到释然的语气转变,往往只需一句话的时间;在互动游戏中,NPC因玩家行为瞬间由温和转为愤怒——这些细腻的情感流动,早已超…

作者头像 李华
网站建设 2025/12/17 4:55:53

终极微博备份指南:Speechless免费工具完整使用教程

终极微博备份指南:Speechless免费工具完整使用教程 【免费下载链接】Speechless 把新浪微博的内容,导出成 PDF 文件进行备份的 Chrome Extension。 项目地址: https://gitcode.com/gh_mirrors/sp/Speechless 在信息碎片化的今天,微博承…

作者头像 李华
网站建设 2025/12/17 4:51:54

暗黑破坏神2存档编辑器终极指南:从零基础到精通进阶

暗黑破坏神2存档编辑器终极指南:从零基础到精通进阶 【免费下载链接】d2s-editor 项目地址: https://gitcode.com/gh_mirrors/d2/d2s-editor 你是否曾经为暗黑破坏神2中的角色Build优化而苦恼?是否想要快速测试不同装备组合的效果却受限于漫长的…

作者头像 李华
网站建设 2025/12/17 4:51:06

LobeChat Google Gemini Pro接入方法:多模态能力整合

LobeChat 与 Google Gemini Pro 的多模态整合实践 在生成式 AI 快速演进的今天,用户对智能助手的期待早已超越“能聊天”的基本功能。我们不再满足于仅用文字提问、等待文本回复——而是希望上传一张产品截图就能获得详细分析,或是拖入一份 PDF 合同便能…

作者头像 李华