大模型应用开发(十六)

4. RAG概述

提高大语言模型(LLM)回答的准确性和一致性通常有三种方式：

OpenAl 这个图就把优化上下文信息内容和LLM 行为优化分两个轴，一个针对 what the model needs to know ,一个针对 how the model needs to act

黑色方块和箭头指的是常见优化LLM accuracy和保持consistent behavior的常规步骤：

1、初始提示 (Prompt)：首先从一个基础提示(Prompt)开始。提示是你提供给模型的问题或输入，模型会根据这个提示生成结果

2、添加静态的 Few-Shot示例：Few-shot学习是指在提示中添加几个示例，这些示例展示了你期望的输入-输出关系。通过静态地添加这些示例，你可以提高模型生成结果的一致性。同时可以evals评估测试

3、加入动态检索步骤：通过检索机制，模型可以动态地根据问题获取与之相关的 Few-shot 示例。这有助于提高模型的性能，因为它可以在每次生成时获取到更相关的上下文。

4、准备数据集并进行微调：为了提高模型的一致性，你需要准备一个包含 50 个以上示例的数据集，并在这个数据集上对模型进行微调

5、优化检索和加入事实检查步骤:：索机制帮助模型找到更相关的上下文，而事实检査步骤可以帮助检测模型生成的错误(也称为“幻觉”)，以确保模型生成的内容更加准确。

6、再次训练模型：在加入了新的检索机制和事实检査步骤后，你可以用增强的输入数据重新训练模型，以进一步提高性能

RAG技术本质

RAG（Retrieval-Augmented Generation）是一种结合了信息检索（Retrieval）与生成式模型（Generation）的 AI 技术框架。

它的核心思想是：

在生成回答之前，先从外部知识库中检索到相关信息，再将这些信息与用户问题一同输入大语言模型，让模型“带着事实”回答问题。

这样，模型的回答不仅更加准确、可解释、实时更新，还能避免模型“幻觉”（hallucination）。

RAG 通常分为两个阶段：

1️⃣ 检索阶段（Retrieval）

2️⃣ 生成阶段（Generation）

用户问题 ↓ [检索模块] → 检索外部知识库（向量数据库） ↓ 返回相关文档 [生成模块] ← 将问题 + 检索结果输入大模型 ↓ 生成增强回答

组件	作用	常见实现
文档预处理	将知识源（PDF、网页、数据库）拆分成段落块（chunks）	LangChain、LlamaIndex
向量化（Embedding）	把文本转成向量用于相似度检索	OpenAI Embeddings、Sentence-BERT、bge-large-zh
向量数据库	存储并检索文本向量	FAISS、Milvus、Pinecone、Chroma
检索策略	根据相似度、BM25、RRF 等算法选出上下文	similarity search、hybrid search
生成模型	根据检索结果生成回答	GPT-4、Llama3、Claude、Qwen
Prompt 模板	控制生成阶段的上下文格式	“Context + Question + Instruction” 模板

影响 266 nm 皮秒紫外激光器种子源（1064 nm）功率稳定性的关键因素涉及多个子系统，其中你提到的水冷机、零气模块（CDA）、功率计都是重要的外部支撑或监测设备。下面我们从系统工程角度，系统性地分析这些设…

李华

昆仑通态MCGS与欧姆龙E5CC温控器通讯PID模式输出启停(KUNL-1) 功能：通过昆仑通态对欧姆龙E5CC温控器设定温度，读取温控，控制输出启停，切换PID/ON-OFF控制，PID自整定调整。反应灵敏，通讯稳定可靠。器件&a…

李华

通达信〖逆势突破强牛〗指标公式逆市环境中率先突破前期重要压力位较强内在上涨动力今天介绍的这款工具正是为了识别那些在逆市环境中依然能够强势突破的个股信号。这套分析方法通过捕捉价格运行的特殊状态来定位潜在机会。它首先会标记出近期的一个关键高位位置&#…

李华

基于扰动观测器的永磁同步电机（PMSM）模型预测控制（MPC）仿真速度外环基于模型预测控制、电流内环基于无差拍控制搭建，控制效果理想，模块程序设计通俗易通在电机控制领域，永磁同步电机&#xff0…

李华

AEB联合仿真算法设计软件使用：Carsim2019.0Matlab/Simulink2021a 适用场景：采用模块化建模方法，搭建AEB仿真算法，适用于直线驾驶工况场景。包含模块：Carsim模块，function函数逻辑模块，每个模块…

李华

博主介绍：✌️码农一枚 ，专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者，博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围：&am…

李华