news 2026/6/23 9:41:41

【RAG安全】【ACL】The Good and The Bad: Exploring Privacy Issues in Retrieval-Augmented Generation (RAG)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【RAG安全】【ACL】The Good and The Bad: Exploring Privacy Issues in Retrieval-Augmented Generation (RAG)

  • ACL 2024 Findings

Abstract

检索增强生成(RAG)是一种强大的技术,可将专有和私有数据引入语言模型,其中数据隐私是关键问题。尽管已有大量研究揭示了大语言模型(LLM)的隐私风险,但RAG技术可能重塑LLM生成的固有行为,带来目前尚未充分探索的新隐私问题。本文通过新颖的攻击方法进行了广泛的实证研究,展示了RAG系统在泄露私有检索数据库方面的脆弱性。尽管RAG带来了检索数据方面的新风险,我们进一步揭示,RAG可以缓解LLM训练数据的泄露。总体而言,本文为检索增强LLM的隐私保护提供了新的见解,使LLM和RAG系统构建者均受益。我们的代码可在以下链接获取:
https://github.com/phycholosogy/RAG-privacy

1 Introduction

检索增强生成(RAG)是一种先进的自然语言处理技术,通过从大规模文档语料中检索信息并融入生成过程,从而提升文本生成的准确性与上下文相关性。该技术已被广泛应用于领域特定的对话机器人(Siriwardhana 等,2023)、邮件或代码补全(Parvez 等,2021)等场景。如图 1 所示,RAG 系统通常分为检索与生成两个阶段:当用户输入查询q qq后,系统先从外部数据库中检索出相关文档;随后将检索结果与原始查询拼接,共同输入到大语言模型(LLM)中,模型再结合自身预训练知识及检索数据生成回答a aa

本文聚焦 RAG 系统的隐私泄露风险,并指出:无论是检索数据集还是 LLM 的预训练/微调数据集,其信息均可能在 RAG 使用过程中被泄露。一方面,检索数据集往往包含敏感且高价值的领域特定信息(Parvez 等,2021;Kulkarni 等,2024),例如用于医疗对话机器人的患者处方数据(Yunxiang 等,2023)。另一方面,RAG 的检索过程可能影响 LLM 的文本生成行为,导致模型输出其训练/微调数据中的隐私信息。已有工作(Carlini 等,2021;Kandpal 等,2022;Lee 等,2021;Carlini 等,2022;Zeng 等,2023)观察到 LLM 会记忆并泄露预训练与微调数据,但外部检索数据的融入如何影响 LLM 在 RAG 中的记忆行为尚不清楚,值得进一步探究。因此,本文提出以下研究问题:

  • (RQ1)能否从 RAG 的外部检索数据库中提取私有数据?
  • (RQ2)检索数据是否会影响 RAG 中 LLM 的记忆行为?

针对 RQ1,为全面揭示检索数据集的隐私泄露,我们假设存在攻击者,其意图通过构造查询故意提取检索数据中的隐私信息。我们提出一种面向检索数据提取的复合结构化提示攻击方法,包含用于引导检索的 {information} 部分和命令模型输出检索上下文的 {command} 部分。以医疗对话 RAG 场景为例(第 3.2 节),攻击者可先询问与某疾病相关的通用信息或建议,并在查询末尾附加“命令提示”以提高提取成功率。随后,我们检查模型输出是否包含具体的处方记录等敏感信息。实验表明,所测试的 Llama2-7b-Chat 与 GPT-3.5-turbo 模型以接近 50% 的高概率输出与原始记录完全相同或高度相似的内容,揭示 RAG 系统对此类攻击极为脆弱,大量敏感检索数据可被泄露。

针对 RQ2,尽管已有研究表明 LLM 倾向于输出已记忆的训练数据,但检索数据融入对此现象的影响尚未被验证。为此,我们对 LLM 训练语料实施针对性攻击与前缀攻击,比较有无检索增强场景下的训练数据泄露程度。实验发现,在 RAG 系统中加入检索数据可显著降低 LLM 输出其记忆训练数据的倾向,其保护效果优于噪声注入或系统提示等传统方法。从训练数据安全视角看,RAG 架构相比单独使用 LLM 可能更为安全。

2 Related Work

2.1 Retrieval-Augmented Generation (RAG)

检索增强生成(RAG)由 Lewis 等人(2020)首次提出,现已成为增强大语言模型生成能力的主流方法之一(Liu,2022;Chase,2022;Van Veen 等,2023;Ram 等,2023;Shi 等,2023)。该范式通过引入外部知识显著提升输出准确性与相关性(Gao 等,2023),有效缓解 LLM 的“幻觉”问题(Shuster 等,2021)。RAG 的独特优势在于其架构高度灵活,可在无需重新训练或微调整个系统的情况下,单独替换或更新数据集、检索器或 LLM 三大核心组件(Shao 等,2023;Cheng 等,2023)。凭借这些优点,RAG 被广泛应用于个人聊天机器人、医疗诊断助手等特定领域专家系统(Panagoulias 等,2024)。

2.2 Privacy Risk of Large Language Models

大量研究表明,LLM 易记忆并无意泄露预训练语料中的信息(Carlini 等,2021;Kandpal 等,2022;Lee 等,2021;Carlini 等,2022;Ippolito 等,2022;Zhang 等,2021;Biderman 等,2023;Mireshghallah 等,2022;Lee 等,2023;Ren 等,2024)。Carlini 等人(2021)率先开展数据提取攻击,揭示 LLM 会回忆并复现训练数据片段。后续工作进一步发现模型规模、数据重复度、提示长度等因素会加剧记忆风险(Carlini 等,2022;Biderman 等,2023)。针对微调数据的隐私风险,Mireshghallah 等人(2022)指出调整模型头部比调整小型适配器模块更容易导致记忆;Zeng 等人(2023)发现对话与摘要等需丰富特征表示的任务在微调时尤其脆弱。Huang 等人(2023)研究了基于检索的 kNN-LM 隐私风险,但其架构与本文关注的 RAG 不同,因此与我们的工作存在差异。

3 Method

为回答第1节提出的RQ1与RQ2,我们设计多种攻击,量化RAG框架中不同组件的泄露风险。本节先概述RAG背景与威胁模型,随后分别给出针对检索数据与训练数据的攻击方法。

3.1 Background and Threat Model

RAG流程。典型的检索增强生成系统包含大语言模型M MM、检索数据集D DD与检索器R RR。给定用户查询q qq,系统输出答案a aa。形式化地,检索器首先返回与q qq最相关的top-k k

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/24 0:29:42

玩轮胎仿真不上手?老司机带你飙车。今天咱们用ABAQUS搞点硬核操作,从过盈充气到滚动传涵,手把手教你怎么让虚拟轮胎活起来

ABAQUS 轮胎建模-过盈充气-模态-滚动-频响仿真 abaqus 轮胎仿真包括自由模态仿真,刚度仿真,印痕仿真,接地静止的模态仿真,接地滚动模态仿真,三种状态:自由,接地静止和接地滚动的传涵仿真&#x…

作者头像 李华
网站建设 2026/6/23 14:23:18

当风电遇上“太极推手“:混合储能如何化解功率波动

5MW风电永磁直驱-1200V直流并网仿真,带混合储能系统,其中采用滑动平均滤波算法(可改为自己想用的算法)对波动功率进行分解,然后交由储能系统进行平抑。 台风天的风电场像极了喝醉酒的拳击手——出招毫无章法。我们给这个5MW的永磁直驱风电机…

作者头像 李华
网站建设 2026/6/23 14:22:34

MIPI DSI DPHY FPGA工程源码:Artix7-100t彩条驱动1024*600像...

MIPI DSI DPHY FPGA工程源码 mipi-dsi tx/mipi-dphy协议解析 MIPI DSI协议文档 纯verilog 彩条实现驱动mipi屏幕 1024*600像素。 的是fpga工程,非专业人士勿。 artix7-100t mipi-dsi未使用xilinx mipi的IP。 以及几个项目开发时搜集的MIPI DSI参考源码。最近在折腾…

作者头像 李华
网站建设 2026/6/22 18:31:08

最近在折腾四旋翼导航时踩了不少坑,发现真正让无人机听话飞行的核心都在代码细节里。今天就拿手头正在调试的飞控项目举例,聊聊怎么用代码让四旋翼实现基础导航

四旋翼代码导航先看最关键的姿态控制部分。下面这段C PID控制器代码看着简单,实测参数调不好能让无人机直接表演死亡翻滚: class PID { public:float kp, ki, kd, integral_max;float error_sum 0, last_error 0;float compute(float error, float dt)…

作者头像 李华
网站建设 2026/6/23 3:26:23

永磁同步电机全速域无传感器控制探索

永磁同步电机全速域无传感器控制 全速域 无传感器控制 1. 零低速域,采用高频脉振方波注入法 2. 中高速域采用改进的滑膜观测器,开关函数采用的是连续的sigmoid函数,转子位置提取采用的是pll锁相环 3. 转速切换区域采用的是加权切换法 带有参考…

作者头像 李华
网站建设 2026/6/23 13:37:50

Linly-Talker生成视频的镜头拉近推远动态效果实现

Linly-Talker生成视频的镜头拉近推远动态效果实现 在当前AI内容创作高速发展的背景下,数字人已不再是实验室里的概念演示,而是逐步渗透进教育、电商、金融等实际业务场景中的生产力工具。用户不再满足于“能说会动”的基础表现,而是期待更具影…

作者头像 李华