news 2026/6/23 1:37:59

5.4 信息论核心概念:熵、互信息与KL散度

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
5.4 信息论核心概念:熵、互信息与KL散度

5.4 信息论核心概念:熵、互信息与KL散度

信息论为定量分析信息的产生、传输、存储和处理提供了严格的数学框架。在人工智能领域,信息论的概念和方法不仅为理解通信和编码问题奠定基础,更重要的是,它们提供了衡量不确定性、信息内容和概率分布之间差异的基本工具,从而深刻影响了机器学习、深度学习、数据压缩和推断等多个分支。本节将系统阐述信息论中三个最核心且互相关联的概念:互信息Kullback-Leibler散度,并详细说明它们在人工智能模型构建与分析中的关键作用。

5.4.1 熵:不确定性的度量

熵是信息论中最基本的概念,它量化了一个随机变量的不确定性或“信息含量”。

  1. 定义:对于一个定义在有限字母表X\mathcal{X}X上的离散随机变量XXX,其概率质量函数为P(x)P(x)P(x)香农熵定义为:
    H(X)=−∑x∈XP(x)log⁡P(x) H(X) = -\sum_{x \in \mathcal{X}} P(x) \log P(x)H(X)=xXP(x)logP(x)
    其中,对数通常以2为底,此时熵的单位是比特;或以自然常数eee为底,单位是纳特。该定义要求约定0log⁡0=00 \log 0 = 00log0=0,因为lim⁡p→0+plog⁡p=0\lim_{p \to 0^+} p \log p = 0limp0+plogp=0。熵H(X)H(X)H(X)可以理解为,为了确定随机变量XXX的具体取值,平均所需提问的“是/否”问题的最小数量(在最优编码下)[1]。

  2. 性质与解释

    • 非负性H(X)≥0H(X) \ge 0H(X)0。等号成立当且仅当XXX以概率1取某个值(即确定性事件,无不确定性)。
    • 上界:对于定义在∣X∣|\mathcal{X}|X个元素上的随机变量,H(X)≤log⁡∣X∣H(X) \le \log |\mathcal{X}|H(X)logX。等号成立当且仅当XXX服从均匀分布。这意味着均匀分布具有最大不确定性。
    • 连续随机变量的微分熵:对于连续随机变量XXX及其概率密度函数p(x)p(x)p(x)微分熵定义为h(X)=−∫Xp(x)log⁡p(x)dxh(X) = -\int_{\mathcal{X}} p(x) \log p(x) dxh(X)=Xp(x)logp(x)dx。微分熵不具备离散熵的所有性质(例如,它可能为负值),但其相对大小和变化在许多分析中仍有意义。
  3. 联合熵与条件熵

    • 联合熵:衡量一对随机变量(X,Y)(X, Y)(X,Y)联合分布的不确定性:
      H(X,Y)=−∑x,yP(x,y)log⁡P(x,y) H(X, Y) = -\sum_{x, y} P(x, y) \log P(x, y)H(X,Y)=x,yP(x,y)logP(x,y)
    • 条件熵:衡量在已知随机变量YYY取值条件下,随机变量XXX剩余的不确定性:
      H(X∣Y)=∑yP(y)H(X∣Y=y)=−∑x,yP(x,y)log⁡P(x∣y) H(X | Y) = \sum_{y} P(y) H(X | Y=y) = -\sum_{x, y} P(x, y) \log P(x | y)H(XY)=yP(y)H(XY=y)=x,yP(x,y)logP(xy)
      可以证明:H(X,Y)=H(Y)+H(X∣Y)=H(X)+H(Y∣X)H(X, Y) = H(Y) + H(X | Y) = H(X) + H(Y | X)H(X,Y)=H(Y)+H(XY)=H(X)+H(YX)。这被称为链式法则

5.4.2 互信息:变量间依赖关系的度量

互信息量化了两个随机变量之间相互依赖的程度,或者说,知道一个变量的值能为预测另一个变量的值提供多少信息。

  1. 定义:随机变量XXXYYY之间的互信息定义为:
    I(X;Y)=∑x∈X∑y∈YP(x,y)log⁡P(x,y)P(x)P(y) I(X; Y) = \sum_{x \in \mathcal{X}} \sum_{y \in \mathcal{Y}} P(x, y) \log \frac{P(x, y)}{P(x)P(y)}I<

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/23 19:34:20

洋驼帮跨境物流

在东南亚电商市场深耕的卖家们&#xff0c;最近都在讨论一个令人振奋的数字&#xff1a;店铺稳定率提升80%。这不是凭空而来的宣传口号&#xff0c;而是5000多位卖家通过实际合作验证的结果。一位有着十年经验的物流行业资深从业者坦言&#xff0c;东南亚市场的物流痛点确实不少…

作者头像 李华
网站建设 2026/6/23 19:33:04

Kotaemon在政务场景下的合规性与安全性设计

Kotaemon在政务场景下的合规性与安全性设计 在政务服务日益智能化的今天&#xff0c;公众对政策咨询、办事指引的响应速度和准确性的期待不断提升。越来越多的政府机构开始引入AI对话系统来辅助人工客服&#xff0c;但随之而来的数据安全风险、输出不可控问题以及监管审计难题也…

作者头像 李华
网站建设 2026/6/23 7:13:47

两款免费神器一键修复,网络难题轻松搞定!

点击蓝字关注我 作者 |风雨软件 前言 在使用电脑的过程中&#xff0c;网络突然断开连接的情况是不是让你措手不及&#xff1f;更糟的是&#xff0c;各种网络设置藏得太深&#xff0c;对于非专业人士来说&#xff0c;简直是无从下手&#xff0c;只能干着急。 今天&#xff0…

作者头像 李华
网站建设 2026/6/23 5:15:38

自动化营销有哪些方式,国内外有哪些自动化营销工具?

在数字化营销普及的今天&#xff0c;自动化营销已成为企业降低成本、提升效率的核心手段。数据显示&#xff0c;采用自动化营销的企业线索转化率平均提升45%&#xff0c;营销人力成本降低50%以上。但多数企业面临“方式零散、工具适配差”的问题&#xff0c;难以形成全链路闭环…

作者头像 李华
网站建设 2026/6/23 17:52:11

Cursor快捷键大全:效率翻倍的隐藏技巧

用了半年Cursor&#xff0c;我发现自己以前写代码的方式太原始了。直到有一天&#xff0c;我看到同事的手指在键盘上飞舞&#xff0c;几乎不用碰鼠标就完成了我需要半分钟的操作&#xff0c;才意识到掌握快捷键有多重要。今天我就把自己整理的Cursor快捷键秘籍分享出来&#xf…

作者头像 李华