news 2026/6/23 20:18:31

10.3 反向传播算法:计算图、链式法则与自动微分

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
10.3 反向传播算法:计算图、链式法则与自动微分

10.3 反向传播算法:计算图、链式法则与自动微分

反向传播算法是训练多层神经网络的核心,它通过高效地计算损失函数相对于网络所有参数的梯度,为基于梯度的优化方法提供了可能。反向传播并非一种新的学习算法,而是梯度计算在神经网络特定结构下的高效实现方案。其核心思想源于微积分中的链式法则,并通过计算图这一抽象得到直观的表示和系统化的实现。本节将详细阐述反向传播的原理,从计算图表示、链式法则的递归应用,到其与现代自动微分技术的紧密联系。

10.3.1 计算图:结构与抽象

计算图是一种用于描述数学运算的有向无环图。在深度学习的语境下,它将复杂的神经网络前向传播过程分解为一系列基本的原子操作(如加法、乘法、指数运算、矩阵乘、激活函数等),从而清晰地揭示出变量之间的依赖关系。

10.3.1.1 图的构成

一个计算图GGG包含两种类型的节点:

  • 变量节点:表示计算过程中的数据,包括输入数据、模型参数(权重、偏置)以及计算得到的中间变量。
  • 运算符节点:表示施加在变量上的基本运算。每个运算符节点接收一个或多个输入变量,并产生一个输出变量。

图中的边表示数据的流向,从输入指向运算符,再从运算符指向其输出的变量。例如,一个简单的线性层运算z=wTx+bz = \mathbf{w}^T \mathbf{x} + bz=wTx+b可以分解为向量内积和标量加法两个运算符节点。

10.3.1.2 前向传播与反向传播的图视角

神经网络的前向传播过程,对应于从输入节点开始,按照图的拓扑顺序,依次计算每个运算符节点的输出,直至得到最终的输出(如预测值)和损失值LLL。这完成了计算图的“向前”遍历。

反向传播的目标是计算损失LLL对图中所有参数节点(如w\mathbf{w}w,bbb)的梯度∂L∂w,∂L∂b\frac{\partial L}{\partial \mathbf{w}}, \frac{\partial L}{\partial b}wL,bL。从计算图的角度看,这等价于从损失节点LLL开始,按照与边相反的方向(即逆向拓扑顺序),依次计算LLL对图中每个节点的梯度。计算图的结构化表示使得梯度计算可以分解为一系列局部梯度传播的步骤。

10.3.2 链式法则与反向传播的递归计算

反向传播算法的数学本质是多变量微积分的链式法则。对于一个由多个函数嵌套组成的复合函数,链式法则说明了如何计算其导数。在计算图中,每个运算符节点代表一个局部函数。

10.3.2.1 链式法则的形式化

设最终损失LLL是变量yyy的函数,而yyy又是变量xxx的函数:y=f(x)y = f(x)y=f(x),L=g(y)L = g(y)L=g(y)。根据链式法则,LLLxxx的导数为:
∂L∂x=∂L∂y⋅∂y∂x \frac{\partial L}{\partial x} = \frac{\partial L}{\partial y} \cdot \frac{\partial y}{\partial x}xL=yLxy

在计算图中,节点yyyxxx的后继。当我们进行反向传播时,假设已经计算得到了损失LLLyyy的梯度∂L∂y\frac{\partial L}{\partial y}yL(称为yyy的“上游梯度”),那么要计算LLLxxx的梯度,只需将上游梯度乘以yyy关于

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/23 17:20:23

告别手动编号!Word公式自动化技巧大公开

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 开发一个智能Word模板,内置自动公式编号系统。用户插入新公式时自动添加编号并创建书签,支持通过对话框设置编号格式(如[1.1]或(1-1)&#xff0…

作者头像 李华
网站建设 2026/6/23 17:16:51

Open-AutoGLM + IoT 联动架构设计精要,资深专家20年经验倾囊相授

第一章:Open-AutoGLM 与 IoT 联动架构的演进与定位 随着边缘计算与人工智能技术的深度融合,Open-AutoGLM 作为一种轻量级、可扩展的自研大语言模型推理框架,逐步在物联网(IoT)场景中展现出强大的协同能力。其核心优势在…

作者头像 李华
网站建设 2026/6/22 23:59:41

用NVIDIA Container Toolkit快速验证AI创意

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 开发一个快速原型项目,使用NVIDIA Container Toolkit部署一个生成对抗网络(GAN)模型,用于图像生成。项目应包含简单的用户界面&…

作者头像 李华
网站建设 2026/6/23 8:04:02

柯尼卡美能达 CS-1000 分光辐射辉度计

分光放射辉度仪CS-1000/CS-1000A/CS-1000S/CS-1000T的主要应用。测量CRT-LCD、有机EL等显示设备的分光数据、辉度、色度、相关色温。。测量灯等照明光源的分光数据、辉度、色度、相关色温。。本机作为各种辉度、色度测量器的标准仪器。可通过非接触方式测量物体的色彩柯尼卡美能…

作者头像 李华
网站建设 2026/6/23 17:14:03

从零开始:用Keil uVision5开发智能温控系统实战

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 生成一个基于STM32和DS18B20温度传感器的智能温控系统Keil项目代码。要求包含:1. DS18B20驱动代码 2. PID控制算法实现 3. PWM控制风扇转速 4. OLED显示温度曲线 5. 串…

作者头像 李华
网站建设 2026/6/23 17:16:03

5分钟搭建Playwright测试原型:无需完整安装

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 构建一个即开即用的Playwright测试原型,要求:1.预装所有必要依赖 2.包含3个典型测试案例(表单填写、截图、PDF生成) 3.内置示例网站URL 4.支持一键运行 5.实…

作者头像 李华