news 2026/6/23 19:33:20

Day 43图像数据与显存机制@浙大疏锦行

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Day 43图像数据与显存机制@浙大疏锦行

Day 43 学习笔记:图像数据与显存机制@浙大疏锦行

一、 图像数据基础

  1. 数据形状 (Shape)

    • 结构化数据(样本数, 特征数)

    • 图像数据

      (通道数, 高, 宽)

      PyTorch 默认格式 (Channel First)

      • 灰度图(如 MNIST):通道数 = 1
      • 彩色图(如 CIFAR-10):通道数 = 3 (RGB)
  2. 维度陷阱

    • PyTorch使用(C, H, W)
    • Matplotlib/OpenCV通常使用(H, W, C)
    • 注意:在使用plt.imshow()可视化 PyTorch 张量时,必须先使用np.transposepermute交换维度顺序。

二、 图像神经网络 (MLP) 定义

  1. 展平操作 (Flatten)
    • MLP 全连接层只能接收一维向量。
    • 必须在输入层前使用nn.Flatten()x.view()(C, H, W)拉平为(C×H×W)的一维向量。
  2. Batch Size 与模型定义
    • 模型定义阶段无关nn.Linear等层定义时不涉及 Batch Size。
    • 数据加载阶段相关DataLoader中设置 Batch Size。
    • 前向传播:PyTorch 会自动处理第一维度的 Batch,模型内部计算逻辑不变。

三、 显存 (VRAM) 占用分析

显存不仅仅用来存图片,主要由以下4部分组成:

组成部分说明估算公式 (Float32)
1. 模型参数模型的权重 (Weights) 和偏置 (Bias)参数量 ×× 4 Bytes
2. 梯度反向传播计算出的导数≈≈ 参数量 ×× 4 Bytes
3. 优化器状态优化器更新参数所需的额外信息SGD: 0
Adam: ≈≈ 参数量 ×× 8 Bytes (动量+方差)
4. 中间变量 & 数据输入数据 + 每一层的输出特征图 (Activations)受 Batch Size 影响最大
Batch Size ×× (单样本大小 + 中间层大小)

结论:模型参数和优化器占用是固定的(这也是为什么大模型很难跑起来),而调整 Batch Size 是控制显存占用的主要手段

四、 Batch Size 的选择策略

  1. 显存限制 (OOM)
    • Batch Size 设置过大会导致Out Of Memory
    • 建议从 16, 32, 64 开始尝试,通常设置为显卡最大承载能力的80%左右。
  2. 对训练的影响
    • Batch Size = 1:梯度随机性大,震荡剧烈,难以收敛。
    • Batch Size 较大:利用矩阵并行计算加速;梯度是多个样本的平均值,方向更准,训练更稳定。

@浙大疏锦行

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/22 17:14:35

Linly-Talker支持语音指令控制数字人行为

Linly-Talker:用语音指令驱动数字人行为的全栈实践 在虚拟主播直播带货、企业数字员工在线答疑、AI教师录制网课越来越常见的今天,一个核心问题摆在开发者面前:如何让数字人真正“听懂”用户的话,并做出自然且富有表现力的回应&am…

作者头像 李华
网站建设 2026/6/23 11:55:44

OBS直播教程:OBS美颜插件怎么调出来?OBS美颜插件安装步骤

OBS直播教程:OBS美颜插件怎么调出来?OBS美颜插件安装步骤 第一步:下载OBS美颜插件安装包,并完成安装 OBS美颜插件下载地址①: https://d.obscj.com/obs-Beauty-camera.exe OBS美颜插件下载地址②: htt…

作者头像 李华
网站建设 2026/6/22 15:57:58

9、从 NT 3.51 或 NT 4 迁移到 Active Directory 的全面指南

从 NT 3.51 或 NT 4 迁移到 Active Directory 的全面指南 1. 引言 将生产服务器从旧系统升级到新系统,比从头安装一个全新的网络更具挑战性。因为现有网络的使用情况使得升级前需要大量的准备工作。而全新网络的安装通常不会干扰用户的生产业务,甚至可以在工作时间进行。迁…

作者头像 李华
网站建设 2026/6/19 15:08:08

Linly-Talker支持语音情感强度调节滑块

Linly-Talker支持语音情感强度调节滑块 在虚拟主播的直播间里,一句“感谢大家的支持”如果总是用同样的热情语调重复播放,时间一长就会显得机械而缺乏诚意;但在心理咨询场景中,若AI语气过于激昂,又可能让用户感到不适。…

作者头像 李华
网站建设 2026/6/21 3:18:03

5、使用用户组来组织用户账户

使用用户组来组织用户账户 在管理大量用户账户时,使用组来组织用户账户是一种高效且安全的方法。本文将详细介绍如何使用组来简化管理任务,包括组的概念、类型、范围,以及如何实施组策略、创建和管理组等内容。 1. 组的简介 组为组织具有相似职责且需要访问网络上公共资源…

作者头像 李华
网站建设 2026/6/23 17:54:46

12、Windows系统文件管理与IE浏览器使用指南

Windows系统文件管理与IE浏览器使用指南 在日常使用Windows系统和网络浏览的过程中,我们经常需要对文件进行管理,同时也需要借助浏览器来访问各种网站。下面将详细介绍Windows系统中文件的查找、组织、共享等操作,以及Internet Explorer浏览器的使用方法。 一、Windows系统…

作者头像 李华