news 2026/6/23 15:42:07

1F1B详细原理流程(使用LLM生成的,但是讲解的挺生动的)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
1F1B详细原理流程(使用LLM生成的,但是讲解的挺生动的)
GPipe vs. 1F1B 流水线并行策略时序对比 太棒了,画图是理解并行策略最高效的方式! 为了让你一眼看懂,我为你绘制了一张**时序对比图(Time Schedule)**。 我们设定一个简单的场景: * **3 个工人**(GPU 0, GPU 1, GPU 2) * **4 个零件**(Micro-batch 1, 2, 3, 4) 请看下面的“草图”对比: ### 1. 😭 朴素模式 (GPipe):大片空白,效率低 > **特点**:一根筋。所有人必须先把所有零件的**初加工(F)** 做完,再统一做**精加工(B)**。 ```text 时间轴 (Time) ---> [T1] [T2] [T3] [T4] [T5] [T6] [T7] [T8] [T9] [T10] [T11] [T12] --------------------------------------------------------------------- GPU 0 | F1 | F2 | F3 | F4 | | | | | B1 | B2 | B3 | B4 | GPU 1 | | F1 | F2 | F3 | F4 | | | B1 | B2 | B3 | B4 | | GPU 2 | | | F1 | F2 | F3 | F4 | B1 | B2 | B3 | B4 | | | --------------------------------------------------------------------- ^^^^^^^^^^^^^^^ 注意中间这块巨大的空白(气泡) GPU0 和 GPU1 都在发呆!
  • F: Forward (前向计算)
  • B: Backward (反向传播)
  • 空白: 气泡 (Bubble),显卡在闲置烧钱。

2. 🤩 1F1B 模式:紧凑穿插,效率高

特点:灵活插单。只要下游把“修改意见(B)”传回来,我就立刻处理,处理完马上接着做下一个新零件(F)。

时间轴 (Time) ---> [T1] [T2] [T3] [T4] [T5] [T6] [T7] [T8] --------------------------------------------- GPU 0 | F1 | F2 | F3 | B1 | F4 | B2 | B3 | B4 | GPU 1 | | F1 | F2 | B1 | F3 | B2 | F4 | B3 | ... GPU 2 | | | F1 | B1 | F2 | B2 | F3 | B3 | ... --------------------------------------------- ^^^^^^^^^^ 看这里!(F) 和 (B) 完美交错

图解划重点:

  1. 热身 (Warm-up)

    • 看 GPU 0 的前三步F1 -> F2 -> F3。这是为了先把流水线填满。此时下游还没有反馈回来,所以只能闷头做 Forward。
  2. 1F1B 稳定期 (Steady State)

    • 看 GPU 0 的T4T5
      • T4 (B1):收到了下游传回来的第 1 个零件的梯度,立刻处理 B1(释放显存!)。
      • T5 (F4):处理完旧的,马上做新的 F4
    • 这就是“One Forward, One Backward”
  3. 消灭气泡

    • 对比两张图的长度,1F1B 明显更短(假如所有任务做完)。
    • 中间几乎没有连续的空白,显卡始终处于忙碌状态。
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/21 2:28:29

图像分割标注转换:从入门到精通的全方位指南

图像分割标注转换:从入门到精通的全方位指南 【免费下载链接】ultralytics ultralytics - 提供 YOLOv8 模型,用于目标检测、图像分割、姿态估计和图像分类,适合机器学习和计算机视觉领域的开发者。 项目地址: https://gitcode.com/GitHub_T…

作者头像 李华
网站建设 2026/6/22 15:06:09

3步精通Draw.io Mermaid插件:小白也能快速上手的文本转图表神器

3步精通Draw.io Mermaid插件:小白也能快速上手的文本转图表神器 【免费下载链接】drawio_mermaid_plugin Mermaid plugin for drawio desktop 项目地址: https://gitcode.com/gh_mirrors/dr/drawio_mermaid_plugin Draw.io Mermaid插件让文本生成图表变得前所…

作者头像 李华
网站建设 2026/6/23 8:23:48

12.14周报

目录 摘要 1.什么是机器学习? 2.有监督学习和无监督学习的区别 3.什么是过拟合、欠拟合?怎么解决? 4.分类问题和回归问题的区别 5.怎么做异常检测?其目标函数是什么?与有监督学习的 区别是什么? 6. …

作者头像 李华
网站建设 2026/6/23 7:53:27

3分钟掌握Easy-Scraper:零基础网页数据抓取神器

还在为复杂的数据抓取任务而头疼吗?传统爬虫工具需要掌握繁琐的CSS选择器或XPath语法,让无数新手望而却步。今天,让我们一起探索Easy-Scraper——这款革命性的网页抓取工具,用最简单的方式帮你获取所需数据!Easy-Scrap…

作者头像 李华
网站建设 2026/6/21 19:39:10

飞书文档批量导出终极指南:告别手动烦恼,实现高效迁移

飞书文档批量导出终极指南:告别手动烦恼,实现高效迁移 【免费下载链接】feishu-doc-export 项目地址: https://gitcode.com/gh_mirrors/fe/feishu-doc-export 你是否曾经为文档迁移而头疼不已?面对数百个飞书文档需要导出到本地&…

作者头像 李华
网站建设 2026/6/22 17:48:11

SuperCom串口调试工具:终极免费解决方案与5分钟快速部署指南

想要摆脱串口调试的繁琐操作吗?SuperCom作为一款功能强大的免费串口调试工具,专为嵌入式开发者和硬件工程师设计,让你在5分钟内完成从零开始的完整配置。无论是多设备并行监控还是自动化命令执行,这款工具都能显著提升你的工作效率…

作者头像 李华