轻历史·第九讲:GPU
从1999年“游戏显卡”到2025年“AI之神”,英伟达一个人把人类算力抬进了新纪元
一、诞生前的世界(1999年之前)
1999年之前,显卡只是“把画面画出来”的小配角:
- 3dfx Voodoo:硬件T&L的王者
- ATI Rage、S3 Savage:拼多边形、拼贴图
- NVIDIA当时只是个做2D加速的二线厂商,濒临破产
所有人都在问同一个问题:
“下一代显卡到底拼谁的三角形更多?
二、1999年8月31日:黄仁勋在西雅图一家小餐馆里写下了一张餐巾纸
GeForce 256(代号NV10)发布那天,NVIDIA第一次喊出了一个新词:
GPU(Graphics Processing Unit)
黄仁勋在发布会上只讲了一句话:
“从今天起,CPU负责逻辑,GPU负责并行,我们要把摩尔定律干翻。”
没人当回事,股价当天只涨了6%。
三、GPU硬核技术演进时间线(1999-2025)
| 年份 | 卡名/架构 | 关键技术 | 真实意义(当时没人敢说) |
|---|---|---|---|
| 1999 | GeForce 256 | 硬件T&L + 首个可编程着色器雏形 | 第一次把“变换和光照”从CPU手里抢走 |
| 2001 | GeForce 3 | 可编程顶点/像素着色器(DirectX 8) | 程序员第一次能自己写光影特效 |
| 2006 | GeForce 8800 GTX | CUDA 1.0(G80架构) | 第一次让显卡干通用计算,黄仁勋偷偷埋雷 |
| 2010 | Fermi | ECC内存 + 双精度浮点 | 让科研人员第一次敢把GPU当超级计算机用 |
| 2012 | Kepler | Dynamic Parallelism | GPU终于能自己生GPU线程 |
| 2014 | Maxwell | 功耗腰斩,性能翻倍 | 把GPU塞进笔记本才不烫手 |
| 2017 | Volta | Tensor Core(专门给AI矩阵乘) | 英伟达第一次公开说“我就是冲着AI去的” |
| 2018 | Turing | RT Core(实时光追) | 游戏用了噱头,AI用了命 |
| 2020 | Ampere | 第三代Tensor Core + 7nm | 训练GPT-3只需要几十张A100 |
| 2022 | Hopper | H100 + Transformer Engine + NVLink 4 | 单卡算力是V100的30倍,一张卡顶以前一个机柜 |
| 2023 | Ada Lovelace | DLSS 3(帧生成) | 游戏帧数翻倍,AI训练又翻倍 |
| 2024 | Blackwell | B200(2080亿晶体管,第五代Tensor) | 单卡训练性能是H100的4倍,推理性能15倍 |
| 2025 | Rubin(已流片) | 第六代Tensor + HBM4 + 3nm | 单卡峰值算力预计超200 PFLOPS(20亿亿次/秒) |
四、英伟达市值狂飙实录(用股价说话)
| 时间 | 市值(亿美元) | 发生了什么 |
|---|---|---|
| 1999 IPO | 3 | 卖游戏显卡的小厂 |
| 2016 | 300 | 比特币矿卡开始火 |
| 2020 | 3000 | A100开始量产 |
| 2023.6 | 1万 | 第一次超过英特尔 |
| 2024.6 | 3万 | 超越苹果,成为全球市值第二 |
| 2025.12(现在) | 4.2万 | 超越微软,成为全球市值第一公司 |
五、2025年真正的算力格局(冷冰冰的数字)
| 设备 | 峰值FP16算力(TFLOPS) | 2025年价格(美元) | 相当于多少个1999年的GeForce 256 |
|---|---|---|---|
| 一张GeForce 256 | 0.00048 | 299 | 1 |
| 一张RTX 4090 | 82 | 1599 | 17万倍 |
| 一张H100 | 1979 | 约3.5万 | 400万倍 |
| 一张B200 | 9000+ | 约5.5万 | 1800万倍 |
| 全球GPU总算力 | ≈5000亿TFLOPS | - | 相当于10亿台1999年的显卡 |
六、写在最后
GPU的本质从来不是“画画更快”,
而是人类有史以来第一次把“并行计算”从实验室搬到量产芯片上。
黄仁勋只做对了一件事:
在所有人都在拼三角形的时候,他偷偷把显卡变成了“矩阵乘法机器”。
结果:
- 游戏玩家花1599美元买4090是为了4K 240帧
- OpenAI、谷歌、字节花35亿美元买10万张H100是为了训练下一个GPT
1999年8月31日之前,显卡是电脑的“外设”。
1999年8月31日之后,GPU成了新世纪的“电力”。
下一讲第十讲:Wi-Fi
——一个澳洲天文学家追星时的副产品,偷偷把全人类从网线里解放了出来