news 2026/1/12 17:33:21

轻历史·第九讲:GPU

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
轻历史·第九讲:GPU

轻历史·第九讲:GPU

从1999年“游戏显卡”到2025年“AI之神”,英伟达一个人把人类算力抬进了新纪元

一、诞生前的世界(1999年之前)

1999年之前,显卡只是“把画面画出来”的小配角:

  • 3dfx Voodoo:硬件T&L的王者
  • ATI Rage、S3 Savage:拼多边形、拼贴图
  • NVIDIA当时只是个做2D加速的二线厂商,濒临破产

所有人都在问同一个问题:
“下一代显卡到底拼谁的三角形更多?

二、1999年8月31日:黄仁勋在西雅图一家小餐馆里写下了一张餐巾纸

GeForce 256(代号NV10)发布那天,NVIDIA第一次喊出了一个新词:
GPU(Graphics Processing Unit)

黄仁勋在发布会上只讲了一句话:
“从今天起,CPU负责逻辑,GPU负责并行,我们要把摩尔定律干翻。”

没人当回事,股价当天只涨了6%。

三、GPU硬核技术演进时间线(1999-2025)
年份卡名/架构关键技术真实意义(当时没人敢说)
1999GeForce 256硬件T&L + 首个可编程着色器雏形第一次把“变换和光照”从CPU手里抢走
2001GeForce 3可编程顶点/像素着色器(DirectX 8)程序员第一次能自己写光影特效
2006GeForce 8800 GTXCUDA 1.0(G80架构)第一次让显卡干通用计算,黄仁勋偷偷埋雷
2010FermiECC内存 + 双精度浮点让科研人员第一次敢把GPU当超级计算机用
2012KeplerDynamic ParallelismGPU终于能自己生GPU线程
2014Maxwell功耗腰斩,性能翻倍把GPU塞进笔记本才不烫手
2017VoltaTensor Core(专门给AI矩阵乘)英伟达第一次公开说“我就是冲着AI去的”
2018TuringRT Core(实时光追)游戏用了噱头,AI用了命
2020Ampere第三代Tensor Core + 7nm训练GPT-3只需要几十张A100
2022HopperH100 + Transformer Engine + NVLink 4单卡算力是V100的30倍,一张卡顶以前一个机柜
2023Ada LovelaceDLSS 3(帧生成)游戏帧数翻倍,AI训练又翻倍
2024BlackwellB200(2080亿晶体管,第五代Tensor)单卡训练性能是H100的4倍,推理性能15倍
2025Rubin(已流片)第六代Tensor + HBM4 + 3nm单卡峰值算力预计超200 PFLOPS(20亿亿次/秒)
四、英伟达市值狂飙实录(用股价说话)
时间市值(亿美元)发生了什么
1999 IPO3卖游戏显卡的小厂
2016300比特币矿卡开始火
20203000A100开始量产
2023.61万第一次超过英特尔
2024.63万超越苹果,成为全球市值第二
2025.12(现在)4.2万超越微软,成为全球市值第一公司
五、2025年真正的算力格局(冷冰冰的数字)
设备峰值FP16算力(TFLOPS)2025年价格(美元)相当于多少个1999年的GeForce 256
一张GeForce 2560.000482991
一张RTX 409082159917万倍
一张H1001979约3.5万400万倍
一张B2009000+约5.5万1800万倍
全球GPU总算力≈5000亿TFLOPS-相当于10亿台1999年的显卡
六、写在最后

GPU的本质从来不是“画画更快”,
而是人类有史以来第一次把“并行计算”从实验室搬到量产芯片上。

黄仁勋只做对了一件事:
在所有人都在拼三角形的时候,他偷偷把显卡变成了“矩阵乘法机器”。

结果:

  • 游戏玩家花1599美元买4090是为了4K 240帧
  • OpenAI、谷歌、字节花35亿美元买10万张H100是为了训练下一个GPT

1999年8月31日之前,显卡是电脑的“外设”。
1999年8月31日之后,GPU成了新世纪的“电力”。

下一讲第十讲:Wi-Fi
——一个澳洲天文学家追星时的副产品,偷偷把全人类从网线里解放了出来

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/1/12 16:45:43

NVIDIA GPU 发展历程里程碑(1999 年至今)

💻 NVIDIA GPU 发展历程里程碑(1999 年至今)GPU型号 (Model Name)发布时间 (Launch Year)架构名称 (Architecture)流处理器数量 (CUDA Cores)FP32 峰值算力 (TFLOPS)目标市场 (Target Segment)首发价格 (MSRP)关键创新/意义GeForce 2561999NV…

作者头像 李华
网站建设 2026/1/9 23:06:20

游戏开发软件有哪些?一站式汇总,助力自主开发

游戏开发不是零散的操作步骤,而是涵盖引擎搭建、美术建模、程序编写、音频制作的完整工程体系,各个环节都需要适配对应的专业软件工具。下文将按核心功能分类,整理主流且实用的工具合集,兼顾独立开发者和大型团队的多样化开发需求…

作者头像 李华
网站建设 2026/1/6 18:50:22

redis(hash)使用场景

redis&#xff08;hash&#xff09;使用场景 1.‌用户信息存储 Service public class UserInfoService {Autowiredprivate RedisTemplate<String, Object> redisTemplate;/*** 保存完整用户信息*/public void saveUserInfo(String userId, Map<String, Object> use…

作者头像 李华
网站建设 2026/1/12 2:04:09

redis实现分布式锁

redis实现分布式锁 Component public class RedisDistributedLock {Autowiredprivate RedisTemplate<String, String> redisTemplate;private static final String LOCK_PREFIX "lock:";private static final long DEFAULT_EXPIRE 30_000; // 默认30秒// 加…

作者头像 李华
网站建设 2026/1/11 15:24:17

汇编:外设连接与中断

一、外设连接基础&#xff08;8086 体系&#xff09;1. 外设与 CPU 的连接方式CPU 通过地址总线、数据总线、控制总线与外设交互&#xff0c;核心方式有两种&#xff1a;端口映射&#xff08;I/O 映射&#xff09;&#xff1a;外设占用独立的 I/O 地址空间&#xff08;8086 为 …

作者头像 李华