目录
一、先把 Y / U / V 当成「人看世界的三种感觉」
二、真实场景 1:你在看一张新闻网页
三、为什么人眼对「亮度」更敏感?
四、真实场景 2:把一张彩色照片“拆开”
1️⃣ 只有亮度(Y)
2️⃣ 只有色度(U / V)
五、关键思想:既然色度不重要,那就少存点
如果每个像素都存:
但实际上可以这样做:
六、这就是你常听到的:色度降采样
用一句人话解释这些数字:
七、真实场景 3:为什么视频一定用 YUV?
八、一句话总结(非常重要)
一、先把 Y / U / V 当成「人看世界的三种感觉」
Y(亮度 / 明暗)
👉 决定“能不能看清轮廓、细节、文字”U / V(色度 / 颜色偏移)
👉 决定“这是红的、蓝的、偏黄还是偏绿”
可以理解为:
Y = 黑白照片
U / V = 给黑白照片上色
二、真实场景 1:你在看一张新闻网页
想象你在手机上看新闻:
文字是否清晰?
人脸轮廓是否锐利?
表情细节是否明显?
👉这些 90% 都由亮度 Y 决定
现在问你一个问题:
如果把颜色稍微糊一点,你还能看清内容吗?
答案是:可以。
但如果:
字体边缘糊了
明暗对比没了
👉 哪怕颜色很准,你也会觉得“看不清”
📌这正是 YUV 的出发点
三、为什么人眼对「亮度」更敏感?
这是生理事实:
人眼中:
视杆细胞→ 对明暗极其敏感(负责 Y)
视锥细胞→ 对颜色敏感度低很多(负责 U/V)
结果就是:
你能立刻发现“模糊”
但很难发现“颜色少了一点点”
四、真实场景 2:把一张彩色照片“拆开”
一张 RGB 彩色照片,其实可以变成:
1️⃣ 只有亮度(Y)
看起来是清晰的黑白照片
轮廓、文字、脸部全在
2️⃣ 只有色度(U / V)
看起来像一团“彩色云雾”
没什么清晰结构
这说明什么?
结构 = 亮度
颜色 = 附加信息
五、关键思想:既然色度不重要,那就少存点
这一步非常重要 👇
如果每个像素都存:
Y(亮度)
U(颜色)
V(颜色)
👉 数据量很大
但实际上可以这样做:
每个像素都存 Y
每 2×2 个像素,共用一组 U/V
人眼几乎察觉不到区别,但:
数据量直接降一半甚至更多
六、这就是你常听到的:色度降采样
用一句人话解释这些数字:
| 格式 | 含义 |
|---|---|
| 4:4:4 | 亮度和颜色一样精细(不省) |
| 4:2:2 | 水平方向颜色减半 |
| 4:2:0 | 水平 + 垂直方向颜色都减半(最常见) |
📌视频、直播、H.264、H.265 基本都是 4:2:0
七、真实场景 3:为什么视频一定用 YUV?
假设你在做视频:
1080p
60fps
RGB 存储
👉 带宽和存储直接爆炸 💥
换成 YUV 4:2:0:
清晰度几乎没变
数据量减少50%~70%
编码器压缩效果更好
所以:
📹摄像头 → YUV
🎬视频编码 → YUV
📡直播推流 → YUV
八、一句话总结(非常重要)
YUV 的本质不是“颜色空间”
而是“利用人眼弱点的工程设计”
用Y保证“看得清”
用U/V保证“看起来对”
对U/V 偷工减料,人眼还发现不了