layer normalization和batch normalization-育师

layer normalization

常用于长序列文本处理。

https://www.bilibili.com/video/BV1jdWUzkEWc?spm_id_from=333.788.videopod.sections&vd_source=3ca0ef7e7d00a2f1b8033084a87a3a84

在样本内部做归一化，假设一个batch内有五句话（五个样本），对于第一句话，I like to eat apples有五个单词，每个单词的向量由五个维度表示，那么对每个单词的五个维度的特征值计算一个均值和方差，从而实现层归一化。

例题：

https://www.bilibili.com/video/BV1L2421N7jQ/?spm_id_from=333.337.search-card.all.click&vd_source=3ca0ef7e7d00a2f1b8033084a87a3a84

解：shape(batch,序列长度，特征维度)===》（一个batch有几个句子，一个句子有几个单词，每个单词的特征由几个维度表示），也就是有几个单词那么就要计算几个均值和方差。

多应用于图像处理。

https://www.bilibili.com/video/BV1qdWUzkEad?spm_id_from=333.788.videopod.sections&vd_source=3ca0ef7e7d00a2f1b8033084a87a3a84

在一个batch中的多个样本做归一化，本质上就是对一个batch中多个图片的第i层通道一起做归一化计算，一层通道计算一次均值和方差。

例题：

https://www.bilibili.com/video/BV1L2421N7jQ/?spm_id_from=333.337.search-card.all.click&vd_source=3ca0ef7e7d00a2f1b8033084a87a3a84

解：shape（batch，通道数，高度，宽度），每个样本对应的通道一起做归一化，那么也就是有多少层就要计算多少个均值和方差。

还在为reMarkable平板的文件同步发愁？云服务延迟、USB操作繁琐，这些问题困扰着无数用户。今天为你带来6款跨平台GUI客户端的完整评测，帮你彻底告别管理烦恼，让数字墨水体验真正流畅起来！ 【免费下载链接】awesome-reMa…

李华

当5G网络如高速动脉般铺展，海量智能终端正以前所未有的速度涌入企业——从智能手机、平板到物联网设备，从远程办公笔记本电脑到生产线上的专用终端。设备数量激增、类型繁杂、接入场景多元化，传统的终端管理方式正面临严峻挑战：安…

李华

Phi-2模型：5个实用技巧让你快速上手AI文本生成【免费下载链接】phi-2 项目地址: https://ai.gitcode.com/hf_mirrors/ai-gitcode/phi-2 想要快速掌握Phi-2模型的使用方法吗？🤔 这篇实用指南将带你从零开始，用最简单的方式…

李华

博主介绍：✌️码农一枚 ，专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者，博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围：&am…

李华

在使用电脑系统时经常会出现丢失找不到某些文件的情况，由于很多常用软件都是采用 Microsoft Visual Studio 编写的，所以这类软件的运行需要依赖微软Visual C运行库，比如像 QQ、迅雷、Adobe 软件等等，如果没有安装VC运行库或者安装…

李华

📍 切入点表达式常见形式速查手册🎯 execution（最常用） 语法模板 execution(修饰符? 返回类型包名.类名.方法名(参数) 异常?)可以使用通配符描述切入点 “ * ” ：单个独立的任意符号，可以通配任意返回值…

李华