news 2026/2/10 15:11:18

layer normalization和batch normalization

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
layer normalization和batch normalization

layer normalization

常用于长序列文本处理。

https://www.bilibili.com/video/BV1jdWUzkEWc?spm_id_from=333.788.videopod.sections&vd_source=3ca0ef7e7d00a2f1b8033084a87a3a84

在样本内部做归一化,假设一个batch内有五句话(五个样本),对于第一句话,I like to eat apples有五个单词,每个单词的向量由五个维度表示,那么对每个单词的五个维度的特征值计算一个均值和方差,从而实现层归一化。

例题:

https://www.bilibili.com/video/BV1L2421N7jQ/?spm_id_from=333.337.search-card.all.click&vd_source=3ca0ef7e7d00a2f1b8033084a87a3a84

解:shape(batch,序列长度,特征维度)===》(一个batch有几个句子,一个句子有几个单词,每个单词的特征由几个维度表示),也就是有几个单词那么就要计算几个均值和方差。

batch normalization

多应用于图像处理。

https://www.bilibili.com/video/BV1qdWUzkEad?spm_id_from=333.788.videopod.sections&vd_source=3ca0ef7e7d00a2f1b8033084a87a3a84

在一个batch中的多个样本做归一化,本质上就是对一个batch中多个图片的第i层通道一起做归一化计算,一层通道计算一次均值和方差。

例题:

https://www.bilibili.com/video/BV1L2421N7jQ/?spm_id_from=333.337.search-card.all.click&vd_source=3ca0ef7e7d00a2f1b8033084a87a3a84

解:shape(batch,通道数,高度,宽度),每个样本对应的通道一起做归一化,那么也就是有多少层就要计算多少个均值和方差。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/9 0:08:31

reMarkable平板终极管理指南:6款GUI客户端帮你解锁完整生产力

还在为reMarkable平板的文件同步发愁?云服务延迟、USB操作繁琐,这些问题困扰着无数用户。今天为你带来6款跨平台GUI客户端的完整评测,帮你彻底告别管理烦恼,让数字墨水体验真正流畅起来! 【免费下载链接】awesome-reMa…

作者头像 李华
网站建设 2026/2/10 10:20:59

5G赋能全域连接:企业终端管理何以应对“失控”危机?

当5G网络如高速动脉般铺展,海量智能终端正以前所未有的速度涌入企业——从智能手机、平板到物联网设备,从远程办公笔记本电脑到生产线上的专用终端。设备数量激增、类型繁杂、接入场景多元化,传统的终端管理方式正面临严峻挑战:安…

作者头像 李华
网站建设 2026/2/9 9:35:28

Phi-2模型:5个实用技巧让你快速上手AI文本生成

Phi-2模型:5个实用技巧让你快速上手AI文本生成 【免费下载链接】phi-2 项目地址: https://ai.gitcode.com/hf_mirrors/ai-gitcode/phi-2 想要快速掌握Phi-2模型的使用方法吗?🤔 这篇实用指南将带你从零开始,用最简单的方式…

作者头像 李华
网站建设 2026/2/7 0:23:16

【Java毕设源码分享】基于springboot+vue的互联网智慧医院体检平台的设计与实现(程序+文档+代码讲解+一条龙定制)

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华
网站建设 2026/2/7 2:43:10

Windows文件rmclient.dll丢失或损坏问题 下载修复

在使用电脑系统时经常会出现丢失找不到某些文件的情况,由于很多常用软件都是采用 Microsoft Visual Studio 编写的,所以这类软件的运行需要依赖微软Visual C运行库,比如像 QQ、迅雷、Adobe 软件等等,如果没有安装VC运行库或者安装…

作者头像 李华
网站建设 2026/2/8 9:37:44

Spring AOP表达式速查手册

📍 切入点表达式常见形式速查手册🎯 execution(最常用) 语法模板 execution(修饰符? 返回类型 包名.类名.方法名(参数) 异常?)可以使用通配符描述切入点 “ * ” :单个独立的任意符号,可以通配任意返回值…

作者头像 李华