news 2026/6/23 19:50:57

pytorch框架训练、推理、模块冻结等各种细节说明

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
pytorch框架训练、推理、模块冻结等各种细节说明

1.张量的requires_grad属性

importtorch x=torch.randn(3,3,requires_grad=False)y=x*2# y = 2xy.requires_grad=Truez=y.mean()# z=(1/9)*(2x),微分是dz/dx = 2/9# z=(1/9)*y,微分是dz/dy = 1/9z.backward()print(x,x.requires_grad)print(y,y.requires_grad,y.grad)print(z.requires_grad)

注意,python中万物都是对象(object),因此基本上都会有一些属性,类比C++中类和对象的关系。张量也是一种对象。

这里对张量的核心属性requires_grad功能进行演示。例子中,x不需要梯度,因此计算得到的y也是不需要梯度的张量,我们可以手动设置y需要梯度,因此影响到z,z变为需要梯度的。

运行结果:

tensor([[-0.2486,1.0678,0.6611],[0.3205, -0.4081, -0.5011],[-1.1482,1.5839, -0.3978]])False tensor([[-0.4972,2.1357,1.3223],[0.6411, -0.8162, -1.0023],[-2.2964,3.1677, -0.7956]],requires_grad=True)True tensor([[0.1111,0.1111,0.1111],[0.1111,0.1111,0.1111],[0.1111,0.1111,0.1111]])True

2.model.train()和model.eval()对模型的行为影响

先搭建一个简单模型

importtorchimporttorch.nnasnn torch.random.manual_seed(42)classSimpleModel(nn.Module):def__init__(self):super(SimpleModel,self).__init__()self.fc=nn.Linear(10,2)# 一个简单的线性层self.bn=nn.BatchNorm1d(2)# 批量标准化self.dropout=nn.Dropout(0.5)# Dropout层,50%的丢弃概率defforward(self,x):x=self.fc(x)# 通过全连接层x=self.bn(x)# 进行批量标准化x=self.dropout(x)# 应用Dropoutreturnx# 创建模型model=SimpleModel()

2.1 获取模型的全部参数

使用方法state_dict()

print(model.state_dict())

返回一个字典

OrderedDict([('fc.weight', tensor([[-0.0290, -0.2516, -0.3142, -0.2079,0.2460, -0.1968, -0.1554, -0.2758,0.2958,0.3105],[0.2236, -0.0511,0.2169,0.2815,0.1189, -0.2317,0.1405,0.2883,0.2088, -0.2837]
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/23 19:46:57

Java毕设项目推荐-基于Java语言的茶叶销售系统的前端设计与实现基于SpringBoot+Vue茶叶销售系统的设计与实现【附源码+文档,调试定制服务】

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华
网站建设 2026/6/23 13:04:34

大数据生态核心组件语法与原理详解

Wan2.2-T2V-5B 轻量级文本生成视频模型深度解析 在短视频内容爆发式增长的今天,从广告创意到社交平台运营,对高效、低成本动态内容生产的需求前所未有地强烈。传统视频制作流程耗时耗力,而AIGC技术的崛起正在重塑这一领域。其中,W…

作者头像 李华
网站建设 2026/6/19 21:22:04

UVa 11617 An Odd Love

题目描述 春天到了,我们的朋友佩皮托(Pepito\texttt{Pepito}Pepito) 坠入了爱河。但他不确定她是否也爱他,于是他决定询问雏菊。他摘下一朵雏菊,交替说着“她爱我”和“她不爱我”,每说一句话就摘下一片花…

作者头像 李华
网站建设 2026/6/22 17:45:01

LobeChat能否对接Slack?团队协作平台集成方案

LobeChat 与 Slack 集成:构建团队智能协作中枢 在现代企业中,沟通工具早已不只是“聊天软件”——它们是信息流转的核心枢纽。Slack 每天承载着成千上万条项目讨论、任务分配和决策记录,而这些数据如果能被 AI 实时理解并参与其中&#xff0c…

作者头像 李华
网站建设 2026/6/15 19:18:50

集团宽带是什么意思?企业如何选择合适的宽带方案?

在当今这个信息爆炸的时代,企业对于网络的需求日益增长。而提到“集团宽带”,不少企业管理者或许会感到困惑:这到底是个什么概念?简单来说,集团宽带是指为满足大型企业或集团内部多个办公地点之间高效互联需求而设计的一种宽带服…

作者头像 李华
网站建设 2026/6/22 13:17:20

运维外包的公司靠谱吗?企业真能省心?

你有没有经历过这样的早晨:全员刚开工,邮件系统突然卡死,视频会议连不上,前台智能屏黑着,IT小哥满头大汗却查不出根源?这时候,一个念头冒出来:要不要把运维外包出去?这不是个别现象。如今写字…

作者头像 李华