news 2026/6/23 19:21:25

【pytorch】transform的使用

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【pytorch】transform的使用

一、transforms的用法

transforms​ 是数据预处理与增强的核心工具,主要用于将原始图像转换为模型可接受的格式,并通过随机变换丰富数据集以提高模型泛化能力。
导入方式:

fromtorchvisionimporttransforms

主要用法,按顺序

transform_pipeline=transforms.Compose([transforms.Resize(256),# 调整图像大小至256x256(保持宽高比)transforms.CenterCrop(224),# 从中心裁剪224x224区域(常用预训练模型输入尺寸)transforms.RandomHorizontalFlip(p=0.5),# 以50%概率水平翻转(数据增强)transforms.ToTensor(),# 将PIL图像转换为Tensor(像素值缩放至[0,1])transforms.Normalize(# 标准化(使用ImageNet均值/方差)mean=[0.485,0.456,0.406],# RGB通道均值std=[0.229,0.224,0.225]# RGB通道标准差)])

二、transform的使用

将PIL图像转换成Tensor类型

fromPILimportImagefromtorchvisionimporttransforms img_path=r'data/train/ants_image/0013035.jpg'img=Image.open(img_path)tensor_trans=transforms.ToTensor()tensor_img=tensor_trans(img)print(tensor_img.shape)#CHW


通过tensor()类型的数据生成tensorboard图

fromPILimportImagefromtorch.utils.tensorboardimportSummaryWriterfromtorchvisionimporttransforms img_path=r'data/train/ants_image/0013035.jpg'img=Image.open(img_path)tensor_trans=transforms.ToTensor()tensor_img=tensor_trans(img)# print(tensor_img.shape) #CHWwriter=SummaryWriter('logs')writer.add_image('tensor_img',tensor_img,0)writer.close()


Normalize()归一化使用

fromPILimportImagefromtorch.utils.tensorboardimportSummaryWriterfromtorchvisionimporttransforms img_path=r'data/train/ants_image/0013035.jpg'img=Image.open(img_path)tensor_trans=transforms.ToTensor()tensor_img=tensor_trans(img)# print(tensor_img.shape) #CHWwriter=SummaryWriter('logs')norm_trans=transforms.Normalize([0.485,0.456,0.406],[0.5,0.5,0.5])norm_img=norm_trans(tensor_img)writer.add_image('tensor_img',tensor_img,0)writer.add_image('norm_img',norm_img,1)writer.close()

归一化后的图片和未归一化的图片

Resize()调整大小的使用

fromPILimportImagefromtorch.utils.tensorboardimportSummaryWriterfromtorchvisionimporttransforms img_path=r'data/train/ants_image/0013035.jpg'img=Image.open(img_path)tensor_trans=transforms.ToTensor()tensor_img=tensor_trans(img)# print(tensor_img.shape) #CHWwriter=SummaryWriter('logs')norm_trans=transforms.Normalize([0.485,0.456,0.406],[0.5,0.5,0.5])norm_img=norm_trans(tensor_img)# print(img.size)resize_trans=transforms.Resize((256,256))resize_img=resize_trans(tensor_img)writer.add_image('resize_img',resize_img,0)# print(resize_img.size)#Compose用法trans_resize_2=transforms.Compose([transforms.Resize((512)),transforms.ToTensor()])img_resize_2=trans_resize_2(img)writer.add_image('tensor_img',tensor_img,0)writer.add_image('norm_img',norm_img,1)writer.add_image('img_resize_2',img_resize_2,2)writer.close()

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/23 17:57:30

EmotiVoice支持语音情感风格迁移学习

EmotiVoice:让AI语音拥有情感与个性 在虚拟助手机械地念出天气预报、游戏角色用千篇一律的语调说出台词时,我们是否曾期待过——机器的声音也能像真人一样,因喜悦而轻快,因悲伤而低沉?如今,这一设想正随着…

作者头像 李华
网站建设 2026/6/23 17:30:56

定期第三方安全审计:EmotiVoice质量保证

定期第三方安全审计:EmotiVoice质量保证 在虚拟助手越来越“会来事儿”、数字人开始讲冷笑话的今天,语音合成早已不是“把字念出来”那么简单。用户期待的是有情绪、有性格、甚至能共情的声音——一句话说得是惊喜还是嘲讽,语气差一点&#x…

作者头像 李华
网站建设 2026/6/23 18:11:39

不同职业人群对EmotiVoice的应用需求分析

不同职业人群对EmotiVoice的应用需求分析 在远程教学反复卡顿、游戏NPC对话机械重复、有声书录制耗时费力的今天,我们越来越意识到:语音交互不能只是“能听清”,更要“听得进”。真正打动人的声音,需要情绪的起伏、语气的变化和个…

作者头像 李华
网站建设 2026/6/23 18:12:28

手机系统预装应用包彻底删除

本文以华为手机 HarmonyOS 为例。 HarmonyOS/EMUI 系统预装应用删除 华为 HarmonyOS 与 EMUI 系统均为基于安卓底层架构的自主定制系统,二者运行逻辑与原生安卓保持一致。卸载系统预装应用需调用系统级操作权限,该权限通常被称为 ROOT。 鉴于华为已关闭…

作者头像 李华
网站建设 2026/6/23 12:36:21

EmotiVoice能否实现多人对话同步生成?技术可行性评估

EmotiVoice能否实现多人对话同步生成?技术可行性评估 在虚拟角色日益“活”起来的今天,用户不再满足于听到一段机械朗读——他们希望看到两个AI角色展开一场有来有往、情绪起伏的真实对话。这种需求催生了一个关键问题:现有的开源语音合成模型…

作者头像 李华
网站建设 2026/6/23 5:58:26

FusionCompute 8.0 实验环境搭建:完整资源获取与部署指南

FusionCompute 8.0 实验环境搭建:完整资源获取与部署指南 【免费下载链接】FusionCompute8.0资源下载指南分享 本仓库提供了一个详细的资源文件,内含百度网盘连接及提取码,以及详细的资源列表,方便您学习和使用FusionCompute 8.0。…

作者头像 李华