【pytorch】transform的使用-育师

一、transforms的用法

transforms 是数据预处理与增强的核心工具，主要用于将原始图像转换为模型可接受的格式，并通过随机变换丰富数据集以提高模型泛化能力。
导入方式：

fromtorchvisionimporttransforms

主要用法，按顺序

transform_pipeline=transforms.Compose([transforms.Resize(256),# 调整图像大小至256x256（保持宽高比）transforms.CenterCrop(224),# 从中心裁剪224x224区域（常用预训练模型输入尺寸）transforms.RandomHorizontalFlip(p=0.5),# 以50%概率水平翻转（数据增强）transforms.ToTensor(),# 将PIL图像转换为Tensor（像素值缩放至[0,1]）transforms.Normalize(# 标准化（使用ImageNet均值/方差）mean=[0.485,0.456,0.406],# RGB通道均值std=[0.229,0.224,0.225]# RGB通道标准差)])

二、transform的使用

将PIL图像转换成Tensor类型

fromPILimportImagefromtorchvisionimporttransforms img_path=r'data/train/ants_image/0013035.jpg'img=Image.open(img_path)tensor_trans=transforms.ToTensor()tensor_img=tensor_trans(img)print(tensor_img.shape)#CHW

通过tensor()类型的数据生成tensorboard图

fromPILimportImagefromtorch.utils.tensorboardimportSummaryWriterfromtorchvisionimporttransforms img_path=r'data/train/ants_image/0013035.jpg'img=Image.open(img_path)tensor_trans=transforms.ToTensor()tensor_img=tensor_trans(img)# print(tensor_img.shape) #CHWwriter=SummaryWriter('logs')writer.add_image('tensor_img',tensor_img,0)writer.close()

Normalize()归一化使用

fromPILimportImagefromtorch.utils.tensorboardimportSummaryWriterfromtorchvisionimporttransforms img_path=r'data/train/ants_image/0013035.jpg'img=Image.open(img_path)tensor_trans=transforms.ToTensor()tensor_img=tensor_trans(img)# print(tensor_img.shape) #CHWwriter=SummaryWriter('logs')norm_trans=transforms.Normalize([0.485,0.456,0.406],[0.5,0.5,0.5])norm_img=norm_trans(tensor_img)writer.add_image('tensor_img',tensor_img,0)writer.add_image('norm_img',norm_img,1)writer.close()

归一化后的图片和未归一化的图片

Resize()调整大小的使用

fromPILimportImagefromtorch.utils.tensorboardimportSummaryWriterfromtorchvisionimporttransforms img_path=r'data/train/ants_image/0013035.jpg'img=Image.open(img_path)tensor_trans=transforms.ToTensor()tensor_img=tensor_trans(img)# print(tensor_img.shape) #CHWwriter=SummaryWriter('logs')norm_trans=transforms.Normalize([0.485,0.456,0.406],[0.5,0.5,0.5])norm_img=norm_trans(tensor_img)# print(img.size)resize_trans=transforms.Resize((256,256))resize_img=resize_trans(tensor_img)writer.add_image('resize_img',resize_img,0)# print(resize_img.size)#Compose用法trans_resize_2=transforms.Compose([transforms.Resize((512)),transforms.ToTensor()])img_resize_2=trans_resize_2(img)writer.add_image('tensor_img',tensor_img,0)writer.add_image('norm_img',norm_img,1)writer.add_image('img_resize_2',img_resize_2,2)writer.close()

EmotiVoice支持语音情感风格迁移学习

EmotiVoice：让AI语音拥有情感与个性在虚拟助手机械地念出天气预报、游戏角色用千篇一律的语调说出台词时，我们是否曾期待过——机器的声音也能像真人一样，因喜悦而轻快，因悲伤而低沉？如今，这一设想正随着…

李华

定期第三方安全审计：EmotiVoice质量保证

定期第三方安全审计：EmotiVoice质量保证在虚拟助手越来越“会来事儿”、数字人开始讲冷笑话的今天，语音合成早已不是“把字念出来”那么简单。用户期待的是有情绪、有性格、甚至能共情的声音——一句话说得是惊喜还是嘲讽，语气差一点&#x…

李华

不同职业人群对EmotiVoice的应用需求分析

不同职业人群对EmotiVoice的应用需求分析在远程教学反复卡顿、游戏NPC对话机械重复、有声书录制耗时费力的今天，我们越来越意识到：语音交互不能只是“能听清”，更要“听得进”。真正打动人的声音，需要情绪的起伏、语气的变化和个…

李华

手机系统预装应用包彻底删除

本文以华为手机 HarmonyOS 为例。 HarmonyOS/EMUI 系统预装应用删除华为 HarmonyOS 与 EMUI 系统均为基于安卓底层架构的自主定制系统，二者运行逻辑与原生安卓保持一致。卸载系统预装应用需调用系统级操作权限，该权限通常被称为 ROOT。鉴于华为已关闭…

李华

EmotiVoice能否实现多人对话同步生成？技术可行性评估

EmotiVoice能否实现多人对话同步生成？技术可行性评估在虚拟角色日益“活”起来的今天，用户不再满足于听到一段机械朗读——他们希望看到两个AI角色展开一场有来有往、情绪起伏的真实对话。这种需求催生了一个关键问题：现有的开源语音合成模型…

李华

FusionCompute 8.0 实验环境搭建：完整资源获取与部署指南

FusionCompute 8.0 实验环境搭建：完整资源获取与部署指南【免费下载链接】FusionCompute8.0资源下载指南分享本仓库提供了一个详细的资源文件，内含百度网盘连接及提取码，以及详细的资源列表，方便您学习和使用FusionCompute 8.0。…

李华