PS技巧:LoRA训练数据集的图像预处理方法
如果你正在尝试训练自己的LoRA模型,可能会发现一个现象:同样的训练脚本,别人生成的模型效果惊艳,而你的却总是差那么点意思。很多时候,问题并不出在训练参数上,而是源头——你的训练图片没准备好。
想象一下,你收集了20张心仪的图片,打算训练一个专属的二次元角色风格LoRA。这些图片有的来自不同画师,尺寸五花八门,有的带着大大的水印,有的背景杂乱,有的甚至分辨率低到看不清细节。把这些图片直接丢给训练脚本,就像让一位大厨用一堆不新鲜、大小不一的食材去做一道招牌菜,结果可想而知。
高质量的LoRA模型,始于高质量的预处理。今天,我们就来聊聊如何用Photoshop(PS)这个“老伙计”,系统化地批量处理你的训练图片,让每一张素材都达到“训练级”标准。整个过程,我们会聚焦三个核心目标:统一尺寸、去除干扰、增强细节。
1. 为什么预处理如此重要?
在深入具体操作前,我们有必要先理解,为什么对训练图片“动刀”是必不可少的一步。
稳定扩散(Stable Diffusion)这类模型在训练时,会努力从你提供的图片中学习模式和特征。如果图片尺寸不一,模型就需要额外处理分辨率对齐的问题,这可能会分散其学习核心特征(如画风、人物脸部特征、物体结构)的注意力。不一致的尺寸还可能导致训练过程不稳定。
水印、杂乱背景、无关文字这些都是明确的“噪声”。模型会诚实地学习它所看到的一切,包括你不想要的那些部分。一个带着某网站Logo训练出来的角色LoRA,在生成时很可能也会在奇怪的地方冒出类似的图案或纹理。
模糊、低对比度的图片则无法提供清晰的细节供模型学习。模型学到的将是模糊的轮廓和浑浊的色彩,最终生成的图片自然也难以清晰、生动。
简单来说,预处理的目的,是让模型的学习目标变得纯粹而清晰。我们通过人工干预,剔除干扰项,强化核心特征,相当于为模型铺平了学习的道路。接下来,我们就看看PS如何高效地完成这项任务。
2. 核心预处理流程与PS手动操作
我们先从单张图片的处理讲起,理解每个步骤的目的。假设我们有一张需要处理的角色图片。
2.1 统一尺寸与构图:裁剪与缩放
LoRA训练通常推荐使用正方形图片,常见的尺寸如512x512、768x768或1024x1024。统一尺寸不仅便于训练,也确保了模型学习特征的尺度一致性。
操作思路:
- 分析主体:打开图片,观察画面的核心主体(如人物脸部、全身像、特定物体)。思考如何裁剪能最好地突出主体,并保持构图美观。
- 使用裁剪工具(C):在PS顶部的选项栏中,将裁剪比例设置为“1:1(方形)”。然后拖动裁剪框,确保核心主体位于画面视觉中心。对于人物肖像,通常确保头部和肩部在画面中有良好的占比。
- 图像大小调整:裁剪后,点击菜单栏的图像 -> 图像大小。确保“约束长宽比”链子图标是断开状态(因为我们已经是正方形)。将宽度和高度设置为你的目标尺寸(例如768像素)。分辨率保持72像素/英寸即可。插值算法选择“自动”(PS会自动选择最合适的)或“保留细节(扩大)”对于放大图片稍好。
要点:裁剪是关键,它决定了模型主要学习画面的哪一部分。尽量保证所有图片的主体在画面中的相对大小和位置接近。
2.2 去除水印与瑕疵:内容识别与修复
这是预处理中最需要耐心和技巧的环节,目标是让图片看起来“天生干净”。
常用工具组合:
- 污点修复画笔工具(J):对付小面积的水印、痘痘、杂物非常快捷。只需在水印上涂抹,PS会自动采样周围像素进行覆盖。
- 修补工具(J):对于面积稍大的水印,用修补工具圈选,然后拖动到附近干净的背景区域,融合效果通常更自然。
- 内容识别填充(Shift+F5):这是对付复杂背景上水印的利器。用套索工具(L)大致选中水印区域,然后按Shift+F5,在弹出的对话框中选择“内容识别”,点击确定。PS会智能地根据周围环境生成填充内容。
- 仿制图章工具(S):终极武器,用于处理前几种工具效果不理想的情况,或者修复非常复杂的区域。按住Alt键在干净区域取样,然后在需要修复的地方涂抹。
技巧:处理水印时,可以适当放大视图(200%-300%),仔细处理边缘,让修复区域与周围环境自然过渡,避免留下明显的修补痕迹。
2.3 增强细节与画质:基础调整
对于有些年代久远或本身质量不高的图片,我们可以进行适度的画质增强。
非破坏性调整建议(使用调整图层):
- 色阶/曲线:点击图层面板下方的“创建新的填充或调整图层”图标,选择“色阶”或“曲线”。轻微拖动滑块,增加画面对比度,让暗部更实,亮部更通透,可以立刻让图片显得更“精神”。
- 锐化:在完成所有修改后,合并可见图层(或盖印图层 Ctrl+Alt+Shift+E),然后选择滤镜 -> 锐化 -> USM锐化。数量、半径、阈值这三个参数需要谨慎调整。一个温和的起点是:数量80%,半径1.0像素,阈值2色阶。预览效果,以不产生明显的白边(光晕)为宜。
- 轻微降噪:如果图片有较多噪点(尤其是从视频截图中来的),可以使用滤镜 -> 杂色 -> 减少杂色。同样,参数宜小不宜大,目的是平滑噪点,而不是抹掉所有细节。
重要原则:所有调整都应遵循“适度”原则。我们的目标是还原或优化图片应有的样子,而不是进行艺术再创作。过度调整(如过度锐化、饱和度过高)会引入新的伪影,干扰模型学习。
手动处理一张两张图片没问题,但如果你的训练集有20、30甚至更多图片时,重复劳动就变得令人望而生畏。这时,PS的“动作”和“批处理”功能就该登场了。
3. 效率倍增:录制PS动作实现自动化
PS的“动作”功能可以记录你的操作步骤,然后一键应用到其他图片上。对于有固定流程的预处理,这是节省时间的法宝。
3.1 创建并录制一个新动作
- 打开一张具有代表性的待处理图片。这张图片应该包含你后续会遇到的大部分典型问题(比如既有水印又需要裁剪)。
- 打开“动作”面板(窗口 -> 动作)。
- 点击面板底部的“创建新组”文件夹图标,命名为“LoRA预处理”。然后点击“创建新动作”图标,命名为“统一裁剪与增强”,点击“记录”。此时,PS开始记录你的每一步操作。
- 谨慎执行你的预处理流程:例如,按顺序进行:裁剪为1:1 -> 调整图像大小到768x768 -> 使用内容识别填充去除右下角水印 -> 添加色阶调整图层微调对比度 -> 合并图层 -> USM锐化。
- 所有步骤完成后,点击动作面板底部的“停止播放/记录”按钮(方形)。你的动作就录制好了。
录制技巧:
- 尽量使用菜单命令或快捷键,避免使用需要手工精确点击的工具(如画笔),除非你能保证每次点击位置都一样(这很难)。
- 对于像裁剪这样的操作,你可以在第一张图片上设定好裁剪区域并确认。录制动作时,PS会记住这个具体的裁剪坐标和尺寸。这意味着所有图片都会按照完全相同的区域进行裁剪。因此,你的第一张(录制用的)图片构图必须具有通用性,或者你打算将所有图片统一裁剪成特写。
- 更灵活的做法是:将“裁剪”步骤从批量动作中移除,手动为每张图片进行个性化裁剪,然后对裁剪后的图片运行其他自动化步骤(如缩放、锐化)。
3.2 针对可变步骤的灵活策略
你可能会问:每张图片水印位置都不一样,怎么用动作批量处理?这里需要一点策略。
方案A:两步走
- 创建一个只包含固定步骤的动作,比如“缩放至768px -> 自动色调 -> 高反差保留锐化”。这个动作可以安全地批量运行。
- 手动处理可变步骤,如裁剪和去水印。虽然仍需手动,但至少固定步骤自动化了。
方案B:利用批处理中的“覆盖动作命令”在下一节将要讲到的“批处理”对话框中,有一个“覆盖动作中的‘打开’命令”的选项。更关键的是,你可以暂停动作以执行手动操作。
- 在录制动作时,在需要手动操作(如去水印)的位置,点击动作面板菜单,选择“插入停止”。
- 在弹出的对话框中输入提示信息,如“请手动去除水印,完成后点击‘继续播放动作’”。
- 这样,在批处理时,动作执行到这一步会暂停,弹出对话框,等你手动处理完当前图片后,点击“继续”,动作才会完成剩余步骤并处理下一张。这适用于图片数量不多,但每张都需要精细手动干预的情况。
4. 终极自动化:使用“批处理”脚本处理整个文件夹
当你有了一个录制好的动作,就可以让PS自动处理一个文件夹里的所有图片了。
- 将需要处理的所有原始图片放入一个文件夹,例如“原始图片”。
- 新建一个空文件夹,用于存放处理后的图片,例如“已处理图片”。
- 在PS中,点击菜单栏的文件 -> 自动 -> 批处理。
- 在弹出的“批处理”对话框中设置:
- 播放:组选择“LoRA预处理”,动作选择你录制好的“统一裁剪与增强”。
- 源:选择“文件夹”,然后点击“选择”按钮,找到你的“原始图片”文件夹。
- 目标:选择“文件夹”,然后点击“选择”按钮,找到你的“已处理图片”文件夹。
- 文件命名:可以设置一个命名规则,例如“模型名_##”(##会自动编号),这样输出文件就会是“mymodel_01.jpg”,“mymodel_02.jpg”……
- 点击“确定”,PS就会开始自动打开、处理、保存并关闭每一张图片。泡杯咖啡,回来就能看到一整文件夹处理好的素材。
5. 预处理后的检查与整理
批处理完成后,工作还没完全结束。你需要打开“已处理图片”文件夹,快速浏览每一张图片。
检查什么?
- 裁剪是否合理:有没有某张图片的主体被切掉了重要部分?
- 水印是否去除干净:有没有留下明显的修补痕迹?
- 画质是否一致:有没有某张图片因为过度处理而显得特别突兀(如颜色过艳、锐化过度)?
- 命名是否规范:是否按照你预想的规则命名,便于后续打标管理?
对于有问题的图片,进行单独微调或替换。最终,你应该得到一个图片尺寸统一、画面干净、画质优良、命名规范的训练集文件夹。这才是喂给LoRA训练脚本的“优质饲料”。
获取更多AI镜像
想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。