PS技巧：LoRA训练数据集的图像预处理方法-育师

PS技巧：LoRA训练数据集的图像预处理方法

如果你正在尝试训练自己的LoRA模型，可能会发现一个现象：同样的训练脚本，别人生成的模型效果惊艳，而你的却总是差那么点意思。很多时候，问题并不出在训练参数上，而是源头——你的训练图片没准备好。

想象一下，你收集了20张心仪的图片，打算训练一个专属的二次元角色风格LoRA。这些图片有的来自不同画师，尺寸五花八门，有的带着大大的水印，有的背景杂乱，有的甚至分辨率低到看不清细节。把这些图片直接丢给训练脚本，就像让一位大厨用一堆不新鲜、大小不一的食材去做一道招牌菜，结果可想而知。

高质量的LoRA模型，始于高质量的预处理。今天，我们就来聊聊如何用Photoshop（PS）这个“老伙计”，系统化地批量处理你的训练图片，让每一张素材都达到“训练级”标准。整个过程，我们会聚焦三个核心目标：统一尺寸、去除干扰、增强细节。

1. 为什么预处理如此重要？

在深入具体操作前，我们有必要先理解，为什么对训练图片“动刀”是必不可少的一步。

稳定扩散（Stable Diffusion）这类模型在训练时，会努力从你提供的图片中学习模式和特征。如果图片尺寸不一，模型就需要额外处理分辨率对齐的问题，这可能会分散其学习核心特征（如画风、人物脸部特征、物体结构）的注意力。不一致的尺寸还可能导致训练过程不稳定。

水印、杂乱背景、无关文字这些都是明确的“噪声”。模型会诚实地学习它所看到的一切，包括你不想要的那些部分。一个带着某网站Logo训练出来的角色LoRA，在生成时很可能也会在奇怪的地方冒出类似的图案或纹理。

模糊、低对比度的图片则无法提供清晰的细节供模型学习。模型学到的将是模糊的轮廓和浑浊的色彩，最终生成的图片自然也难以清晰、生动。

简单来说，预处理的目的，是让模型的学习目标变得纯粹而清晰。我们通过人工干预，剔除干扰项，强化核心特征，相当于为模型铺平了学习的道路。接下来，我们就看看PS如何高效地完成这项任务。

2. 核心预处理流程与PS手动操作

我们先从单张图片的处理讲起，理解每个步骤的目的。假设我们有一张需要处理的角色图片。

2.1 统一尺寸与构图：裁剪与缩放

LoRA训练通常推荐使用正方形图片，常见的尺寸如512x512、768x768或1024x1024。统一尺寸不仅便于训练，也确保了模型学习特征的尺度一致性。

操作思路：

分析主体：打开图片，观察画面的核心主体（如人物脸部、全身像、特定物体）。思考如何裁剪能最好地突出主体，并保持构图美观。
使用裁剪工具（C）：在PS顶部的选项栏中，将裁剪比例设置为“1:1（方形）”。然后拖动裁剪框，确保核心主体位于画面视觉中心。对于人物肖像，通常确保头部和肩部在画面中有良好的占比。
图像大小调整：裁剪后，点击菜单栏的图像 -> 图像大小。确保“约束长宽比”链子图标是断开状态（因为我们已经是正方形）。将宽度和高度设置为你的目标尺寸（例如768像素）。分辨率保持72像素/英寸即可。插值算法选择“自动”（PS会自动选择最合适的）或“保留细节（扩大）”对于放大图片稍好。

要点：裁剪是关键，它决定了模型主要学习画面的哪一部分。尽量保证所有图片的主体在画面中的相对大小和位置接近。

2.2 去除水印与瑕疵：内容识别与修复

这是预处理中最需要耐心和技巧的环节，目标是让图片看起来“天生干净”。

常用工具组合：

污点修复画笔工具（J）：对付小面积的水印、痘痘、杂物非常快捷。只需在水印上涂抹，PS会自动采样周围像素进行覆盖。
修补工具（J）：对于面积稍大的水印，用修补工具圈选，然后拖动到附近干净的背景区域，融合效果通常更自然。
内容识别填充（Shift+F5）：这是对付复杂背景上水印的利器。用套索工具（L）大致选中水印区域，然后按Shift+F5，在弹出的对话框中选择“内容识别”，点击确定。PS会智能地根据周围环境生成填充内容。
仿制图章工具（S）：终极武器，用于处理前几种工具效果不理想的情况，或者修复非常复杂的区域。按住Alt键在干净区域取样，然后在需要修复的地方涂抹。

技巧：处理水印时，可以适当放大视图（200%-300%），仔细处理边缘，让修复区域与周围环境自然过渡，避免留下明显的修补痕迹。

2.3 增强细节与画质：基础调整

对于有些年代久远或本身质量不高的图片，我们可以进行适度的画质增强。

非破坏性调整建议（使用调整图层）：

色阶/曲线：点击图层面板下方的“创建新的填充或调整图层”图标，选择“色阶”或“曲线”。轻微拖动滑块，增加画面对比度，让暗部更实，亮部更通透，可以立刻让图片显得更“精神”。
锐化：在完成所有修改后，合并可见图层（或盖印图层 Ctrl+Alt+Shift+E），然后选择滤镜 -> 锐化 -> USM锐化。数量、半径、阈值这三个参数需要谨慎调整。一个温和的起点是：数量80%，半径1.0像素，阈值2色阶。预览效果，以不产生明显的白边（光晕）为宜。
轻微降噪：如果图片有较多噪点（尤其是从视频截图中来的），可以使用滤镜 -> 杂色 -> 减少杂色。同样，参数宜小不宜大，目的是平滑噪点，而不是抹掉所有细节。

重要原则：所有调整都应遵循“适度”原则。我们的目标是还原或优化图片应有的样子，而不是进行艺术再创作。过度调整（如过度锐化、饱和度过高）会引入新的伪影，干扰模型学习。

手动处理一张两张图片没问题，但如果你的训练集有20、30甚至更多图片时，重复劳动就变得令人望而生畏。这时，PS的“动作”和“批处理”功能就该登场了。

3. 效率倍增：录制PS动作实现自动化

PS的“动作”功能可以记录你的操作步骤，然后一键应用到其他图片上。对于有固定流程的预处理，这是节省时间的法宝。

3.1 创建并录制一个新动作

打开一张具有代表性的待处理图片。这张图片应该包含你后续会遇到的大部分典型问题（比如既有水印又需要裁剪）。
打开“动作”面板（窗口 -> 动作）。
点击面板底部的“创建新组”文件夹图标，命名为“LoRA预处理”。然后点击“创建新动作”图标，命名为“统一裁剪与增强”，点击“记录”。此时，PS开始记录你的每一步操作。
谨慎执行你的预处理流程：例如，按顺序进行：裁剪为1:1 -> 调整图像大小到768x768 -> 使用内容识别填充去除右下角水印 -> 添加色阶调整图层微调对比度 -> 合并图层 -> USM锐化。
所有步骤完成后，点击动作面板底部的“停止播放/记录”按钮（方形）。你的动作就录制好了。

录制技巧：

尽量使用菜单命令或快捷键，避免使用需要手工精确点击的工具（如画笔），除非你能保证每次点击位置都一样（这很难）。
对于像裁剪这样的操作，你可以在第一张图片上设定好裁剪区域并确认。录制动作时，PS会记住这个具体的裁剪坐标和尺寸。这意味着所有图片都会按照完全相同的区域进行裁剪。因此，你的第一张（录制用的）图片构图必须具有通用性，或者你打算将所有图片统一裁剪成特写。
更灵活的做法是：将“裁剪”步骤从批量动作中移除，手动为每张图片进行个性化裁剪，然后对裁剪后的图片运行其他自动化步骤（如缩放、锐化）。

3.2 针对可变步骤的灵活策略

你可能会问：每张图片水印位置都不一样，怎么用动作批量处理？这里需要一点策略。

方案A：两步走

创建一个只包含固定步骤的动作，比如“缩放至768px -> 自动色调 -> 高反差保留锐化”。这个动作可以安全地批量运行。
手动处理可变步骤，如裁剪和去水印。虽然仍需手动，但至少固定步骤自动化了。

方案B：利用批处理中的“覆盖动作命令”在下一节将要讲到的“批处理”对话框中，有一个“覆盖动作中的‘打开’命令”的选项。更关键的是，你可以暂停动作以执行手动操作。

在录制动作时，在需要手动操作（如去水印）的位置，点击动作面板菜单，选择“插入停止”。
在弹出的对话框中输入提示信息，如“请手动去除水印，完成后点击‘继续播放动作’”。
这样，在批处理时，动作执行到这一步会暂停，弹出对话框，等你手动处理完当前图片后，点击“继续”，动作才会完成剩余步骤并处理下一张。这适用于图片数量不多，但每张都需要精细手动干预的情况。

4. 终极自动化：使用“批处理”脚本处理整个文件夹

当你有了一个录制好的动作，就可以让PS自动处理一个文件夹里的所有图片了。

将需要处理的所有原始图片放入一个文件夹，例如“原始图片”。
新建一个空文件夹，用于存放处理后的图片，例如“已处理图片”。
在PS中，点击菜单栏的文件 -> 自动 -> 批处理。
在弹出的“批处理”对话框中设置：
- 播放：组选择“LoRA预处理”，动作选择你录制好的“统一裁剪与增强”。
- 源：选择“文件夹”，然后点击“选择”按钮，找到你的“原始图片”文件夹。
- 目标：选择“文件夹”，然后点击“选择”按钮，找到你的“已处理图片”文件夹。
- 文件命名：可以设置一个命名规则，例如“模型名_##”（##会自动编号），这样输出文件就会是“mymodel_01.jpg”，“mymodel_02.jpg”……
点击“确定”，PS就会开始自动打开、处理、保存并关闭每一张图片。泡杯咖啡，回来就能看到一整文件夹处理好的素材。