一、衣服为什么会反复变?
核心原因是:
脸部有强身份特征,模型更容易锚定;衣服是“可变附属物”,模型在动作、镜头、遮挡、时序变化中会自动重解释。
尤其是这些情况最容易飘:
镜头切换多
- 正面 → 背面 → 远景 → 特写
- 模型每次都可能重新生成服装细节
人物动作大
- 奔跑、转身、摔倒、打斗
- 衣服被身体姿态带偏
服装描述不够结构化
- “破衣烂衫”太泛
- 模型可能理解成:破外套 / 破T恤 / 破夹克 / 破盔甲 / 不同颜色的破衣服
没有专门的服装参考图
- 只靠主角脸参考,不等于衣服被锁住
视频模型天生倾向“稳定主体”,但不保证“稳定服装细节”
- 脸可以稳住
- 衣服颜色、破损位置、层数、配饰、脏污程度容易变