如何保持人物一致性
在 AI 漫剧与视频创作的过程中,如何在不同的分镜、不同的场景下保持同一个角色外貌和服装的一致性,是一个非常核心且常见的挑战。本篇指南将为您详细介绍我们在系统中采用的“参考图”机制及其背后的原理。
为什么要保持一致性?
如果每个分镜都完全依赖文字提示词(Prompt)重新生成画面,AI 大模型每次都会“随机发挥”,导致同一个角色在上一秒和下一秒长得完全不一样(比如发型改变、衣服款式变化)。为了解决这个问题,我们需要在生成时给 AI 提供明确的视觉锚点(参考图)。
核心操作步骤:分镜图创作与视频生成
在分镜制作页面中,保持角色一致性的标准操作流程如下:
第一步:分镜图创作(角色与场景的融合)
在分镜编辑区切换到 「分镜图创作」 Tab,添加角色/场景参考图并生成静态分镜图(原「融图」流程)。 首先,我们需要把单独生成的角色人物融合到对应的场景环境里,生成一张静态的单张画面。这张图片既包含了正确的场景背景,又包含了准确的角色形象。
第二步:使用分镜图作为视频生成的参考图
在 「视频创作」 Tab 中选择 参考生视频 / 图生视频,将第一步选用的分镜图作为主要参考图 提交给 AI 模型。
原理解析
因为这张分镜图里已经包含了您确认过的场景与角色,当它作为参考图传递给 AI 视频大模型时,它会在生成过程中获得极高的权重。AI 会严格按照这张图片的基础画面去推演运动轨迹,从而保证最终生成的视频与您设计的角色和场景高度一致。
进阶技巧:添加角色多视角参考图
除了上面提到的分镜图之外,为了让 AI 更全面地理解角色的立体特征(特别是当角色在视频中需要转身或有大幅度动作时),您还可以增加当前角色的多视角设计图作为辅助参考图片。
⚠️ 重要注意事项:控制参考图数量
在添加参考图时,切忌贪多!强烈建议总参考图数量不超过 3 张。
- 原理说明:参考图并不是越多越好。当您输入过多的参考图片时,AI 模型的注意力会被分散,单张图片的权重会被稀释。这会导致模型“不知道你的重点是什么”,最终不仅无法保持一致性,反而会生成结构混乱、不符合预期的视频画面。
- 最佳实践:1 张主分镜图 + 1~2 张最核心的角色多视角参考图。
通过合理地使用分镜图并控制参考图的数量,您就能在整部漫剧中保持角色形象的高度统一。