如何保持人物一致性

在 AI 漫剧与视频创作的过程中，如何在不同的分镜、不同的场景下保持同一个角色外貌和服装的一致性，是一个非常核心且常见的挑战。本篇指南将为您详细介绍我们在系统中采用的“参考图”机制及其背后的原理。

为什么要保持一致性？

如果每个分镜都完全依赖文字提示词（Prompt）重新生成画面，AI 大模型每次都会“随机发挥”，导致同一个角色在上一秒和下一秒长得完全不一样（比如发型改变、衣服款式变化）。为了解决这个问题，我们需要在生成时给 AI 提供明确的视觉锚点（参考图）。

核心操作步骤：分镜图创作与视频生成

在分镜制作页面中，保持角色一致性的标准操作流程如下：

第一步：分镜图创作（角色与场景的融合）

在分镜编辑区切换到 「分镜图创作」 Tab，添加角色/场景参考图并生成静态分镜图（原「融图」流程）。首先，我们需要把单独生成的角色人物融合到对应的场景环境里，生成一张静态的单张画面。这张图片既包含了正确的场景背景，又包含了准确的角色形象。

第二步：使用分镜图作为视频生成的参考图

在 「视频创作」 Tab 中选择 参考生视频 / 图生视频，将第一步选用的分镜图作为主要参考图 提交给 AI 模型。

原理解析

因为这张分镜图里已经包含了您确认过的场景与角色，当它作为参考图传递给 AI 视频大模型时，它会在生成过程中获得极高的权重。AI 会严格按照这张图片的基础画面去推演运动轨迹，从而保证最终生成的视频与您设计的角色和场景高度一致。

进阶技巧：添加角色多视角参考图

除了上面提到的分镜图之外，为了让 AI 更全面地理解角色的立体特征（特别是当角色在视频中需要转身或有大幅度动作时），您还可以增加当前角色的多视角设计图作为辅助参考图片。

⚠️ 重要注意事项：控制参考图数量

在添加参考图时，切忌贪多！强烈建议总参考图数量不超过 3 张。

原理说明：参考图并不是越多越好。当您输入过多的参考图片时，AI 模型的注意力会被分散，单张图片的权重会被稀释。这会导致模型“不知道你的重点是什么”，最终不仅无法保持一致性，反而会生成结构混乱、不符合预期的视频画面。

最佳实践：1 张主分镜图 + 1~2 张最核心的角色多视角参考图。

通过合理地使用分镜图并控制参考图的数量，您就能在整部漫剧中保持角色形象的高度统一。

为什么要保持一致性？​

核心操作步骤：分镜图创作与视频生成​

第一步：分镜图创作（角色与场景的融合）​

第二步：使用分镜图作为视频生成的参考图​

原理解析​

进阶技巧：添加角色多视角参考图​