单一 prompt 出的奇幻角色图,看着帅,但完全没法用。能进提案、能进 TTRPG 设定集、能进游戏 pitch 的,是三件套:角色卡(四视图 + 特征表)、能撑场子的环境大场景、能跑能跳的动作变体。这套流程把三件套都做在同一张脸上,用 Midjourney 起点 + SDXL 加角色 LoRA 做后续一致性。
这篇讲什么
奇幻角色三件套流水线:先角色卡、再大场景、再动作变体。纪律是:一张标准脸、一个冻结特征表、一个”在剪影里也能认出来”的标志性元素。
这篇适合谁看
跑团 GM 和独立出版者、做角色阵容原型的叙事游戏开发、写系列小说要建 bible 的作者、用 AI 做最终渲染前 ideation 的插画师、动画短片或 pilot 的 pitch deck 制作者。
什么时候适合用
新跑团需要 4-8 个角色、游戏 pitch 需要一个英雄 3-5 张主图、小说 / 网漫做系列 bible、Kickstarter 多档周边要视觉统一,或任何”同一个角色要在很不同的场景里看上去是同一个人”的场合。
开始前准备
- 渲染风格早定——绘画感插画、二次元、半写实、黑暗奇幻油画。风格决定工具和特征写法。
- 用一段话写角色 brief:名字、身份、背景、标志性剪影元素(斗篷 / 武器 / 面具 / 发光)。剪影是你的”第二张脸”。
- 工具链选定:Midjourney
--cref做 ideation,SDXL + IP-Adapter 或 20 张训出来的 LoRA 做严格一致,Flux Redux 做高保真参考。 - 给角色卡留 2-3 小时。它是用得最多的资产,别赶。
具体步骤
- 先生角色卡:一张图里出正面、3/4、侧面、背面四视图,T-pose、平表情、均匀光、灰底。prompt 用 “character sheet, four views, T-pose, neutral expression, studio gray”。
- 从卡上提特征表(5-7 项可见):脸、发、眼、肤、标志性服 / 甲、武器、记号。原封不动塞进每个下游 prompt。
- 找标志性剪影元素——能在黑白剪影里被一眼认出的形状。可能是兜帽斗篷、背上的弯刀、第三只发光的眼。整组守住它。
- 生环境大场景。同一个特征块,加场景:“[特征块] 站在悬崖边俯瞰黄昏废城,强侧光,绘画感”。角色卡当
--cref参考。 - 生动作变体。同一个特征块,加动作和动态镜头:“[特征块] 拔剑跃起的瞬间,低角度动态镜头,斗篷动模糊,扬尘”。脸靠参考图压住。
- 三张并排比,眯眼看:同一个人吗?动作变体脸漂了就提权重或重生。
- 角色卡 + 大场景 + 动作变体存成 bible v1。以后所有场景都参考这一组。
第一次实操怎么跑
- 选一个真正要用的角色(一个跑团 NPC、一个小说主角),不要一上来就六个。
- 先做四视图角色卡。花 60-90 分钟——后面所有图都骑在这张上。
- 用角色卡做参考各生一张大场景和动作变体。三张缩成缩略图眯眼看。
- 如果有一张读起来像另一个角色,命名失败(下颌偏了 / 斗篷颜色漂了 / 武器变了),单独重生那张。
完成后检查
- 角色卡、大场景、动作变体,缩略图大小看是同一张脸吗?
- 标志性剪影元素在三张里都在、都能认吗?尤其动作变体。
- 渲染风格守住吗?bible 里混绘画和 photoreal 就是两个角色。
- 记号(疤、纹、首饰)一路带着没?AI 经常悄悄把它们删了。
- 动作变体还是这个 bible 的画风吗?动态姿势经常把模型推到二次元默认。
怎么复用这套流程
- 特征块 + 标志剪影元素存成
character-bible.md。新场景只加调度。 - 4-8 个角色阵容时,先把所有角色卡都跑完,再跑大场景,再跑动作变体。批量保持模型”热身”在每个角色上。
- 一个角色累计到 20+ 张通过图,就训 LoRA。以后不带参考图也能稳。
- 每 6 周重测参考权重;模型大更新可能要重调。
建议的操作流程
一段角色 brief → 四视图角色卡 → 提特征 → 锁参考做大场景 → 锁参考做动作变体 → bible v1 存档 → 之后所有场景都基于 bible。一个角色总耗时 3-4 小时含迭代。日后省掉几十小时”这张怎么不像同一个人”。
容易踩的坑
- 跳过角色卡直接做大场景。没有干净标准,下游所有图都会漂。
- 标志剪影元素跑偏。第一张里定义角色的斗篷,到第四张消失了。
- 每张场景换措辞写特征。原封不动锁着——小同义词换换也会复利成另一人。
- bible 内混渲染风格。绘画卡 + photoreal 大场景 = 两个角色。
- 动作 prompt 太强压过参考。极端动作就把参考权重往上提。
- 一会话连建 8 个角色却不存标准。锚没了所有人都漂。
FAQ
- 角色卡几视图?四个还是八个?: 四视图(正面、3/4、侧面、背面)最稳。八视图大多数模型会把脸糊成一排。
- 奇幻一致性最稳的工具?: Midjourney
--cref做 ideation,SDXL + 自训 LoRA 做生产。Flux Redux 在一两张高保真锁脸上很猛。 - 同一个角色拿不同武器可以吗?: 可以,但武器要当特征看待——一换剪影读法就变。bible 里专门记武器变体。
- 要训 LoRA 吗?: 同一角色超过 20-30 张就值。再少的话直接用参考图更快。
- 动作变体脸为什么会漂?: 动态姿势会把模型推到默认。提参考权重,或者用一张定姿的角色卡走 image-to-image。