AI 漫剧从零到一:角色设定、场景构建与分镜编排
上周有位学员发来一条消息:“老师,我用了Midjourney生成了一堆图,但合在一起就像一堆碎片,角色脸不统一,场景切换生硬,根本不像一个故事。” 这是很多刚接触AI漫剧制作者的通病——会生成单张图,却不会构建连贯的视觉世界。
别担心,今天我们就从最基础的角色设定开始,一步步搭建场景,最终完成完整的分镜编排。我会用两个实操案例,结合具体工具和参数,带你走通这条从零到一的创作路径。
—
一、角色设定的核心:从“脸盲”到“脸熟”
在AI漫剧中,角色一致性是最大的痛点。我们不需要像传统动画那样绘制几百张角色表,但需要掌握一套“角色锚定”方法。
1.1 用Midjourney创建角色“身份证”
工具:Midjourney V6.1
核心参数:`–cref`(角色参考) + `–cw`(角色权重)
操作步骤:
1. 生成初始角色
在Discord中输入:
/imagine prompt: a young Chinese male warrior, long black hair tied in a bun, sharp eyes, wearing blue and white traditional armor, full body portrait, anime style --ar 2:3 --v 6.1
得到一张角色全身图。选择最满意的一张,右键复制图片链接。
2. 建立角色锚点
用这张图作为“角色身份卡”,后续所有该角色的画面都引用它:
/imagine prompt: [角色链接] the warrior sitting on a wooden bench, drinking tea, close-up on face --cref [角色链接] --cw 100 --ar 16:9 --v 6.1
– `–cw 100`:严格遵循原角色面部特征(适合正面/近景)
– `–cw 50`:保留面部特征但允许角度变化(适合侧面/远景)
3. 多角度验证
生成3-5张不同角度、不同表情的角色图,确保一致性。如果出现“脸崩”,降低`–cw`到70-80,同时增加角色描述中的特征词(如“sharp eyes”“thin face”)。
实操案例1:古风侠客系列
我让学员生成一个叫“林寒”的剑客。初始图选择后,用以下prompt生成战斗场景:
[林寒链接] character in mid-air, sword drawn, wind blowing his hair, dynamic pose, cinematic lighting --cref [林寒链接] --cw 80 --ar 16:9 --v 6.1
1.2 用Stable Diffusion实现角色换装(进阶)
工具:Stable Diffusion WebUI + ControlNet (v1.1.450)
核心功能:IP-Adapter + Canny
操作步骤:
1. 在SD中加载角色全身图作为IP-Adapter的参考图像
2. 启用ControlNet的Canny模式,提取角色轮廓
3. 输入新prompt,如“wearing a white robe, holding a bamboo stick”
4. 设置IP-Adapter权重0.8,Canny权重0.6
5. 生成后,角色面部和身形保持一致,但服装完全改变
这个方法特别适合需要角色在不同章节穿不同衣服的漫剧。
—
二、场景构建:让AI理解“空间逻辑”
很多学员生成的场景图很美,但人物和背景比例失调,或者光影方向不一致。这是因为我们没有给AI建立“空间坐标系”。
2.1 用“空间描述法”构建场景
核心公式:`[镜头类型] + [主体位置] + [环境细节] + [光影] + [景深]`
实操案例2:竹林夜战场景
错误prompt(太笼统):
a bamboo forest at night, two characters fighting
→ 结果:画面杂乱,人物像贴上去的。
正确prompt(结构化):
wide shot, a bamboo forest clearing at midnight, Lin Han (the warrior) standing in the left foreground, a shadowy enemy in the right background, moonlight casting through bamboo leaves, creating dappled shadows on the ground, depth of field blurring the far bamboo, cinematic lighting, 8K, anime style --ar 16:9 --v 6.1
关键参数:
- `wide shot`:定义镜头类型(还有medium shot, close-up, extreme close-up等)
2.2 用“场景模板库”提高效率
在火星人教育的内部教学中,我们有一套“场景分类法”:
| 场景类型 | 关键词模板 | 适用镜头 |
|———|———–|———|
| 室内 | warm lamp light, wooden texture, cozy atmosphere | medium shot, close-up |
| 户外日 | golden hour, soft shadows, haze | wide shot, establishing shot |
| 户外夜 | moonlight, blue ambient, fireflies | medium wide, low angle |
| 幻想 | floating islands, glowing crystals, mist | extreme wide, high angle |
实操:创建场景模板后,每次只需替换主体和核心元素。比如竹林夜战场景,可以快速改成“月光下的宫殿屋顶追逐”:
wide shot, palace rooftop at midnight, Lin Han running on the left edge, a hooded figure jumping from the right, moon behind the palace, blue ambient light, depth of field, --ar 16:9 --v 6.1
—
三、分镜编排:从静态图到动态叙事
这是最容易被忽视的环节。分镜不是简单地把图排在一起,而是要有“节奏感”。
3.1 用“三幕式”结构组织分镜
工具:Canva / Procreate 或 任何分镜表模板
核心原则:每页分镜表包含5-6个关键帧
操作步骤:
1. 建立分镜表(建议用Excel或Notion):
– 列1:镜头编号(S01, S02…)
– 列2:镜头类型(WS/MS/CU)
– 列3:画面描述
– 列4:对白/旁白
– 列5:生成prompt(便于后续批量生成)
2. 节奏控制技巧:
– 开场:1个WS(建立场景)+ 1个MS(引入角色)
– 发展:交替使用MS和CU(推进剧情)
– 高潮:快速切换CU + 1个WS(制造冲击)
– 结尾:慢速拉远到WS(留下余韵)
实操案例:林寒竹林之战分镜表
| 镜头 | 类型 | 描述 | 对白 |
|——|——|——|——|
| S01 | WS | 月光下的竹林,远处两个黑影 | 风声 |
| S02 | MS | 林寒拔剑,眼神专注 | “终于等到你了” |
| S03 | CU | 剑刃反射月光 | 金属声 |
| S04 | MS | 敌人从阴影中现身 | “你不该来” |
| S05 | WS | 两人对峙,竹叶飘落 | 沉默 |
| S06 | CU | 林寒嘴角微扬 | “我偏要来” |
3.2 用AI批量生成分镜图
工具:Midjourney + 批量prompt模板
核心参数:`–seed`(种子值控制随机性)
操作步骤:
1. 为每个镜头写好prompt,确保角色引用一致
2. 设置相同的`–seed`值(如12345),让AI保持风格统一
3. 用`/blend`功能或批量生成脚本(如Midjourney的API)一次性生成所有镜头
注意:如果某个镜头生成效果不理想,不要大幅修改prompt,而是微调`–cw`值或增加/减少环境细节词。
—
总结与进阶建议
今天我们从角色设定、场景构建到分镜编排,走通了AI漫剧从零到一的完整流程。核心要点就三个:
1. 角色锚定:用`–cref`和`–cw`参数建立角色身份证,多角度验证一致性
2. 空间描述:用“镜头类型+位置+环境+光影”公式构建场景,避免AI“乱画”
3. 节奏叙事:用三幕式分镜表控制叙事节奏,批量生成时保持`–seed`一致
进阶建议:
AI漫剧不是把AI��画笔,而是当导演助理。你才是那个决定“拍什么”和“怎么拍”的人。
—
常见问题 FAQ
Q1:角色在不同镜头中脸型总变,怎么办?
A:检查两点:①是否每次都用同一张角色参考图(`–cref`);②`–cw`值是否合理——正面镜头用90-100,侧面/远景用60-80。如果还不行,用Stable Diffusion的IP-Adapter做二次修正。
Q2:场景图人物和背景比例失调,怎么调整?
A:在prompt中明确标注“人物在画面中的位置和大小”,比如“foreground left, occupying 1/3 of frame”。同时用`–ar`控制画幅比例(16:9适合宽景,2:3适合人物特写)。
Q3:分镜图风格不统一,有的像油画,有的像动漫?
A:在第一个prompt中就固定风格词,如“anime style, Studio Ghibli inspired”或“semi-realistic, Unreal Engine 5 render”。后续所有镜头都保留这个风格词,并设置相同的`–seed`。
Q4:生成速度太慢,有没有批量方法?
A:用Midjourney的`/blend`功能一次混合多个prompt,或者使用Midjourney API(需订阅专业版)写脚本批量生成。免费方案:在Discord中用`/imagine`加多个`–repeat`参数。
Q5:生成的图怎么变成漫剧视频?
A:导出PNG序列后,用剪映或Premiere Pro合成视频。添加转场(推荐“交叉溶解”)、背景音乐和配音。进阶可以用Runway ML的“Image to Video”功能让静态图动起来。

评论(0)