前面讲的都是”怎么做出一部AI漫剧”,这次来说点更接地气的——自己动手做一部。
很多人学了一大堆工具,但真要自己做一部完整的AI漫剧时,还是不知道从哪下手。下面我用一个完整的实战案例,带你走一遍从0到1的过程。
案例背景:一部3集的AI漫剧Demo
题材:校园甜宠(这个题材入门友好,而且有市场)
集数:3集(每集3-5分钟,适合作为作品集案例)
目标:做完之后放到B站或者抖音,积累作品集,用来求职或者接单
第一步:定创意和大纲(预计用时:1天)
创意:
女主是转学生,第一天上课发现坐在旁边的男生,就是昨天在奶茶店帮她捡起书包的那个人……
大纲(简化版):
- 第1集:奶茶店偶遇 → 第二天教室重逢 → 结尾:男主主动跟女主说话(钩子)
- 第2集:两人开始接触 → 女主发现男主其实是个”冰山暖男” → 结尾:男主递给女主一张纸条(钩子)
- 第3集:纸条上写着”放学后,天台见” → 天台对话,两人关系升温 → 结尾:女主微笑,字幕”未完待续”(为续集留空间)
经验:
大纲不用写得太细,但每集的钩子要提前想好。因为这个案例是3集的Demo,钩子可以相对简单,但如果是20集的商业项目,钩子就要设计得更精心。
第二步:角色和美术设定(预计用时:2-3天)
主要角色(2个):
| 角色 | 年龄 | 外貌特征 | 性格 |
|---|---|---|---|
| 女主:林小夏 | 17岁 | 黑色长发,马尾辫,校服,大眼睛 | 开朗、有点迷糊 |
| 男主:陆星河 | 17岁 | 短发,校服,戴黑框眼镜,高冷长相 | 表面冷淡,其实细心 |
用Midjourney生成角色设定图:
- 先生成女主的正面全身图:
prompt: anime girl, 17 years old, black long hair in ponytail, school uniform, bright and cheerful expression, full body, white background –niji 6 –ar 3:4
- 再生成不同表情的版本(微笑、惊讶、害羞、难过)
- 男主同理,生成正面、侧面、不同表情的图
- 把所有设定图整理到一个文档里,作为后续AI生成的参考
美术风格确定:
日式校园动漫风格,色彩明亮,光影柔和。在提示词里固定这段描述:
anime style, school setting, bright colors, soft cinematic lighting, cel shading
第三步:写分集脚本(预计用时:2-3天)
脚本格式(以第1集为例):
| 场景 | 画面描述(AI提示词) | 对白 | 镜头 | 时长 |
|---|---|---|---|---|
| SC01 | anime style, girl walking into a milk tea shop, nervous expression, afternoon sunlight… | (旁白)”那是转学前的最后一天……” | 中景,跟拍 | 5s |
| SC02 | anime style, girl dropping her bag, milk tea spill, panicked expression… | “啊!我的奶茶——” | 全景→特写 | 4s |
| SC03 | anime style, boy picking up her bag, gentle smile, backlighting… | 男主:”你没事吧?” | 中景,仰视 | 4s |
提示:
“画面描述”这一栏,就是后面丢给AI去生成图片的提示词。所以要写得足够具体,不能只写”女主走进奶茶店”,要写清楚”时间(下午)、光线(阳光斜射)、情绪(紧张的表情)”。
第四步:批量生成分镜图(预计用时:3-5天)
如果用ComfyUI:
- 搭好文生图工作流(加载模型 → CLIP编码 → KSampler → VAE解码 → 保存图片)
- 在CLIP编码节点里,粘贴脚本里的”画面描述”
- 加上角色LoRA(如果已经训练好了的话,或者先用IPAdapter控制角色一致性)
- 批量生成:每集的所有镜头都生成3-5个版本(多选几张好的)
- 把生成好的图按”集数/场景编号”整理到文件夹里
如果用Midjourney(不用ComfyUI的情况):
- 把”画面描述”改成Midjourney格式的提示词
- 加上
--sref [角色参考图URL]来保证角色一致性 - 一张一张生成(比ComfyUI慢,但操作简单)
- 下载所有生成好的图
质量检查:
生成完后,全部看一遍,把有瑕疵的(手指畸形、面部扭曲、风格不统一)删掉或者重新生成。
第五步:图转视频+剪辑(预计用时:2-3天)
静态图转动态视频:
- 场景镜头(奶茶店环境、教室环境)→ 用Runway Gen-3生成动态视频(缓慢推拉)
- 人物对话镜头 → 可以不用转视频,用静态图+缓慢运镜(剪映关键帧)就行
- 特写镜头(人物表情)→ 用可灵AI生成”微动作”视频(眨眼、微笑、嘴唇微动)
剪辑:
- 把所有的视频片段导入剪映(或者PR)
- 按照脚本里的顺序拼接起来
- 调整每个镜头的时长(参考脚本里的”时长”栏)
- 在镜头衔接处加上转场效果(硬切或者淡入淡出,不要用太花哨的转场)
- 导出不带配音的半成品视频
第六步:配音+配乐+合成(预计用时:1-2天)
配音:
- 把脚本里的对白整理出来
- 用ElevenLabs(英文配音)或者讯飞(中文配音)生成AI配音
- 或者找真人配音员录(在淘宝或者闲鱼上能找到便宜的配音服务)
- 把配音文件按集整理好
配乐:
- 校园甜蜜场景 → 轻快的钢琴曲(网易云音乐版权库里找)
- 感动场景 → 慢板小提琴或者钢琴(同样在版权库里找)
混音+合成:
- 把配音、配乐、音效都导入剪映的时间轴
- 调整音量平衡(配音最响,配乐调到30%-50%)
- 导出最终成片
第七步:发布和迭代(持续进行)
发布:
把3集成片传到B站(建一个账号,做成”系列视频”),同时在抖音和快手也发一下。
看数据,做迭代:
- 如果第1集的完播率高,说明开头设计得好,后面可以沿用这个手法
- 如果某集的续看率低,分析一下是不是钩子没埋好
- 根据观众评论调整后续内容(如果有续集计划的话)
整个项目的时间估算
| 阶段 | 时间 | 说明 |
|---|---|---|
| 创意+大纲 | 1天 | 如果是改编自有IP,时间更长 |
| 角色+美术设定 | 2-3天 | 主要是跟AI”磨”出满意的设定图 |
| 写脚本 | 2-3天 | 3集比较快,20集要2周左右 |
| 生成分镜图 | 3-5天 | 最耗时的一环 |
| 剪辑 | 2-3天 | 熟悉工具的话可以更快 |
| 配音+合成 | 1-2天 | 如果找真人配音,要加上沟通时间 |
| 总计 | 11-17天 | 一个人做,每天工作6-8小时 |
如果是20集的商业项目,时间大概是30-45天(前面提到过),因为集数多了之后,角色一致性、美术风格统一这些问题的处理会更耗时。
相关课程: 火星人教育AI漫剧导演培训课程中,有一个”完整的3集AI漫剧制作实战”模块,就是按照上面这个流程带着你做一遍。结课后,你自己独立做项目就没问题了。

评论(0)