前面讲的都是”怎么做出一部AI漫剧”,这次来说点更接地气的——自己动手做一部。

很多人学了一大堆工具,但真要自己做一部完整的AI漫剧时,还是不知道从哪下手。下面我用一个完整的实战案例,带你走一遍从0到1的过程。

案例背景:一部3集的AI漫剧Demo

题材:校园甜宠(这个题材入门友好,而且有市场)
集数:3集(每集3-5分钟,适合作为作品集案例)
目标:做完之后放到B站或者抖音,积累作品集,用来求职或者接单

第一步:定创意和大纲(预计用时:1天)

创意
女主是转学生,第一天上课发现坐在旁边的男生,就是昨天在奶茶店帮她捡起书包的那个人……

大纲(简化版)

  • 第1集:奶茶店偶遇 → 第二天教室重逢 → 结尾:男主主动跟女主说话(钩子)
  • 第2集:两人开始接触 → 女主发现男主其实是个”冰山暖男” → 结尾:男主递给女主一张纸条(钩子)
  • 第3集:纸条上写着”放学后,天台见” → 天台对话,两人关系升温 → 结尾:女主微笑,字幕”未完待续”(为续集留空间)

经验
大纲不用写得太细,但每集的钩子要提前想好。因为这个案例是3集的Demo,钩子可以相对简单,但如果是20集的商业项目,钩子就要设计得更精心。

第二步:角色和美术设定(预计用时:2-3天)

主要角色(2个)

角色 年龄 外貌特征 性格
女主:林小夏 17岁 黑色长发,马尾辫,校服,大眼睛 开朗、有点迷糊
男主:陆星河 17岁 短发,校服,戴黑框眼镜,高冷长相 表面冷淡,其实细心

用Midjourney生成角色设定图

  1. 先生成女主的正面全身图:

    prompt: anime girl, 17 years old, black long hair in ponytail, school uniform, bright and cheerful expression, full body, white background –niji 6 –ar 3:4

  2. 再生成不同表情的版本(微笑、惊讶、害羞、难过)
  3. 男主同理,生成正面、侧面、不同表情的图
  4. 把所有设定图整理到一个文档里,作为后续AI生成的参考

美术风格确定
日式校园动漫风格,色彩明亮,光影柔和。在提示词里固定这段描述:
anime style, school setting, bright colors, soft cinematic lighting, cel shading

第三步:写分集脚本(预计用时:2-3天)

脚本格式(以第1集为例)

场景 画面描述(AI提示词) 对白 镜头 时长
SC01 anime style, girl walking into a milk tea shop, nervous expression, afternoon sunlight… (旁白)”那是转学前的最后一天……” 中景,跟拍 5s
SC02 anime style, girl dropping her bag, milk tea spill, panicked expression… “啊!我的奶茶——” 全景→特写 4s
SC03 anime style, boy picking up her bag, gentle smile, backlighting… 男主:”你没事吧?” 中景,仰视 4s

提示
“画面描述”这一栏,就是后面丢给AI去生成图片的提示词。所以要写得足够具体,不能只写”女主走进奶茶店”,要写清楚”时间(下午)、光线(阳光斜射)、情绪(紧张的表情)”。

第四步:批量生成分镜图(预计用时:3-5天)

如果用ComfyUI

  1. 搭好文生图工作流(加载模型 → CLIP编码 → KSampler → VAE解码 → 保存图片)
  2. 在CLIP编码节点里,粘贴脚本里的”画面描述”
  3. 加上角色LoRA(如果已经训练好了的话,或者先用IPAdapter控制角色一致性)
  4. 批量生成:每集的所有镜头都生成3-5个版本(多选几张好的)
  5. 把生成好的图按”集数/场景编号”整理到文件夹里

如果用Midjourney(不用ComfyUI的情况)

  1. 把”画面描述”改成Midjourney格式的提示词
  2. 加上--sref [角色参考图URL]来保证角色一致性
  3. 一张一张生成(比ComfyUI慢,但操作简单)
  4. 下载所有生成好的图

质量检查
生成完后,全部看一遍,把有瑕疵的(手指畸形、面部扭曲、风格不统一)删掉或者重新生成。

第五步:图转视频+剪辑(预计用时:2-3天)

静态图转动态视频

  • 场景镜头(奶茶店环境、教室环境)→ 用Runway Gen-3生成动态视频(缓慢推拉)
  • 人物对话镜头 → 可以不用转视频,用静态图+缓慢运镜(剪映关键帧)就行
  • 特写镜头(人物表情)→ 用可灵AI生成”微动作”视频(眨眼、微笑、嘴唇微动)

剪辑

  1. 把所有的视频片段导入剪映(或者PR)
  2. 按照脚本里的顺序拼接起来
  3. 调整每个镜头的时长(参考脚本里的”时长”栏)
  4. 在镜头衔接处加上转场效果(硬切或者淡入淡出,不要用太花哨的转场)
  5. 导出不带配音的半成品视频

第六步:配音+配乐+合成(预计用时:1-2天)

配音

  1. 把脚本里的对白整理出来
  2. 用ElevenLabs(英文配音)或者讯飞(中文配音)生成AI配音
  3. 或者找真人配音员录(在淘宝或者闲鱼上能找到便宜的配音服务)
  4. 把配音文件按集整理好

配乐

  • 校园甜蜜场景 → 轻快的钢琴曲(网易云音乐版权库里找)
  • 感动场景 → 慢板小提琴或者钢琴(同样在版权库里找)

混音+合成

  1. 把配音、配乐、音效都导入剪映的时间轴
  2. 调整音量平衡(配音最响,配乐调到30%-50%)
  3. 导出最终成片

第七步:发布和迭代(持续进行)

发布
把3集成片传到B站(建一个账号,做成”系列视频”),同时在抖音和快手也发一下。

看数据,做迭代

  • 如果第1集的完播率高,说明开头设计得好,后面可以沿用这个手法
  • 如果某集的续看率低,分析一下是不是钩子没埋好
  • 根据观众评论调整后续内容(如果有续集计划的话)

整个项目的时间估算

阶段 时间 说明
创意+大纲 1天 如果是改编自有IP,时间更长
角色+美术设定 2-3天 主要是跟AI”磨”出满意的设定图
写脚本 2-3天 3集比较快,20集要2周左右
生成分镜图 3-5天 最耗时的一环
剪辑 2-3天 熟悉工具的话可以更快
配音+合成 1-2天 如果找真人配音,要加上沟通时间
总计 11-17天 一个人做,每天工作6-8小时

如果是20集的商业项目,时间大概是30-45天(前面提到过),因为集数多了之后,角色一致性、美术风格统一这些问题的处理会更耗时。


相关课程: 火星人教育AI漫剧导演培训课程中,有一个”完整的3集AI漫剧制作实战”模块,就是按照上面这个流程带着你做一遍。结课后,你自己独立做项目就没问题了。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。