Datawhale学习
实践:AI+视频制作,出品方:魔搭社区
随着生成式人工智能技术的发展和应用,影视与游戏行业也迎来了AI化的时代。AI不仅能更高效地完成图片、视频等多媒体作品的制作工作,还可以创造更加逼真、精细的视觉效果。魔搭社区结合社区出圈的AIGC应用能力,推出《影视与游戏行业AI视频制作实战》系列教程,将通过多个章节帮助大家快速且免费地使用开源模型和应用玩转AI视频创作。
下面我们开始第一步,角色形象设计一致性。
01
需求分析
1、人脸一致性:
角色无论在不同的时间点或场景中出现,都能被识别为同一人物。这要求角色的面部特征保持高度一致,确保观众能够无缝地识别和跟踪角色。
2、服化道一致性:
角色的服装、化妆和道具设计应保持一致性,这不仅适用于单个角色,也适用于多个角色之间的相互关系。这种一致性有助于构建一个连贯的剧情背景,增强观众的沉浸感和故事的可信度。
02
工具实测-使用预设风格
使用工具:
https://www.modelscope.cn/bra...
预设风格如下:
选择部分风格实测:
服化道
小美
小帅
初始值:AI模特
普通T恤,纯色背景
宇航员服,漫游天空场景
机械服,赛博朋克场景
漫画风格,咖啡馆场景
西部牛仔风,沙漠场景
藏族服饰风格,雪天场景
评测:
- 无论服化道如何变化,人脸总是保持一致,具备极强辨识度
- 无论服化道如何变化,角色之间的风格也可以统一,满足画风一致性的需求
03
**工具实测-DIY风格
**
如果预设风格不满足剧情设计,那么就需要来亲手训练一个LoRA风格,目前提供可视化界面的训练方式,零代码也可以完成。
使用工具:
https://www.modelscope.cn/bra...
1、训练方式
- 上传风格参考图
- 确定标签词:每一张训练图片对应一组标签,风格lora模型会学习图片和对应标签的关系,提供了系统自动打标签方式,也支持手动修改,高频标签词会自动出现在写真生成的提示词中。
- 设定触发词后开始训练:用户输入触发词后,系统会把它添加到每张训练图片的标签词里,方便lora建立触发词和风格的联系,后续也会自动出现在写真生成的提示词中。
2、效果实测
风格描述
小美
小帅
武侠风格
民国舞会风格
民国学生服
高中校园风
毛毡风格(奇幻场景测试)
评测:新训练的LoRA效果与预制的风格一样好,可无限拓展~
04
训练出满意的LoRA风格可参赛
https://www.modelscope.cn/bra...(点击阅读原文即可参加)
05
更多期待
- 角色形象设计目前只支持单人版,希望支持多个角色形象同框展示
如果有相关突破,
可以提交github issue:https://github.com/modelscope...
或者入群交流新技术发展:
FaceChain开发群(钉钉扫码)
👇点击关注ModelScope公众号获取
更多技术信息~
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。