Datawhale

 Datawhale学习 

实践:AI+视频制作,出品方:魔搭社区

随着生成式人工智能技术的发展和应用,影视与游戏行业也迎来了AI化的时代。AI不仅能更高效地完成图片、视频等多媒体作品的制作工作,还可以创造更加逼真、精细的视觉效果。魔搭社区结合社区出圈的AIGC应用能力,推出《影视与游戏行业AI视频制作实战》系列教程,将通过多个章节帮助大家快速且免费地使用开源模型和应用玩转AI视频创作。

下面我们开始第一步,角色形象设计一致性。

01

需求分析

1、人脸一致性:

角色无论在不同的时间点或场景中出现,都能被识别为同一人物。这要求角色的面部特征保持高度一致,确保观众能够无缝地识别和跟踪角色。

2、服化道一致性:

角色的服装、化妆和道具设计应保持一致性,这不仅适用于单个角色,也适用于多个角色之间的相互关系。这种一致性有助于构建一个连贯的剧情背景,增强观众的沉浸感和故事的可信度。

02

工具实测-使用预设风格

使用工具:

 https://www.modelscope.cn/bra...

预设风格如下:

选择部分风格实测:

服化道

小美

小帅

初始值:AI模特

普通T恤,纯色背景

宇航员服,漫游天空场景

机械服,赛博朋克场景

漫画风格,咖啡馆场景

西部牛仔风,沙漠场景

藏族服饰风格,雪天场景

评测:

  • 无论服化道如何变化,人脸总是保持一致,具备极强辨识度
  • 无论服化道如何变化,角色之间的风格也可以统一,满足画风一致性的需求

03

**工具实测-DIY风格
**

如果预设风格不满足剧情设计,那么就需要来亲手训练一个LoRA风格,目前提供可视化界面的训练方式,零代码也可以完成。

使用工具:

https://www.modelscope.cn/bra...

1、训练方式

  • 上传风格参考图

  • 确定标签词:每一张训练图片对应一组标签,风格lora模型会学习图片和对应标签的关系,提供了系统自动打标签方式,也支持手动修改,高频标签词会自动出现在写真生成的提示词中。

  • 设定触发词后开始训练:用户输入触发词后,系统会把它添加到每张训练图片的标签词里,方便lora建立触发词和风格的联系,后续也会自动出现在写真生成的提示词中。

2、效果实测

风格描述

小美

小帅

武侠风格

民国舞会风格

民国学生服

高中校园风

毛毡风格(奇幻场景测试)

评测:新训练的LoRA效果与预制的风格一样好,可无限拓展~

04

训练出满意的LoRA风格可参赛

https://www.modelscope.cn/bra...(点击阅读原文即可参加)

05

更多期待

  1. 角色形象设计目前只支持单人版,希望支持多个角色形象同框展示

如果有相关突破,

可以提交github issue:https://github.com/modelscope...  

或者入群交流新技术发展:

FaceChain开发群(钉钉扫码)


👇点击关注ModelScope公众号获取

更多技术信息~


Datawhale
46 声望12 粉丝

Datawhale 是一个专注于 AI 领域的开源组织,致力于构建一个纯粹的学习圈子,帮助学习者更好地成长。我们专注于机器学习,深度学习,编程和数学等AI领域内容的产出与学习。