Openbayes 教程上新丨多主体驱动生成能力达SOTA，字节UNO模型可处理多种图像生成任务

如今，主体驱动生成 (subject-driven generation) 已经广泛应用于图像生成领域，但其在数据可扩展性和主体扩展性方面仍面临诸多挑战，例如从单主体数据集转向多主体并对其进行扩展尤为困难；目前的热门研究方向是单主体，在面对多主体生成任务时表现欠佳。

针对于此，字节跳动 Intelligent Creation 团队利用扩散 Transformer 模型本身具备的上下文生成能力，生成了具有高度一致性的多主体配对数据，并以 FLUX 为基础模型提出了 UNO 模型，能够处理图像生成任务中的不同输入条件。其借助「模型-数据共同进化」的新范式，在优化模型性能的同时，丰富训练数据，提高生成图像的质量和多样性。

研究人员在 DreamBench 和多主体驱动生成的基准测试上进行了大量实验。UNO 在这两项任务中均取得了最高的 DINO 和 CLIP-I 分数，表明其在主体相似性和文本可控性方面表现出色，能力达 SOTA 级别。

多主体驱动生成评测结果，UNO 达 SOTA

目前「UNO：通用定制化图像生成」教程已上线至 OpenBayes 公共教程中， 感兴趣的小伙伴快来亲自上手试一试吧！

教程地址：https://go.openbayes.com/zCYdP

Demo 运行

Demo 运行阶段

1.登录 OpenBayes.com，在「公共教程」页面，选择键部署「UNO：通用定制化图像生成」教程。

2.页面跳转后，点击右上角「克隆」，将该教程克隆至自己的容器中。

3.选择「NVIDIA GeForce RTX 4090」以及「PyTorch」镜像，OpenBayes 平台提供了 4 种计费方式，大家可以按照需求选择「按量付费」或「包日/周/月」，点击「继续执行」。新用户使用下方邀请链接注册，可获得 4 小时 RTX 4090 + 5 小时 CPU 的免费时长！

小贝总专属邀请链接（直接复制到浏览器打开）：
https://go.openbayes.com/9S6Dr