头图

HiDiffusion 是旷视科技推出的开发的一种创新框架,旨在提升预训练扩散模型在生成高分辨率图像方面的创造力和效率。这是一种无需训练即可提高预训练扩散模型的分辨率和速度的方法,通过将 HiDiffusion 应用于各种预训练的扩散模型,不仅可以将图像生成的分辨率提高至
4096×4096,而且能将图像生成速度提升 1.5 至 6 倍。这一方法不仅解决了对象重复和高计算负担的问题,而且在生成高分辨率图像的任务上取得了卓越的效果。

使用云平台:OpenBayes

openbayes.com/console/signup?r=sony_0m6v

登录到 OpenBayes 平台后,打开「公共教程」,找到「HiDiffusion 可快速生成高质量 8k 图像 Demo」的教程。
image.png
进入教程后,点击右上角「克隆」。
image.png
平台在克隆过程中会自动为容器绑定所需要的数据,不需要我们再手动配置,直接点击「下一步:选择算力」。
image.png
推荐选择 RTX 4090,别忘了使用文章开头的邀请链接,get 免费时长!选择好后,点击「下一步:审核」即可。
image.png
确认无误后,点击「继续执行」。
image.png
稍等 2 分钟,系统分配资源完成后,待状态显示为运行中后,将鼠标悬停在 API 地址处,点击链接进入模型。使用 API 需要进行现进行实名认证~
image.png
image.png
HiDiffusion 适用于三种方式分别为文本生成图像、图像生成图像、修复图像,它们都对应一个模型。在使用时会首先加载模型而后进行图像的生成。

方式一:文本生成图像

通过输入正向提示词与方向提示词进行图像生成。

正向提示词描述希望在图像中看到的内容;反向提示词描述不希望在图像中出现的内容。
我们选择一个示例:
image.png
其中正向提示词为:Standing tall amidst the ruins,a stone golem awakens,vines and flowers sprouting from the crevices in its body
反向提示词有:blurry, ugly, duplicate, poorly drawn face, deformed, mosaic, artifacts, bad limbs

输入后,点击 Submit 生成图像。
image.png
方式二:图像生成图像

其原理是 ControlNet 在原始图像的轮廓基础上根据提示词进行图像生成。上传一张参考图片后,通过输入正向提示词与逆向提示词进行图像的生成。

正向提示词:The Joker, high face detail, high detail, muted color, 8k

逆向提示词:blurry, ugly, duplicate, poorly drawn, deformed, mosaic

image.png
image.png
生成图像中,第一张为原图像的轮廓,第二张为根据这个轮廓进行生成的图像。

方式三:图像修复

在进行修复时,同样根据正向提示词和反向提示此词进行修改。
image.png
首先上传一张需要修复的图像以及一张修复位置标记图,修复区域中的黑色区域是冻结的区域,表示我们不需要进行修改的区域,白色区域为需要修改的区域。
image.png
正向提示词:A post-apocalyptic survivor in tattered clothing, with a makeshift spear, cautiously navigating through a denseforest overgrown with vines that have reclaimed a crumbling cityscape.

逆向提示词:blurry,ugly, duplicate, poorly drawn, deformed, mosaic

点击 Submit 后,可以看到将我们标记的修改区域按照提示词进行了修改。
image.png


小白狮ww
1 声望0 粉丝