如果你想,SD 2.0 能生成ડ分辨率为 2048×2048 甚੦至更高的⌋图像。
今日,StabÖility AI 官方宣布,那个爆红 AΣI 圈的 Stable Diffusion 来到了 2.0 版本(SD 2.0)!上线短短几个小时,点赞量已经很可观了。
项目地址:https://giπthub.com/Stability-AIૌ/stablediffusiકon
可以说,这波更新速度够快的,就像网友说的,我从未见过任何技术发展如此Ö之快。V1 还没整透彻,V2 就来Õ了。
∞ća;
ક
V1亮相之初,在Github 排“行榜,Stable Diffusion 为所有软件中攀升至 10K sta¨r 最快的其中之一,在不到两个月的时间内飙升至 33K≠ star。按照这个速度,2.0 版本很快就会赶上。
Stability AI 的产品副总裁兴奋的表示:Stb2;able Diffusion 2.0 是有史以来发布的最强大的开源项目之一。这是迈向创造力、表达能力和沟通民主化的又一大步⊇。
¼还–有网友表示:「离完美不远了。可能是 V5 或 V6 版本Θ」。
「新版本→是改变游戏规ⓦ则的◐更新。」
与最初će;的 V1 版本相比,Sètable Diffusion 2.0 提供了许多重大改进和∫特性,具体表现在:
ⓨ
↓Stable Diffusion ਯ2.0 版本包含一个具有鲁棒性的文本 – 图像模型,在全新的文本编码器 (OpenCLIP) 上训练而成,与早期的 V1 版本相比,文本 – 图像模型大大提高了图像生成质量,可以生成默认分辨率为 512×512 像素和 768×768 像素的图ਲ਼像。
此外,文本 – 图像模型是√在 LAION-5B 数据集上训练的,然后使用 NSFW filter 过滤掉一些£不可描述ક的内容。
Stable Diffusion 2.0 还包括一个 Upscaler Diffusion 模型,该模型将生成图像的分辨率提高了 4 倍。具体效果如何呢?例如下图展示的是 Upscaler 将低分辨率生&成的图像 (128×128) 升级(upscaling)为更高分辨率的图像(512×512)。现在的图像已经够清晰了,然后在结合上←述提到的文本 – 图像模型, 比如将 512×512 像素的图像提高 4 倍,Stable Diffusion 2.0 现在可以将图像升级为分辨率为 2048×20ચ48 甚至更高的图像。
此外,Stable Diffusiਠon 2.0 更新还包括 Depth2img৻(depth-guided stable diffusion)模型,它扩展了 V1 版本中图像 – 图像的特性,为创意应用提供了全新的可能性。Depth2img 用来推理输入图像的深度,然后使用文本和深度信息生成新图像。
左边为输入图Μ像,右边为新生成的图像,相同的动作,面貌各异。该新模型可用于图像 -Ò 图像结构的保持和形状的合成。ε
Depth2img 提供了不同创新性应用,虽然生成的图像与原始图像有很大的不同,Υ但仍然保持™了થ图像的连贯性和深度:
ੇ
„♠
Stabⓝle Diff³usion 2.0 生成的深度 – 图像保持Π一致性。
ਮ最后,Stable Diffusion 2.0 ú还引入了一个新的 text-guided 修复模型,用户可以非常智能、快递的切换图像部分内容,如下图中豹子的嘴巴和鼻子是不变的,其他部分可¿以随意改变。
研究者表示,他们正在努力优ਪ化模型以在Λ单个 GPU 上运行,让尽可能多的人可以使用。
参考链接:https:/ε/stability.abd;i/blⓐog/stable-diffusion-v2-release
ο
© THE ωE¦ND∑
€转载请联系本公¢众—号获得授权
投稿ય或寻求报道:content@j∧iqizhixin℘.com
“&#ffe0 ;掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码ૣ关注ê)
¯
新ઍ浪≤科技
新浪科技ⓣ为β你Ād;带来最新鲜的科技资讯
‹
苹果汇©
苹果汇为你带来最新鲜的苹果产品Ú新ćd;闻
新浪♤ 众测
新酷í产品第一时¹间免ੈ费试玩
新浪≈探"索ੇ
提供最新ℑ的科学家新◘闻,精彩的震撼ê图片
新δ浪科ઍ技意见反馈留▥言板
All Rights Reserved 新↵浪±公司 版权所੧有