7月27日,著名开源平台Stability AI发布了文本生成图片模型SDXL 1.0。(开源地址:https://github.com/Stability-AI/generative-models)

据悉,SDXL 1.0是Stability AI的旗舰扩散模型,也是目前最佳开源文本生成图片模型之一。

SDXL 1.0与之前的SDXL 0.9相比,在生成图片质量、效率和艺术感等方面有了很大提升。(免费在线体验地址:https://clipdrop.co/stable-diffusion)

在艺术感方面,SDXL 1.0生成的动漫、朋克、科幻、文艺等效果,不输著名文本上生成图片产品Midjourney。尤其是在人物的手部处理方面,SDXL 1.0不会生成Midjourney那样畸形、诡异的图片。

SDXL 1.0可以生成几乎任何艺术风格的高质量图像,鲜明度、曝光、对比度、阴影、高光、饱和度等参数,可与图片内容完美结合产生强烈的氛围和艺术感。

无论是专业的设计师还是小白,都能通过准确、简洁的提示词,快速生成适用于,广告、销售、社交营销、招聘等业务场景的高质量图片。

技术方面,SDXL 1.0是目前开源扩散模型中参数最多之一,由35 亿参数的基础模型和一个 66 亿参数的细化模型组合而成

这两个模型的工作原理是:1)基础模型生成噪声潜在变量;2)用细化模型对其进一步处理实现最终去噪。

这种组合模型架构可保证生成图片的稳定和艺术效果,而不会影响生成效率或过多的算力资源。

根据SDXL 1.0提供的免费试验地址,生成了多张效果图片,整体来看基本达到了提示词想要的效果。需要注意的是,输入的提示词越细腻、维度越多,生成的效果图也将更加理想。以下是生成案例。

1、具有镀铬细节的大型卡车头,在浅景深的高调照明下捕获,运输,商业,详细,高分辨率。

2、清澈见底的河流中急流,周围树木参天,植被茂盛,充满活力,宁静,细节丰富,河流景观,动漫风格。

3、变幻莫测的嘉年华,嘉年华景点的变幻莫测,如梦如幻,抽象,高细节,超现实艺术。

4、狼的木雕,雕刻复杂,毛皮纹理,目光锐利,细节丰富,自然采光,充满野性。

5、云端漂浮之城,飞艇停靠在高空平台,云朵充当道路,未来感十足,异想天开,高空,细节丰富。

6、沉船在生机勃勃的珊瑚礁中,色彩缤纷的鱼群游过,神秘、神奇、细节丰富。

发表回复

后才能评论