最强文生图开放模型！超大杯Stable Diffusion免费来袭：提示词也更简单-快科技-科技改变生活

Stable Diffusion最强版本，来了！

刚刚，SDXL 1.0正式发布，可免费在线试玩。

效果上，无论是以假乱真的写实大片：

超现实的熊猫喝啤酒：

还是赛博朋克漫画，都非常nice~

最强文生图开放模型！超大杯Stable Diffusion免费来袭：提示词也更简单

Stability AI表示，SDXL 1.0能生成更加鲜明准确的色彩，在对比度、光线和阴影方面做了增强，可生成100万像素的图像（1024 x 1024）。

而且还支持在网页上直接对生成图像进行后期编辑。

（有一股和Midjourney、Firefly打擂台的味儿了）

网友们已经按捺不住上手试玩了~

和基础Stable Diffusion相比，SDXL 1.0生成结果更加准确和逼真。

而且官方表示，提示词也能比之前更简单了。

这是因为SDXL 1.0的基础模型参数量达到了35亿，理解能力更强。

对比基础版Stable Diffusion，参数量只有10亿左右。

由此，SDXL 1.0也成为当前最大规模的开放图像模型之一。官方甚至直接说这就是世界上最好的开放图像模型。

话不多说，我们来上手体验了~

把马斯克印在青花瓷上

SDXL 1.0在操作上很便捷，直接输入prompt即可，还能从下面勾选风格、尺寸参数等。

一次生成默认是出4张图，如果不满意还可以点下方“加号”让它继续画。

官方介绍说，现在让SDXL 1.0生成大作，无需再加入“杰作”这种提示词了。

让它生成一幅日漫风格的图像，画风非常贴合，而且在光影的处理上也更加自然了。

1990s anime low resolution screengrab couple walking away in street at night

或者是一幅风景照？也能以假乱真了。

甚至是让马斯克站在中式庭院里，抬头斜望着天空……

Elon Musk in an ancient Chinese palace

或者是把苹果收购了？

在「WWDC」上，他举着全新款iPhone向人们展示，身边还围满了记者和粉丝（doge）。

Elon Musk releasing new iPhone at WWDC

除了这些老马的洋葱新闻之外，绘画风格的作品效果也不错。

左边的是齐白石水墨风格，而右边是一幅漫画。

左：Elon Musk delivering a speech, ink painting, Qi Baishi style右：Elon Musk comic

除了绘画，也可以把老马放进我们的元青花。

Elon musk in the shape of Yuan Dynasty Blue and White Porcelain

上面展示的这些「老马的故事」，用的prompt都比较简单。

但从效果并没有因为提示词简单而拉胯，这也与官方的说法相印证。

不过我们还是想看看，如果用更加复杂精致的prompt，会是什么样子？

我们找到了Midjourney创作的一张老马在苏联担任汽修工人的珍贵照片，重新喂给MJ，让它生成个prompt。

MJ生成了下面这样的prompt，我们就用它来测试SDXL：

Elon Musk(这里MJ生成的是a man) standing in a workroom, in the style of industrial machinery aesthetics, deutscher werkbund, uniformly staged images, soviet, light indigo and dark bronze, new american color photography, detailed facial features

风格完全符合我们的预期，细节也还不错。

再来一个复杂prompt的图作为收尾，同样是MJ根据此前的作品生成后喂给SDXL。

elon musk eating food with chopsticks, in the style of peter coulson, cross-processing/processed, pinhole photography, herb trimpe, james tissot, transavanguardia, spot metering

左边是SDXL的作品，右边是MJ的原版，大家可以对比一下。