六、Stable Diffusion体验:TensorRT加速效率高达8.6it/s 只需7.7秒就能生成1张图
Stable Diffusion是一个基于图像的AI模型,只需要输入一句话、或者特定的关键词,就能生成一幅想要的图像,也是时下最火的AI生成画图工具。
NVIDIA也针对Stable Diffusion Web UI,推出了TensorRT加速插件,能让具备Tensor单元的GeForce显卡获得翻倍的性能。
本次我们将对比SDXL加速方法与PyTorch xFormers(常规加速方法)的性能差异。
测试条件以太空大战为关键字,采样方法为Euler a,分辨率为1024×1024、迭代步数50。
使用默认加速器时,耕升RTX 4080 SUPER炫光OC显卡的生成速度最高为2.4it/s,10张图共耗时3分钟55秒,也就是平均每张图用时23.5秒。
启用NVIDIA专为SDXL优化的加速器后,在TensorRT加持下,耕升RTX 4080 SUPER炫光OC显卡的生图速度直接来到了8.6it/s, 10张图片只需77秒就生成完成,也就是平均每张图用时7.7秒,效能非常可观,当于默认加速器的3.6倍。