大提速3.8倍!AMD GPU终于优化Stable Diffusion

4月18日消息,NVIDIA AI之强大,不仅仅在于硬件性能好,更离不开生态优化适配,可以发挥最佳效率,AMD相比之下就差了很多,但也在努力追赶。

现在,Stability AI发布了ONNX框架优化的Stable Diffusion模型,在兼容的AMD Radeon显卡、锐龙集显上最多可以提速达3.8倍。

大提速3.8倍!AMD GPU终于优化Stable Diffusion

AMD表示,过去一年来,一直在与OSV、OEM、ISV厂商合作,优化AMD硬件上的AI应用,包括硬件设计、驱动程序、编译器、机器学习模型等等。

根据官方公布的数据,经过优化之后,SDXL 1.0、SDXL Turbo在AMD硬件上的推理性能,对比基础的PyTroch模型最高提升3.8倍,SD3.5则可提升最多2.6倍。

实际图片、视频生成应用中,SDXL 1.0、SDXL Turbo、SD3.5 Large、SD3.5 Large Turbo在RX 9070 XT显卡上的效率分别提升了3.1倍、1.5倍、3.3倍、2.1倍。

SDXL 1.0、SD3.5 Large、SD3.5 Large Turbo在锐龙AI MAX+ 395上的效率,则分别提升了1.4倍、3.3倍、3.0倍。

大提速3.8倍!AMD GPU终于优化Stable Diffusion

AMD硬件优化版的Stable Diffusion模型有一个特殊的_amdgpu后缀标记(比如stable-diffusion-3.5-large_amdgpu),现在已经可以在Stability AI或者Hugging Face上下载了。

你也可以使用AMD、TensorStack AI联合打造的最新版Amuse 3.0。

注意,AMD GPU驱动版本不要低于24.30.31.05预览版,或者等待即将发布的25.4.1正式版。

大提速3.8倍!AMD GPU终于优化Stable Diffusion

标签:

honglian
cc 管理员

  • 声明:本文由cc于2025-04-18发表在imtoken官网下载/imtoken钱包下载/imtoken安卓版app下载/imtoken钱包app下载,如有疑问,请联系我们。
  • 本文地址:https://www.hk-sz.com/imtoken/3940.html
上一篇:美国向黑龙江Windows设备发加密字节:疑为唤醒、激活微软操作系统提前预留的特定后门
下一篇:“靠流量活着的企业”:经济学家批胖东来遭起诉索赔百万