4月18日消息,NVIDIA AI之强大,不仅仅在于硬件性能好,更离不开生态优化适配,可以发挥最佳效率,AMD相比之下就差了很多,但也在努力追赶。
现在,Stability AI发布了ONNX框架优化的Stable Diffusion模型,在兼容的AMD Radeon显卡、锐龙集显上最多可以提速达3.8倍。
AMD表示,过去一年来,一直在与OSV、OEM、ISV厂商合作,优化AMD硬件上的AI应用,包括硬件设计、驱动程序、编译器、机器学习模型等等。
根据官方公布的数据,经过优化之后,SDXL 1.0、SDXL Turbo在AMD硬件上的推理性能,对比基础的PyTroch模型最高提升3.8倍,SD3.5则可提升最多2.6倍。
实际图片、视频生成应用中,SDXL 1.0、SDXL Turbo、SD3.5 Large、SD3.5 Large Turbo在RX 9070 XT显卡上的效率分别提升了3.1倍、1.5倍、3.3倍、2.1倍。
SDXL 1.0、SD3.5 Large、SD3.5 Large Turbo在锐龙AI MAX+ 395上的效率,则分别提升了1.4倍、3.3倍、3.0倍。
AMD硬件优化版的Stable Diffusion模型有一个特殊的_amdgpu后缀标记(比如stable-diffusion-3.5-large_amdgpu),现在已经可以在Stability AI或者Hugging Face上下载了。
你也可以使用AMD、TensorStack AI联合打造的最新版Amuse 3.0。
注意,AMD GPU驱动版本不要低于24.30.31.05预览版,或者等待即将发布的25.4.1正式版。