由于RTX 50系GPU的Tenser Core增加了對(duì)FP4運(yùn)算的加速支持,所以RTX 5090 D使用FLUX.1模型FP4精度時(shí),圖像生成所用時(shí)間只需RTX 4090 D的五分之一,效果十分明顯,如果大家都用FP8精度,RTX 5090 D也只用了60%的時(shí)間就完成了工作。 關(guān)于Stable Diffusion FP16精度的對(duì)比測(cè)試,測(cè)試時(shí)由于TensorRT加速庫(kù)還沒(méi)更新對(duì)RTX 50...
www.dbjr.com.cn/hardware/xianka/973614... 2025-2-11