基准测试显示差距。NVLS 全归约延迟从 H200 的 586.1 微秒降至 GB200 的 313.3 微秒...
Perplexity(@perplexity_ai)107 字 (约 1 分钟)
85
NVLS 全归约延迟显著改善,从 H200 的 586.1 微秒降至 GB200 的 313.3 微秒,MoE 预填充和解码吞吐量也有显著提升。
入选理由:NVLS all-reduce latency drops from 586.1µs on H200 to 313.3µs on GB200.
精选推文#NVLS#H200#GB200#MoE#性能英文
