展示 HN:针对 Blackwell (SM_120) 的优化 vLLM – 在 DeepSeek-R1 上达到 59T/S1 分•作者: malka666•21 天前•原帖vLLM用于Blackwell(SM_120)和内核6.14。针对RTX 5090进行了优化。在DeepSeek-R1上通过FlashInfer实现59 t/s。