vllm的V1为什么删除了multi step特性

vLLM V1 移除了 multi step(即 --num-scheduler-steps > 1)特性,导致在某些场景下端到端性能(如吞吐量)比 V0 低 5%-10%。V0 通过多步调度减少了调度开销,提升了吞吐,但 V1 由于架构重构,暂未支持该特性,因此性能略有下降。详细讨论见 官方论坛

需要进一步了解 V1 的调度机制或优化建议吗?

Sources: