vLLM Forums

Topic	Replies	Views	Activity
Question about full cudagraph of FlashAttention-v2 General	13	227	January 5, 2026
RTX 5090 + GLM incompatible issues - Please update General	2	595	January 4, 2026
Vllm推理指标如何做可视化？ General	1	100	January 4, 2026
如何尽可能提升推理服务的吞吐量 General	3	437	January 4, 2026
Can reasoning_effort parameter not ne used in vllm implementation via python? Features	1	368	January 2, 2026
Which software components vLLM inference needs General	3	303	December 30, 2025
Vllm是否支持加载deepseek_ocr模型的lora适配器进行推理 General	2	92	December 30, 2025
MiniMax-M2.1 输出乱码有人遇到吗应该不是vllm的问题 General	2	149	December 30, 2025
如何在推理的时候对图像做自动的resize General	1	282	December 29, 2025
Vllm support HUAWEI mindie news General	1	87	December 29, 2025
Vllm-omni cannot load z-image-turbo Model Support	3	406	December 27, 2025
Where to start for implementing custom memory-block–aware scheduling in vLLM? General	3	140	December 26, 2025
How to output selected expert IDs of prefilling? General	2	78	December 25, 2025
Vllm omni和vllm区别是什么 General	2	266	December 25, 2025
vLLM has no internet connection General	1	196	December 23, 2025
Vllm sleep模式使用场景 General	2	66	December 23, 2025
Does vllm automatically inject schema's information into the prompt? General	3	102	December 23, 2025
GLM 4.7-FP8 Reasoning Start Issues? General	1	614	December 23, 2025
推理Qwen3-VL-235B-A22B-Instruct-FP8时， General	1	42	December 22, 2025
推理Qwen3-VL-235B-A22B-Instruct-FP8精度有问题 General	2	108	December 22, 2025
Is it possible to deploy minimax-m2 using 2A100 and 4A10? General	1	109	December 22, 2025
How to get structured outputs in vllm? General	12	393	December 22, 2025
如何查看配置的batch size是多大？ General	2	110	December 22, 2025
How to apply FA4 on B200? NVIDIA GPU Support	3	556	December 18, 2025
Issue running gemma-3-27b-it with vLLM version: 0.12.0 General	1	187	December 17, 2025
VLLM V1 Scheduler: Inconsistent Request Scheduling Under Token Budget Limit General	25	356	December 17, 2025
Help with vLLM crashes General	1	748	December 16, 2025
How to generate just one token? General	1	84	December 16, 2025
How to pass add_generation_prompt=False from client? General	5	259	December 16, 2025
Which client should I use? General	2	147	December 16, 2025