How to use data-parallel in vLLM

machine · November 23, 2025, 11:46am

As title, I want to know how to use data-parallel in vLLM.

RunLLM · November 23, 2025, 11:46am

To use data parallelism in vLLM, you can launch vLLM with the --data-parallel-size argument for online serving, or use the --dp-size argument in offline inference scripts. For multi-node setups, specify --data-parallel-address, --data-parallel-rpc-port, and --data-parallel-size-local to coordinate ranks across nodes. Example for online serving:

vllm serve $MODEL --data-parallel-size 4

For multi-node:

# Node 0
vllm serve $MODEL --data-parallel-size 4 --data-parallel-size-local 2 --data-parallel-address <HEAD_NODE_IP> --data-parallel-rpc-port 13345
# Node 1
vllm serve $MODEL --headless --data-parallel-size 4 --data-parallel-size-local 2 --data-parallel-start-rank 2 --data-parallel-address <HEAD_NODE_IP> --data-parallel-rpc-port 13345

See Data Parallel Deployment for full details.

Would you like more detail or code examples?

Sources:

Data Parallel Deployment

Hint: Mention @RunLLM in the post for followups.

machine · November 23, 2025, 11:58am

I want know how to use data-parallel not for deployment, but for offline inference.

hackyroot · November 24, 2025, 3:41pm

@machine You can refer to this document to enable data-parallelism for offline inference: Data Parallel — vLLM

Topic		Replies	Views
How to enable the --data-parallel-size function for a single machine? General	3	97	October 12, 2025
Some question abound Data Parallel examples General	7	331	June 21, 2025
Running vLLM multi-node data parallel with SLURM RL Integration	1	655	August 12, 2025
Offline multi-node inference General	11	532	May 19, 2025
"vllm serve" to use all GPU's of a single-node multi-use General	5	611	August 1, 2025

How to use data-parallel in vLLM

Related topics