LLM Inference Quick Start Recipes

Optimized deployment guides for NVIDIA hardware for the most popular open source LLMs.

TRT-LLM	vLLM	SGLang
DeepSeek R1 0528 Llama-3.3-70B Llama-4-Scout GPT-OSS GPT-OSS + Eagle3 Qwen Qwen3-Next	GPT-OSS DeepSeek R1/V3 Llama3.3-70B Llama4-Scout Qwen3-Coder-480B-A35B GLM-4.5 GLM-4.5V	DeepSeek GPT-OSS Llama4 Qwen3-Next
Dynamo + TRT-LLM	Dynamo + vLLM	Dynamo + SGLang
DeepSeek R1 GPT-OSS	Llama-3-70B	DeepSeek R1

Last updated on Sep 18, 2025