Skip to main content

Ctrl+K

NeMo-RL

GitHub

NeMo-RL

GitHub

Table of Contents

About

Overview
Performance
Model Support
Features and Roadmap
Training and Generation Backends
Quick Start
Installation and Prerequisites
Algorithms
Evaluation
Installation: Set Up Clusters
Tips and Tricks

Environment Start

Run on Your Local Workstation
Set Up Clusters

E2E Examples

SFT on OpenMathInstruct-2

Guides

Nemotron 3 Nano
Add New Models
Supervised Fine-Tuning in NeMo RL
Direct Preference Optimization in NeMo RL
An in-depth Walkthrough of DAPO in NeMo RL
An In-Depth Walkthrough of ProRLv2 in NeMo RL
An In-depth Walkthrough of GRPO in NeMo RL
GRPO on DeepScaler
Solve a Sliding Puzzle Using GRPO
Reward Model Training in NeMo RL
Environments for GRPO Training
Evaluation
DeepSeek-V3
Model Quirks
Train with Async GRPO
Train with Eagle3 Speculative Decoding
YaRN Long-Context Training
Muon Optimizer
DTensor Tensor Parallel Accuracy Issue
Fault Tolerance Launcher Guide

Containers

Build Docker Images

Development

Test NeMo RL
Documentation Development
Debug NeMo RL Applications
Profile GPU with Nsys
FP8 Quantization in NeMo RL
Experiment with Custom vLLM

Design Docs

Design and Philosophy
Padding in NeMo RL
Logger
uv in NeMo RL
Dependency Management
Data Format
Generation Interface
Exporting Checkpoints to Hugging Face Format
Loss functions in NeMo RL
FSDP2 Parallel Plan
Training Backends
Sequence Packing and Dynamic Batching
Environment Variable Precedence in NeMo RL
NeMo Gym Integration

API Reference

API Reference
- nemo_rl

API Reference
nemo_rl
nemo_rl.utils

`nemo_rl.utils`#

Submodules#

nemo_rl.utils.nvml
nemo_rl.utils.config
nemo_rl.utils.packed_tensor
nemo_rl.utils.native_checkpoint
nemo_rl.utils.flops_formulas
nemo_rl.utils.flops_tracker
nemo_rl.utils.nsys
nemo_rl.utils.timer
nemo_rl.utils.memory_tracker
nemo_rl.utils.venvs
nemo_rl.utils.checkpoint
nemo_rl.utils.prefetch_venvs
nemo_rl.utils.logger

previous

nemo_rl.evals.answer_parsing

next

nemo_rl.utils.nvml

On this page

Submodules

Privacy Policy | Your Privacy Choices | Terms of Service | Accessibility | Corporate Policies | Product Security | Contact

Copyright © 2026, NVIDIA Corporation.