Skip to main content

Ctrl+K

Megatron Bridge

GitHub

Megatron Bridge

GitHub

Table of Contents

Performance

Performance
Performance Archive

Guides

Parallelisms Guide
Performance Tuning Guide
Using Recipes
NeMo 2.0 to Megatron Bridge Migration Guide
Megatron-LM to Megatron Bridge Guide

Bridge with 🤗 Hugging Face

Get Started with 🤗 Hugging Face Conversion
Megatron Bridge Conversion Technical Details

Supported Models

Supported Models
Bailing
- Ling 2.0
DeepSeek
Falcon
- Falcon H1
Gemma
GLM
GPT-OSS
- GPT OSS
Kimi
- Kimi K2
- Kimi-K2.5-VL
Llama
- Llama 2
- Llama 3
MiniMax
- MiniMax-M2
Mistral
- Mistral
- Ministral 3
Xiaomi-MiMo
- Xiaomi-MiMo
Moonlight
- Moonlight
Nemotron
OLMoE
- OLMoE
Qwen
- Qwen
- Qwen3-MoE
- Qwen3-Next
- Qwen2.5-VL
- Qwen3-VL
- Qwen 3.5 / 3.6
- Qwen2-Audio
- Qwen2.5-Omni
- Qwen3-Omni
- Qwen3-ASR
Sarvam
- Sarvam
StepFun
- Step-3.5-Flash

Training and Customization

Configuration Overview
Training Entry Points
Data Preparation
Training Loop Configuration
Optimizer and Scheduler Configuration
Logging and Monitoring
Profiling
Theoretical Memory Estimator
Checkpointing
Megatron FSDP
Resiliency
Mixed Precision Training
CUDA Graphs
Hierarchical Context Parallel
Communication Overlap
Attention Optimizations
Activation Recomputation
CPU Offloading
MoE Training Optimization
Parameter-Efficient Fine-Tuning (PEFT)
Packed Sequences
Multi-Token Prediction (MTP)
Callbacks

Model Optimization with ModelOpt

Quantization
Knowledge Distillation
Pruning

Development

Contribute a New Model to Megatron Bridge
Adapting Megatron Bridge in Reinforcement Learning Frameworks
Documentation Development
API Reference
- bridge

Releases

Release Developer Guide
Cherrypick Policy
Software Component Versions
Changelog
Known Issues

Agent Skills

Agent Skills Reference

Directory Readme Files

Megatron Bridge Documentation
Releases
Training and Customization
Model Optimization

API Reference
bridge
bridge.diffusion
bridge.diffusion.recipes

`bridge.diffusion.recipes`#

Subpackages#

bridge.diffusion.recipes.nemotron_labs_diffusion
- bridge.diffusion.recipes.nemotron_labs_diffusion.ar_to_dlm
- bridge.diffusion.recipes.nemotron_labs_diffusion.continuous_pretraining
bridge.diffusion.recipes.flux
- bridge.diffusion.recipes.flux.flux
bridge.diffusion.recipes.wan
- bridge.diffusion.recipes.wan.wan

previous

bridge.diffusion

next

bridge.diffusion.recipes.nemotron_labs_diffusion

On this page

Subpackages

Privacy Policy | Your Privacy Choices | Terms of Service | Accessibility | Corporate Policies | Product Security | Contact

Copyright © 2026, NVIDIA Corporation.