Skip to main content

Ctrl+K

Megatron Core

GitHub

Megatron Core

GitHub

Table of Contents

About Megatron Core

Overview
Release Notes

Get Started

Installation
Your First Training Run

Basic Usage

Data Preparation
Training Examples
Parallelism Strategies Guide

Supported Models

Supported Models

Advanced Features

Mixture of Experts
context_parallel package
Megatron FSDP
Distributed Optimizer
Optimizer CPU Offload
Custom Pipeline Model Parallel Layout
Fine-grained Activation Offloading (collaborated with rednote)
Megatron Energon
Megatron RL
Tokenizers

Developer Guide

Contributing to Megatron-LM
How to Submit a PR
Oncall Overview
Generating Docs Locally

API Reference

API Guide
API Reference
- core

Resources

Discussions

Advanced Features

Is this page helpful?

Advanced Features#

Advanced feature guides for key Megatron Core capabilities.

Fine-grained Activation Offloading (collaborated with rednote)
Mixture of Experts
Megatron Core MoE
context_parallel package
Megatron FSDP
Distributed Optimizer
Optimizer CPU Offload
- How to use ?
- Configuration Recommendations
Custom Pipeline Model Parallel Layout
Tokenizers
Megatron Energon
Megatron RL

Privacy Policy | Your Privacy Choices | Terms of Service | Accessibility | Corporate Policies | Product Security | Contact

Copyright © 2026, NVIDIA Corporation.