Is this page helpful?

Index

_ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | Y | Z

_

A

B

C

cache_index_file() (in module core.datasets.object_storage_utils)
cache_mla_latents (core.transformer.transformer_config.MLATransformerConfig attribute)
CachedMetadataFileSystemReader (class in core.dist_checkpointing.strategies.cached_metadata_filesystem_reader)
calculate_cross_entropy_loss() (core.tensor_parallel.cross_entropy.VocabParallelCrossEntropy static method)
- (in module core.fusions.fused_cross_entropy)
calculate_gradients() (core.tensor_parallel.cross_entropy.VocabParallelCrossEntropy static method)
- (in module core.fusions.fused_cross_entropy)
calculate_log_probs() (core.inference.contexts.dynamic_context.DynamicInferenceContext method)
calculate_logits_max() (core.tensor_parallel.cross_entropy.VocabParallelCrossEntropy static method)
- (in module core.fusions.fused_cross_entropy)
calculate_per_token_loss (core.transformer.transformer_config.TransformerConfig attribute)
calculate_predicted_logits() (core.tensor_parallel.cross_entropy.VocabParallelCrossEntropy static method)
- (in module core.fusions.fused_cross_entropy)
Call (class in core.rerun_state_machine)
call_ddp_preforward_hook() (core.transformer.cuda_graphs.CudaGraphManager method)
call_idx (core.dist_checkpointing.strategies.async_utils.AsyncRequest attribute)
Caller (class in core.rerun_state_machine)
caller (core.rerun_state_machine.Call attribute)
can_handle_sharded_objects (core.dist_checkpointing.strategies.base.LoadStrategyBase property)
- (core.dist_checkpointing.strategies.base.SaveStrategyBase property)
capture_finished() (core.transformer.cuda_graphs.TECudaGraphHelper method)
capture_reuse_count (core.transformer.cuda_graphs.CudagraphBufferMetadata attribute)
cat_with_oom_fallback() (in module core.transformer.utils)
causal (core.transformer.enums.AttnMaskType attribute)
causal_bottom_right (core.transformer.enums.AttnMaskType attribute)
causal_conv1d_update() (in module core.ssm.ops.causal_conv1d_triton)
causal_conv1d_update_kernel() (in module core.ssm.ops.causal_conv1d_triton)
causal_conv1d_varlen_fn() (in module core.ssm.ops.causal_conv1d_varlen)
ChainedOptimizer (class in core.optimizer.optimizer)
ChatCompletionRequest (in module core.tokenizers.text.parsers.qwen3_coder_tool_parser)
ChatCompletionToolsParam (in module core.tokenizers.text.parsers.qwen3_coder_tool_parser)
check_availability() (core.inference.contexts.dynamic_context.DynamicInferenceContext method)
check_backend_compatibility() (core.dist_checkpointing.strategies.base.LoadStrategyBase method)
check_config_overrides_consistency() (in module core.optimizer)
check_first_val_step() (in module core.pipeline_parallel.schedules)
check_flashinfer_jit_cache_installed() (in module core.inference.utils)
check_for_large_grads (core.distributed.distributed_data_parallel_config.DistributedDataParallelConfig attribute)
check_for_nan_in_grad (core.distributed.distributed_data_parallel_config.DistributedDataParallelConfig attribute)
- (core.distributed.fsdp.src.megatron_fsdp.distributed_data_parallel_config.DistributedDataParallelConfig attribute)
check_gpu_memory() (in module core.distributed.fsdp.src.megatron_fsdp.param_and_grad_buffer)
check_grads() (core.distributed.param_and_grad_buffer._ParamAndGradBucketGroup method)
check_is_distributed_checkpoint() (in module core.dist_checkpointing.core)
check_moe_overflow() (core.transformer.moe.paged_stash.PagedStashRunner method)
check_over_budget() (core.transformer.moe.token_dispatcher.MoEFlexTokenDispatcher method)
check_paged_stash_host_spill() (in module core.transformer.moe.paged_stash)
check_paged_stash_overflow() (in module core.transformer.moe.paged_stash)
check_param_hashes_across_dp_replicas() (in module core.utils)
check_version_compatibility() (core.dist_checkpointing.strategies.base.LoadStrategyBase method)
checkpoint() (core.inference.inference_request.DynamicInferenceRequestRecord method)
- (core.tensor_parallel.random.CheckpointWithoutOutput method)
- (in module core.tensor_parallel.random)
checkpoint_fully_reshardable_formats (core.optimizer.distrib_optimizer.DistributedOptimizer attribute)
checkpoint_id (core.dist_checkpointing.strategies.filesystem_async.FileSystemWriterAsync property)
CheckpointableShardedTensor (class in core.dist_checkpointing.strategies.checkpointable)
checkpointed_forward() (in module core.recompute)
CheckpointFunction (class in core.tensor_parallel.random)
CheckpointingConfig (class in core.dist_checkpointing.core)
CheckpointingException
CheckpointWithoutOutput (class in core.tensor_parallel.random)
CheckpointWithoutOutputFunction (class in core.tensor_parallel.random)
choices() (core.fault_injector._FaultInjectorRNG method)
chunk_size_factor (core.distributed.fsdp.src.megatron_fsdp.param_and_grad_buffer.ParameterGroup attribute)
chunk_state_varlen() (in module core.ssm.ops.ssd_chunk_state)
ChunkOffloadHandler (class in core.pipeline_parallel.fine_grained_activation_offload)
CkptShardedMetadata (in module core.dist_checkpointing.serialization)
classification_head (core.datasets.bert_dataset.BERTMaskedWordPieceDatasetConfig attribute)
clean_loss_in_tracker() (core.transformer.multi_token_prediction.MTPLossLoggingHelper method)
clear() (core.pipeline_parallel.fine_grained_activation_offload.GPUTensorPool method)
- (core.transformer.moe.moe_logging.MoEMetricsTracker method)
- (core.transformer.moe.moe_utils.MoECudaGraphTensorStore method)
clear_all_caches() (in module core.resharding.refit)
clear_aux_losses_tracker() (in module core.transformer.moe.moe_utils)
clear_embedding_activation_buffer() (in module core.pipeline_parallel.schedules)
clear_global_indices() (core.transformer.moe.router_replay.RouterReplay static method)
clear_global_router_replay_action() (core.transformer.moe.router_replay.RouterReplay static method)
clear_global_router_replay_instances() (core.transformer.moe.router_replay.RouterReplay static method)
clear_global_static_buffers() (core.transformer.moe.router_replay.RouterReplay static method)
clear_indices() (core.transformer.moe.router_replay.RouterReplay method)
clear_metadata_cache() (core.dist_checkpointing.strategies.cached_metadata_filesystem_reader.CachedMetadataFileSystemReader class method)
clear_plan_cache() (in module core.resharding.refit)
clear_requests() (core.resharding.nvshmem_copy_service.service.RemoteCopyService method)
clear_router_replay_action() (core.transformer.moe.router_replay.RouterReplay method)
clear_service_cache() (in module core.resharding.refit)
clear_static_buffer() (core.transformer.moe.router_replay.RouterReplay method)
client (core.inference.apis._llm_base._CoordinatorRuntime property)
clip_grad (core.optimizer.optimizer_config.OptimizerConfig attribute)
clip_grad_by_total_norm_fp32() (in module core.optimizer.clip_grads)
clip_grad_norm() (core.optimizer.optimizer.MegatronOptimizer method)
clip_qk() (core.transformer.attention.Attention method)
- (core.transformer.attention.SelfAttention method)
- (core.transformer.multi_latent_attention.MLASelfAttention method)
- (in module core.optimizer.qk_clip)
CLIPViTModel (class in core.models.vision.clip_vit_model)
clone_scatter_output_in_embedding (core.transformer.transformer_config.TransformerConfig attribute)
clone_tensors_in_struct() (in module core.full_cuda_graph)
close() (core.datasets.object_storage_utils.S3Client method)
- (core.dist_checkpointing.strategies.async_utils.AsyncCaller method)
- (core.dist_checkpointing.strategies.async_utils.AsyncCallsQueue method)
- (core.dist_checkpointing.strategies.async_utils.PersistentAsyncCaller method)
- (core.dist_checkpointing.strategies.async_utils.TemporalAsyncCaller method)
- (core.inference.engines.async_zmq_communicator.AsyncZMQCommunicator method)
- (core.resharding.copy_services.base.CopyService method)
- (core.resharding.copy_services.nvshmem_copy_service.NVSHMEMCopyService method)
cls (core.tokenizers.text.libraries.null_tokenizer.NullTokenizer property)
- (core.tokenizers.text.text_tokenizer.MegatronTokenizerText property)
- (core.tokenizers.vision.libraries.null_multimodal_tokenizer.MegatronNullMultimodalTokenizer property)
cls_id (core.tokenizers.text.libraries.abstract_tokenizer.MegatronTokenizerTextAbstract property)
- (core.tokenizers.text.libraries.huggingface_tokenizer.HuggingFaceTokenizer property)
- (core.tokenizers.text.libraries.sentencepiece_tokenizer.SentencePieceTokenizer property)
- (core.tokenizers.text.libraries.tiktoken_tokenizer.TikTokenTokenizer property)
- (core.tokenizers.text.text_tokenizer.MegatronTokenizerText property)
code_from_dtype() (core.datasets.indexed_dataset.DType class method)
collect_mxfp8_param_metadata() (in module core.inference.quantization.utils)
COLOCATED (core.models.mimo.config.role.ModuleLayout attribute)
ColocatedBridgeCommunicator (class in core.models.mimo.comm.colocated_communicator)
ColoredFormatter (class in core.resharding.nvshmem_copy_service.logger)
column_parallel_layer_norm_linear() (core.extensions.transformer_engine_spec_provider.TESpecProvider method)
- (core.models.backends.BackendSpecProvider method)
- (core.models.backends.InferenceSpecProvider method)
- (core.models.backends.LocalSpecProvider method)
column_parallel_linear() (core.extensions.transformer_engine_spec_provider.TESpecProvider method)
- (core.models.backends.BackendSpecProvider method)
- (core.models.backends.InferenceSpecProvider method)
- (core.models.backends.LocalSpecProvider method)
ColumnParallelLinear (class in core.tensor_parallel.layers)
combine() (core.rerun_state_machine.QuickStats method)
- (core.transformer.moe.moe_layer.MoELayer method)
- (core.transformer.moe.token_dispatcher._DeepepManager method)
- (core.transformer.moe.token_dispatcher._DispatchManager method)
- (core.transformer.moe.token_dispatcher._HybridEPManager method)
combine_param_group_overrides() (in module core.optimizer_param_scheduler)
combine_postprocess() (core.transformer.moe.token_dispatcher.MoEAllGatherTokenDispatcher method)
- (core.transformer.moe.token_dispatcher.MoEAlltoAllTokenDispatcher method)
- (core.transformer.moe.token_dispatcher.MoEFlexTokenDispatcher method)
- (core.transformer.moe.token_dispatcher.MoETokenDispatcher method)
- (core.transformer.moe.token_dispatcher_inference.NVLSAllGatherVDispatcher method)
combine_preprocess() (core.transformer.moe.token_dispatcher.MoEAllGatherTokenDispatcher method)
- (core.transformer.moe.token_dispatcher.MoEAlltoAllTokenDispatcher method)
- (core.transformer.moe.token_dispatcher.MoEFlexTokenDispatcher method)
- (core.transformer.moe.token_dispatcher.MoETokenDispatcher method)
- (core.transformer.moe.token_dispatcher_inference.NCCLAllGatherDispatcher method)
- (core.transformer.moe.token_dispatcher_inference.NVLSAllGatherVDispatcher method)
combined_1f1b_schedule_for_interleaved_pipelining() (in module core.pipeline_parallel.combined_1f1b)
combined_1f1b_schedule_for_no_pipelining() (in module core.pipeline_parallel.combined_1f1b)
combined_forward_backward_step() (in module core.pipeline_parallel.combined_1f1b)
commit_intermediate_states() (core.inference.contexts.mamba_slot_allocator.MambaSlotAllocator method)
commit_tensor() (core.dist_checkpointing.strategies.torch.MCoreLoadPlanner method)
common (core.dist_checkpointing.tensor_aware_state_dict.MCoreTensorAwareStateDict attribute)
common_backend (core.dist_checkpointing.core.CheckpointingConfig attribute)
common_backend_version (core.dist_checkpointing.core.CheckpointingConfig attribute)
common_state_dict (core.dist_checkpointing.tensor_aware_state_dict.MCoreTensorAwareStateDict property)
COMMON_STATE_FNAME (in module core.dist_checkpointing.strategies.common)
CommonStateDict (in module core.dist_checkpointing.mapping)
CommRole (class in core.pipeline_parallel.bridge_communicator)
communicate() (core.models.mimo.comm.colocated_communicator.ColocatedBridgeCommunicator method)
COMMUNICATING (core.distributed.fsdp.src.megatron_fsdp.param_and_grad_buffer.BucketStatus attribute)
CommunicationScheduler (class in core.resharding.nvshmem_copy_service.planning.communication_scheduler)
COMPARISON_MATCH (in module core.rerun_state_machine)
COMPARISON_MISMATCH (in module core.rerun_state_machine)
CompilationState (class in core.inference.unified_memory)
compile_allocator() (in module core.inference.unified_memory)
compile_helpers() (in module core.datasets.utils)
COMPLETED (core.inference.inference_request.Status attribute)
compute_and_store_offsets() (core.inference.contexts.mamba_slot_allocator.MambaSlotAllocator method)
compute_block_hashes_batched() (in module core.inference.inference_request)
compute_expert_offsets() (in module core.inference.moe.permute)
compute_full_param_layout() (core.optimizer.distrib_optimizer.DistributedOptimizer static method)
- (core.optimizer.layer_wise_optimizer.LayerWiseDistributedOptimizer static method)
compute_language_model_loss() (core.models.common.language_module.language_module.LanguageModule method)
compute_local_tokens_per_expert() (in module core.inference.moe.permute)
compute_mtp_single_step() (core.models.common.language_module.language_module.LanguageModule method)
compute_request_hashes() (core.inference.data_parallel_inference_coordinator.DataParallelInferenceCoordinator method)
compute_routing_scores_for_aux_loss() (in module core.transformer.moe.moe_utils)
compute_total_pipeline_stages() (core.pipeline_parallel.multimodule_communicator.MultiModulePipelineCommunicator static method)
condition_init_method() (in module core.extensions.transformer_engine)
config_attention_mask() (core.datasets.t5_dataset.T5MaskedWordPieceDataset static method)
CONFIG_FNAME (in module core.dist_checkpointing.core)
config_logger_dir (core.optimizer.optimizer_config.OptimizerConfig attribute)
- (core.transformer.transformer_config.TransformerConfig attribute)
config_to_kwargs (core.optimizer.emerging_optimizers.EmergingOptimizerEntry attribute)
configure() (core.utils.StragglerDetector method)
configure_fused_tp_inference() (core.transformer.transformer_layer.TransformerLayer method)
configure_nvtx_profiling() (in module core.utils)
configured (core.utils.StragglerDetector property)
CONNECT (core.inference.headers.Headers attribute)
CONNECT_ACK (core.inference.headers.Headers attribute)
ConstantGradScaler (class in core.optimizer.grad_scaler)
ConstantNumMicroBatchesCalculator (class in core.num_microbatches_calculator)
contains_submesh() (in module core.distributed.fsdp.src.megatron_fsdp.utils)
context (core.inference.apis._llm_base._MegatronLLMBase property)
context_parallel_size (core.datasets.gpt_dataset.GPTDatasetConfig attribute)
- (core.model_parallel_config.ModelParallelConfig attribute)
ContextErrorFactory (class in core.inference.contexts.dynamic_context)
ContextGPUView (class in core.inference.contexts.gpu_view)
ContextOverflowError
controller (core.inference.apis._llm_base._MegatronLLMBase property)
conv1d() (core.ssm.mamba_context_parallel.MambaContextParallel method)
conv1d_channels() (core.ssm.mamba_context_parallel.MambaContextParallel method)
conv_states_dtype (core.inference.config.MambaInferenceStateConfig attribute)
conv_states_shape (core.inference.config.MambaInferenceStateConfig attribute)
conversion_helper() (in module core.transformer.module)
convert() (core.export.trtllm.trtllm_weights_converter.distributed_trtllm_model_weights_converter.DistributedTRTLLMModelWeightsConverter method)
- (core.export.trtllm.trtllm_weights_converter.single_device_trtllm_model_weights_converter.SingleDeviceTRTLLMModelWeightsConverter method)
convert_cuda_rng_state() (in module core.tensor_parallel.random)
convert_schedule_table_to_order() (in module core.transformer.cuda_graphs)
convert_split_vector_to_split_matrix() (in module core.datasets.blended_megatron_dataset_config)
convert_tokens_to_ids() (core.tokenizers.vision.libraries.multimodal_tokenizer.MegatronMultimodalTokenizer method)
- (core.tokenizers.vision.libraries.null_multimodal_tokenizer.MegatronNullMultimodalTokenizer method)
- (core.tokenizers.vision.vision_tokenizer.MegatronTokenizerVision method)
coord_addr (core.inference.apis._llm_base._CoordinatorRuntime property)
copy_main_weights_to_model_weights() (core.distributed.fsdp.src.megatron_fsdp.param_and_grad_buffer.ParamAndGradBuffer method)
copy_signature() (in module core.typed_torch)
copy_tensor_model_parallel_attributes() (in module core.tensor_parallel.layers)
copy_tensors_in_struct() (in module core.full_cuda_graph)
copy_tensors_to_cpu() (core.dist_checkpointing.tensor_aware_state_dict.MCoreTensorAwareStateDict method)
copy_to_tensor_model_parallel_region() (in module core.tensor_parallel.mappings)
CopyService (class in core.resharding.copy_services.base)
core
- module
core._rank_utils
- module
core._slurm_utils
- module
core.activations
- module
core.config
- module
core.config_logger
- module
core.datasets
- module
core.datasets.bert_dataset
- module
core.datasets.blended_dataset
- module
core.datasets.blended_megatron_dataset_builder
- module
core.datasets.blended_megatron_dataset_config
- module
core.datasets.data_schedule
- module
core.datasets.gpt_dataset
- module
core.datasets.helpers
- module
core.datasets.indexed_dataset
- module
core.datasets.masked_dataset
- module
core.datasets.megatron_dataset
- module
core.datasets.multimodal_dataset
- module
core.datasets.object_storage_utils
- module
core.datasets.t5_dataset
- module
core.datasets.utils
- module
core.datasets.utils_s3
- module
core.dist_checkpointing
- module
core.dist_checkpointing.core
- module
core.dist_checkpointing.dict_utils
- module
core.dist_checkpointing.exchange_utils
- module
core.dist_checkpointing.mapping
- module
core.dist_checkpointing.optimizer
- module
core.dist_checkpointing.serialization
- module
core.dist_checkpointing.state_dict_utils
- module
core.dist_checkpointing.strategies
- module
core.dist_checkpointing.strategies.async_utils
- module
core.dist_checkpointing.strategies.base
- module
core.dist_checkpointing.strategies.cached_metadata_filesystem_reader
- module
core.dist_checkpointing.strategies.checkpointable
- module
core.dist_checkpointing.strategies.common
- module
core.dist_checkpointing.strategies.filesystem_async
- module
core.dist_checkpointing.strategies.fully_parallel
- module
core.dist_checkpointing.strategies.nvrx
- module
core.dist_checkpointing.strategies.state_dict_saver
- module
core.dist_checkpointing.strategies.torch
- module
core.dist_checkpointing.tensor_aware_state_dict
- module
core.dist_checkpointing.utils
- module
core.dist_checkpointing.validation
- module
core.distributed
- module
core.distributed.data_parallel_base
- module
core.distributed.distributed_data_parallel
- module
core.distributed.distributed_data_parallel_config
- module
core.distributed.finalize_model_grads
- module
core.distributed.fsdp
- module
core.distributed.fsdp.mcore_fsdp_adapter
- module
core.distributed.fsdp.src
- module
core.distributed.fsdp.src.megatron_fsdp
- module
core.distributed.fsdp.src.megatron_fsdp.distributed_data_parallel_config
- module
core.distributed.fsdp.src.megatron_fsdp.fully_shard
- module
core.distributed.fsdp.src.megatron_fsdp.megatron_fsdp
- module
core.distributed.fsdp.src.megatron_fsdp.mixed_precision
- module
core.distributed.fsdp.src.megatron_fsdp.package_info
- module
core.distributed.fsdp.src.megatron_fsdp.param_and_grad_buffer
- module
core.distributed.fsdp.src.megatron_fsdp.uneven_dtensor
- module
core.distributed.fsdp.src.megatron_fsdp.utils
- module
core.distributed.param_and_grad_buffer
- module
core.distributed.reduce_scatter_with_fp32_accumulation
- module
core.distributed.torch_fully_sharded_data_parallel
- module
core.distributed.torch_fully_sharded_data_parallel_config
- module
core.energy_monitor
- module
core.enums
- module
core.export
- module
core.export.data_type
- module
core.export.export_config
- module
core.export.model_type
- module
core.export.trtllm
- module
core.export.trtllm.engine_builder
- module
core.export.trtllm.engine_builder.trtllm_engine_builder
- module
core.export.trtllm.model_to_trllm_mapping
- module
core.export.trtllm.model_to_trllm_mapping.default_conversion_dict
- module
core.export.trtllm.trt_model_config
- module
core.export.trtllm.trt_model_type
- module
core.export.trtllm.trtllm_helper
- module
core.export.trtllm.trtllm_layers
- module
core.export.trtllm.trtllm_weights_converter
- module
core.export.trtllm.trtllm_weights_converter.distributed_trtllm_model_weights_converter
- module
core.export.trtllm.trtllm_weights_converter.single_device_trtllm_model_weights_converter
- module
core.export.trtllm.trtllm_weights_converter.utils
- module
core.extensions
- module
core.extensions.kitchen
- module
core.extensions.transformer_engine
- module
core.extensions.transformer_engine_spec_provider
- module
core.fault_injector
- module
core.fp4_utils
- module
core.fp8_utils
- module
core.full_cuda_graph
- module
core.fusions
- module
core.fusions.fused_bias_dropout
- module
core.fusions.fused_bias_geglu
- module
core.fusions.fused_bias_gelu
- module
core.fusions.fused_bias_swiglu
- module
core.fusions.fused_cross_entropy
- module
core.fusions.fused_indices_converter
- module
core.fusions.fused_layer_norm
- module
core.fusions.fused_mla_yarn_rope_apply
- module
core.fusions.fused_pad_routing_map
- module
core.fusions.fused_softmax
- module
core.fusions.fused_weighted_squared_relu
- module
core.hyper_comm_grid
- module
core.inference
- module
core.inference.apis
- module
core.inference.apis._llm_base
- module
core.inference.apis.async_llm
- module
core.inference.apis.llm
- module
core.inference.apis.serve_config
- module
core.inference.async_stream
- module
core.inference.batch_dimensions_utils
- module
core.inference.common_inference_params
- module
core.inference.communication_utils
- module
core.inference.config
- module
core.inference.contexts
- module
core.inference.contexts.base_context
- module
core.inference.contexts.dynamic_context
- module
core.inference.contexts.fused_kv_append_kernel
- module
core.inference.contexts.gpu_view
- module
core.inference.contexts.kv_block_allocator
- module
core.inference.contexts.mamba_slot_allocator
- module
core.inference.contexts.routing_metadata
- module
core.inference.contexts.static_context
- module
core.inference.data_parallel_inference_coordinator
- module
core.inference.engines
- module
core.inference.engines.abstract_engine
- module
core.inference.engines.async_zmq_communicator
- module
core.inference.engines.dynamic_engine
- module
core.inference.engines.mcore_engine
- module
core.inference.engines.static_engine
- module
core.inference.headers
- module
core.inference.inference_client
- module
core.inference.inference_request
- module
core.inference.model_inference_wrappers
- module
core.inference.model_inference_wrappers.abstract_model_inference_wrapper
- module
core.inference.model_inference_wrappers.gpt
- module
core.inference.model_inference_wrappers.gpt.gpt_inference_wrapper
- module
core.inference.model_inference_wrappers.t5
- module
core.inference.model_inference_wrappers.t5.t5_inference_wrapper
- module
core.inference.moe
- module
core.inference.moe.activations
- module
core.inference.moe.fused_moe
- module
core.inference.moe.metadata
- module
core.inference.moe.permute
- module
core.inference.moe.vllm_fused_moe
- module
core.inference.quantization
- module
core.inference.quantization.mxfp8_quantize
- module
core.inference.quantization.mxfp8_tensor
- module
core.inference.quantization.utils
- module
core.inference.sampling
- module
core.inference.sampling.base
- module
core.inference.sampling.flashinfer_sampling
- module
core.inference.sampling.torch_sampling
- module
core.inference.sampling_params
- module
core.inference.scheduler
- module
core.inference.symmetric_memory
- module
core.inference.text_generation_controllers
- module
core.inference.text_generation_controllers.encoder_decoder_text_generation_controller
- module
core.inference.text_generation_controllers.mtp_utils_pytorch
- module
core.inference.text_generation_controllers.mtp_utils_triton
- module
core.inference.text_generation_controllers.text_generation_controller
- module
core.inference.text_generation_controllers.vlm_text_generation_controller
- module
core.inference.text_generation_server
- module
core.inference.text_generation_server.dynamic_text_gen_server
- module
core.inference.text_generation_server.dynamic_text_gen_server.endpoints
- module
core.inference.text_generation_server.dynamic_text_gen_server.endpoints.chat_completions
- module
core.inference.text_generation_server.dynamic_text_gen_server.endpoints.common
- module
core.inference.text_generation_server.dynamic_text_gen_server.endpoints.completions
- module
core.inference.text_generation_server.dynamic_text_gen_server.endpoints.health
- module
core.inference.text_generation_server.dynamic_text_gen_server.text_generation_server
- module
core.inference.text_generation_server.dynamic_text_gen_server.tokenization
- module
core.inference.text_generation_server.run_mcore_engine
- module
core.inference.text_generation_server.text_generation_server
- module
core.inference.text_generation_server.tokenization
- module
core.inference.unified_memory
- module
core.inference.utils
- module
core.inference_params
- module

core.jit
- module
core.model_parallel_config
- module
core.models
- module
core.models.backends
- module
core.models.bert
- module
core.models.bert.bert_layer_specs
- module
core.models.bert.bert_lm_head
- module
core.models.bert.bert_model
- module
core.models.bert.pooler
- module
core.models.common
- module
core.models.common.embeddings
- module
core.models.common.embeddings.language_model_embedding
- module
core.models.common.embeddings.relative_pos_embedding
- module
core.models.common.embeddings.rope_utils
- module
core.models.common.embeddings.rotary_pos_embedding
- module
core.models.common.embeddings.yarn_rotary_pos_embedding
- module
core.models.common.language_module
- module
core.models.common.language_module.language_module
- module
core.models.common.model_chunk_schedule_plan
- module
core.models.common.vision_module
- module
core.models.common.vision_module.vision_module
- module
core.models.gpt
- module
core.models.gpt.experimental_attention_variant_module_specs
- module
core.models.gpt.fine_grained_callables
- module
core.models.gpt.gpt_layer_specs
- module
core.models.gpt.gpt_model
- module
core.models.gpt.moe_module_specs
- module
core.models.huggingface
- module
core.models.huggingface.clip_model
- module
core.models.huggingface.fastconformer_model
- module
core.models.huggingface.module
- module
core.models.huggingface.qwen_model
- module
core.models.hybrid
- module
core.models.hybrid.hybrid_block
- module
core.models.hybrid.hybrid_layer_allocation
- module
core.models.hybrid.hybrid_layer_specs
- module
core.models.hybrid.hybrid_model
- module
core.models.mamba
- module
core.models.mamba.mamba_layer_specs
- module
core.models.mamba.mamba_model
- module
core.models.mimo
- module
core.models.mimo.comm
- module
core.models.mimo.comm.colocated_communicator
- module
core.models.mimo.config
- module
core.models.mimo.config.base_configs
- module
core.models.mimo.config.role
- module
core.models.mimo.model
- module
core.models.mimo.model.base
- module
core.models.mimo.optimizer
- module
core.models.multimodal
- module
core.models.multimodal.context_parallel
- module
core.models.multimodal.llava_model
- module
core.models.multimodal.llava_spec
- module
core.models.T5
- module
core.models.T5.t5_model
- module
core.models.T5.t5_spec
- module
core.models.vision
- module
core.models.vision.clip_vit_model
- module
core.models.vision.multimodal_projector
- module
core.models.vision.radio
- module
core.models.vision.vit_layer_specs
- module
core.msc_utils
- module
core.nccl_allocator
- module
core.num_microbatches_calculator
- module
core.optimizer
- module
core.optimizer.clip_grads
- module
core.optimizer.cpu_offloading
- module
core.optimizer.cpu_offloading.hybrid_optimizer
- module
core.optimizer.distrib_optimizer
- module
core.optimizer.emerging_optimizers
- module
core.optimizer.grad_scaler
- module
core.optimizer.layer_wise_optimizer
- module
core.optimizer.muon
- module
core.optimizer.optimizer
- module
core.optimizer.optimizer_config
- module
core.optimizer.optimizer_cuda_graph
- module
core.optimizer.param_layout
- module
core.optimizer.qk_clip
- module
core.optimizer_param_scheduler
- module
core.package_info
- module
core.packed_seq_params
- module
core.parallel_state
- module
core.pipeline_parallel
- module
core.pipeline_parallel.bridge_communicator
- module
core.pipeline_parallel.combined_1f1b
- module
core.pipeline_parallel.fine_grained_activation_offload
- module
core.pipeline_parallel.hybrid_cp_schedule
- module
core.pipeline_parallel.multimodule_communicator
- module
core.pipeline_parallel.p2p_communication
- module
core.pipeline_parallel.schedules
- module
core.pipeline_parallel.utils
- module
core.post_training
- module
core.post_training.modelopt
- module
core.post_training.modelopt.gpt
- module
core.post_training.modelopt.gpt.model_specs
- module
core.post_training.modelopt.gpt.state_dict_hooks
- module
core.post_training.modelopt.hybrid
- module
core.post_training.modelopt.hybrid.model_specs
- module
core.post_training.modelopt.layers
- module
core.post_training.modelopt.mamba
- module
core.post_training.modelopt.mamba.model_specs
- module
core.process_groups_config
- module
core.quantization
- module
core.quantization.quant_config
- module
core.quantization.utils
- module
core.recompute
- module
core.rerun_state_machine
- module
core.resharding
- module
core.resharding.copy_services
- module
core.resharding.copy_services.base
- module
core.resharding.copy_services.gloo_copy_service
- module
core.resharding.copy_services.nccl_copy_service
- module
core.resharding.copy_services.nvshmem_copy_service
- module
core.resharding.execution
- module
core.resharding.nvshmem_copy_service
- module
core.resharding.nvshmem_copy_service.compat
- module
core.resharding.nvshmem_copy_service.core
- module
core.resharding.nvshmem_copy_service.core.gpu_resource_manager
- module
core.resharding.nvshmem_copy_service.core.kernel_launcher
- module
core.resharding.nvshmem_copy_service.core.pipeline_executor
- module
core.resharding.nvshmem_copy_service.logger
- module
core.resharding.nvshmem_copy_service.memory
- module
core.resharding.nvshmem_copy_service.memory.double_buffer_manager
- module
core.resharding.nvshmem_copy_service.memory.tensor_pointer_utils
- module
core.resharding.nvshmem_copy_service.nvshmem_types
- module
core.resharding.nvshmem_copy_service.planning
- module
core.resharding.nvshmem_copy_service.planning.communication_scheduler
- module
core.resharding.nvshmem_copy_service.planning.gpu_execution_planner
- module
core.resharding.nvshmem_copy_service.planning.task_segmenter
- module
core.resharding.nvshmem_copy_service.planning.workload_packer
- module
core.resharding.nvshmem_copy_service.service
- module
core.resharding.nvshmem_copy_service.validation
- module
core.resharding.planner
- module
core.resharding.refit
- module
core.resharding.transforms
- module
core.resharding.utils
- module
core.safe_globals
- module
core.ssm
- module
core.ssm.gated_delta_net
- module
core.ssm.mamba_block
- module
core.ssm.mamba_context_parallel
- module
core.ssm.mamba_hybrid_layer_allocation
- module
core.ssm.mamba_layer
- module
core.ssm.mamba_mixer
- module
core.ssm.mlp_layer
- module
core.ssm.ops
- module
core.ssm.ops.causal_conv1d_triton
- module
core.ssm.ops.causal_conv1d_varlen
- module
core.ssm.ops.determinism
- module
core.ssm.ops.mamba_ssm
- module
core.ssm.ops.ssd_bmm
- module
core.ssm.ops.ssd_chunk_scan
- module
core.ssm.ops.ssd_chunk_state
- module
core.ssm.ops.ssd_combined
- module
core.ssm.ops.ssd_state_passing
- module
core.ssm.triton_cache_manager
- module
core.tensor_parallel
- module
core.tensor_parallel.cross_entropy
- module
core.tensor_parallel.data
- module
core.tensor_parallel.inference_layers
- module
core.tensor_parallel.layers
- module
core.tensor_parallel.mappings
- module
core.tensor_parallel.random
- module
core.tensor_parallel.utils
- module
core.timers
- module
core.tokenizers
- module
core.tokenizers.base_tokenizer
- module
core.tokenizers.megatron_tokenizer
- module
core.tokenizers.text
- module
core.tokenizers.text.libraries
- module
core.tokenizers.text.libraries.abstract_tokenizer
- module
core.tokenizers.text.libraries.bytelevel_tokenizer
- module
core.tokenizers.text.libraries.chat_template
- module
core.tokenizers.text.libraries.huggingface_tokenizer
- module
core.tokenizers.text.libraries.megatron_hf_tokenizer
- module
core.tokenizers.text.libraries.null_tokenizer
- module
core.tokenizers.text.libraries.sentencepiece_tokenizer
- module
core.tokenizers.text.libraries.sft_tokenizer
- module
core.tokenizers.text.libraries.tiktoken_tokenizer
- module
core.tokenizers.text.models
- module
core.tokenizers.text.models.bert_tokenizer
- module
core.tokenizers.text.models.default_tokenizer
- module
core.tokenizers.text.models.gpt_tokenizer
- module
core.tokenizers.text.models.mamba_tokenizer
- module
core.tokenizers.text.models.t5_tokenizer
- module
core.tokenizers.text.parsers
- module
core.tokenizers.text.parsers.base_parser
- module
core.tokenizers.text.parsers.deepseek_r1_reasoning_parser
- module
core.tokenizers.text.parsers.qwen3_coder_tool_parser
- module
core.tokenizers.text.text_tokenizer
- module
core.tokenizers.vision
- module
core.tokenizers.vision.libraries
- module
core.tokenizers.vision.libraries.multimodal_tokenizer
- module
core.tokenizers.vision.libraries.null_multimodal_tokenizer
- module
core.tokenizers.vision.models
- module
core.tokenizers.vision.models.default_tokenizer
- module
core.tokenizers.vision.vision_tokenizer
- module
core.transformer
- module
core.transformer.attention
- module
core.transformer.cuda_graph_config
- module
core.transformer.cuda_graphs
- module
core.transformer.custom_layers
- module
core.transformer.custom_layers.batch_invariant_kernels
- module
core.transformer.dot_product_attention
- module
core.transformer.enums
- module
core.transformer.fsdp_dtensor_checkpoint
- module
core.transformer.identity_op
- module
core.transformer.mlp
- module
core.transformer.module
- module
core.transformer.moe
- module
core.transformer.moe.experts
- module
core.transformer.moe.fused_a2a
- module
core.transformer.moe.moe_layer
- module
core.transformer.moe.moe_logging
- module
core.transformer.moe.moe_utils
- module
core.transformer.moe.paged_stash
- module
core.transformer.moe.router
- module
core.transformer.moe.router_replay
- module
core.transformer.moe.shared_experts
- module
core.transformer.moe.token_dispatcher
- module
core.transformer.moe.token_dispatcher_inference
- module
core.transformer.moe.upcycling_utils
- module
core.transformer.multi_latent_attention
- module
core.transformer.multi_token_prediction
- module
core.transformer.pipeline_parallel_layer_layout
- module
core.transformer.spec_utils
- module
core.transformer.torch_layer_norm
- module
core.transformer.torch_norm
- module
core.transformer.transformer_block
- module
core.transformer.transformer_config
- module
core.transformer.transformer_layer
- module
core.transformer.utils
- module
core.typed_torch
- module
core.utils
- module
core_attention (core.transformer.attention.CrossAttentionSubmodules attribute)
- (core.transformer.attention.SelfAttentionSubmodules attribute)
- (core.transformer.multi_latent_attention.MLASelfAttentionSubmodules attribute)
core_attention() (core.extensions.transformer_engine_spec_provider.TESpecProvider method)
- (core.models.backends.BackendSpecProvider method)
- (core.models.backends.InferenceSpecProvider method)
- (core.models.backends.LocalSpecProvider method)
CoreAttentionBuilder (class in core.transformer.attention)
CoreAttentionInterface (class in core.transformer.attention)
correct_amax_history_if_needed() (in module core.fp8_utils)
CORRECT_RESULT (core.rerun_state_machine.RerunDiagnostic attribute)
count_zeros() (core.models.mimo.optimizer.MimoOptimizer method)
- (core.optimizer.layer_wise_optimizer.LayerWiseDistributedOptimizer method)
- (core.optimizer.optimizer.ChainedOptimizer method)
- (core.optimizer.optimizer.MegatronOptimizer method)
count_zeros_fp32() (in module core.optimizer.clip_grads)
Counter (class in core.inference.utils)
cp (core.process_groups_config.ProcessGroupCollection attribute)
cp_comm_type (core.transformer.transformer_config.TransformerConfig attribute)
cp_group (core.packed_seq_params.PackedSeqParams attribute)
cp_stream (core.extensions.transformer_engine.TEDotProductAttention attribute)
cpu_offloading (core.model_parallel_config.ModelParallelConfig attribute)
cpu_offloading_activations (core.model_parallel_config.ModelParallelConfig attribute)
cpu_offloading_double_buffering (core.model_parallel_config.ModelParallelConfig attribute)
cpu_offloading_num_layers (core.model_parallel_config.ModelParallelConfig attribute)
cpu_offloading_retain_pinned_cpu_buffers (core.model_parallel_config.ModelParallelConfig attribute)
cpu_offloading_weights (core.model_parallel_config.ModelParallelConfig attribute)
cpu_tensor_pool (core.pipeline_parallel.fine_grained_activation_offload.PipelineOffloadManager property)
create_all_gather_groups() (in module core.parallel_state)
create_attention_mask (core.datasets.gpt_dataset.GPTDatasetConfig attribute)
create_bwd_graph() (core.transformer.cuda_graphs._CudaGraphRunner method)
create_cuda_graphs() (core.inference.engines.dynamic_engine.DynamicInferenceEngine method)
create_cudagraphs() (core.transformer.cuda_graphs._CudagraphGlobalRecord class method)
- (core.transformer.cuda_graphs.TECudaGraphHelper method)
- (in module core.transformer.cuda_graphs)
create_decentralized_global_plan() (core.dist_checkpointing.strategies.torch.MCoreSavePlanner method)
create_events() (core.resharding.nvshmem_copy_service.core.gpu_resource_manager.GPUResourceManager method)
create_fwd_graph() (core.transformer.cuda_graphs._CudaGraphRunner method)
create_gpu_plans() (core.resharding.nvshmem_copy_service.planning.gpu_execution_planner.GPUExecutionPlanner method)
create_group() (in module core.parallel_state)
create_hierarchical_groups() (in module core.parallel_state)
create_hybrid_dp_cp_groups() (in module core.parallel_state)
create_local_plan() (core.dist_checkpointing.strategies.torch.MCoreLoadPlanner method)
- (core.dist_checkpointing.strategies.torch.MCoreSavePlanner method)
create_mcore_cudagraph_manager() (core.models.hybrid.hybrid_model.HybridModel method)
- (core.ssm.mamba_layer.MambaLayer method)
- (core.transformer.transformer_layer.MoETransformerLayer method)
- (core.transformer.transformer_layer.TransformerLayer method)
create_nccl_mem_pool() (in module core.nccl_allocator)
create_pg() (core.hyper_comm_grid.HyperCommGrid method)
create_unified_mempool() (in module core.inference.unified_memory)
create_updated_function_signature() (in module core.distributed.fsdp.src.megatron_fsdp.utils)
critical() (core.resharding.nvshmem_copy_service.logger.PELogger class method)
cross_attention (core.transformer.transformer_layer.TransformerLayerSubmodules attribute)
cross_attn (core.transformer.enums.AttnType attribute)
cross_attn_bda (core.transformer.transformer_layer.TransformerLayerSubmodules attribute)
cross_entropy_fusion_impl (core.model_parallel_config.ModelParallelConfig attribute)
cross_entropy_loss_fusion (core.model_parallel_config.ModelParallelConfig attribute)
CrossAttention (class in core.transformer.attention)
CrossAttentionSubmodules (class in core.transformer.attention)
cu_kv_lengths() (core.inference.contexts.dynamic_context.DynamicInferenceContext method)
cu_query_lengths() (core.inference.contexts.dynamic_context.DynamicInferenceContext method)
cu_seqlens_kv (core.packed_seq_params.PackedSeqParams attribute)
cu_seqlens_kv_padded (core.packed_seq_params.PackedSeqParams attribute)
cu_seqlens_q (core.packed_seq_params.PackedSeqParams attribute)
cu_seqlens_q_padded (core.packed_seq_params.PackedSeqParams attribute)
cuda_dtoh_stream (core.transformer.moe.token_dispatcher.MoEAlltoAllTokenDispatcher attribute)
cuda_graph (core.full_cuda_graph.FullCudaGraphWrapper attribute)
- (core.optimizer.optimizer_cuda_graph.OptimizerCudaGraphWrapper attribute)
cuda_graph_all_prefills (core.inference.config.InferenceConfig attribute)
cuda_graph_attr_cache (in module core.transformer.utils)
cuda_graph_impl (core.transformer.transformer_config.TransformerConfig attribute)
cuda_graph_mixed_prefill_count (core.inference.config.InferenceConfig attribute)
cuda_graph_modules (core.transformer.transformer_config.TransformerConfig attribute)
CUDA_GRAPH_MODULES_DEPRECATIONS (in module core.transformer.cuda_graph_config)
cuda_graph_retain_backward_graph (core.transformer.transformer_config.TransformerConfig attribute)
CUDA_GRAPH_ROUNDER (core.inference.batch_dimensions_utils.CUDAGraphBatchDimensionBuilder attribute)
cuda_graph_scope (core.transformer.transformer_config.TransformerConfig attribute)
cuda_graph_set_manual_hooks() (core.transformer.cuda_graphs.TECudaGraphHelper method)
- (core.transformer.cuda_graphs.VisionTECudaGraphHelper method)
cuda_graph_use_single_mempool (core.transformer.transformer_config.TransformerConfig attribute)
cuda_graph_warmup_steps (core.transformer.transformer_config.TransformerConfig attribute)
cudagraph_created (core.transformer.cuda_graphs._CudagraphGlobalRecord attribute)
cudagraph_inference_record (core.transformer.cuda_graphs._CudagraphGlobalRecord attribute)
cudagraph_record (core.transformer.cuda_graphs._CudagraphGlobalRecord attribute)
cudagraph_reuse_ref_count (core.transformer.cuda_graphs.CudagraphBufferMetadata attribute)
CUDAGraphBatchDimensionBuilder (class in core.inference.batch_dimensions_utils)
CudagraphBufferMetadata (class in core.transformer.cuda_graphs)
CudaGraphManager (class in core.transformer.cuda_graphs)
CudaGraphModule (class in core.transformer.enums)
CudaGraphScope (class in core.transformer.enums)
CudaRNGStatesTracker (class in core.tensor_parallel.random)
cur_backward_chunk() (core.pipeline_parallel.fine_grained_activation_offload.PipelineOffloadManager method)
cur_forward_chunk() (core.pipeline_parallel.fine_grained_activation_offload.PipelineOffloadManager method)
curr_iter() (core.full_cuda_graph.FullCudaGraphWrapper method)
- (core.optimizer.optimizer_cuda_graph.OptimizerCudaGraphWrapper method)
curr_iteration (core.full_cuda_graph.FullCudaGraphWrapper attribute)
- (core.optimizer.optimizer_cuda_graph.OptimizerCudaGraphWrapper attribute)
current_input_and_position_ids() (core.inference.contexts.dynamic_context.DynamicInferenceContext method)
current_stage (core.pipeline_parallel.multimodule_communicator.MultiModulePipelineCommunicator property)
- (core.pipeline_parallel.p2p_communication.P2PCommunicator property)
custom (core.enums.Fp4Recipe attribute)
- (core.enums.Fp8Recipe attribute)
custom_backward() (in module core.pipeline_parallel.schedules)
custom_chat_template (core.tokenizers.text.libraries.sft_tokenizer.PromptConfig attribute)
custom_recipe_factory (core.extensions.transformer_engine.TEQuantizationRecipe attribute)

D

E

F

G

H

I

J

jit_fuser (in module core.jit)

JSONEncoderWithMcoreTypes (class in core.config_logger)

K

L

M

N

O

P

Q

R

S

T

U

V

W

Y

YarnRotaryEmbedding (class in core.models.common.embeddings.yarn_rotary_pos_embedding)

Z