`bridge.models.llama_nemotron.llama_nemotron_provider`#

Module Contents#

Classes#

LlamaNemotronHeterogeneousProvider

Generic provider for heterogeneous (NAS) Llama-Nemotron models using DeciLMForCausalLM.

Functions#

heterogeneous_layer_spec

Determine the most appropriate layer specification based on availability.

Data#

logger

API#

bridge.models.llama_nemotron.llama_nemotron_provider.logger#: ‘getLogger(…)’

bridge.models.llama_nemotron.llama_nemotron_provider.heterogeneous_layer_spec( config, ) → megatron.core.transformer.spec_utils.ModuleSpec#

Determine the most appropriate layer specification based on availability.

Uses Transformer Engine specs since TE is a required dependency.

Parameters:: config – GPT configuration object
Returns:: The selected module specification
Return type:: ModuleSpec

class bridge.models.llama_nemotron.llama_nemotron_provider.LlamaNemotronHeterogeneousProvider#

Bases: megatron.bridge.models.gpt_provider.GPTModelProvider, megatron.bridge.models.transformer_config.HeterogeneousTransformerConfig