`bridge.models.qwen_audio.qwen2_audio_provider`#

Qwen2-Audio Model Provider configurations for Megatron-Core.

This module provides configuration classes for Qwen2-Audio models, compatible with HuggingFace’s Qwen2-Audio model configurations.

Reference: https://huggingface.co/Qwen/Qwen2-Audio-7B-Instruct

Qwen2-Audio Key Features:

Module Contents#

Base model provider for Qwen2-Audio Models.

class bridge.models.qwen_audio.qwen2_audio_provider.Qwen2AudioModelProvider#

Bases: megatron.bridge.models.gpt_provider.GPTModelProvider

Base model provider for Qwen2-Audio Models.

Qwen2-Audio is a multimodal model combining a Whisper-like audio encoder with a Qwen2 language model for audio understanding tasks.

Reference:

Key Features:

provide( pre_process=None, post_process=None, vp_stage=None, ) → megatron.bridge.models.qwen_audio.modeling_qwen2_audio.Qwen2AudioModel#

Provide a Qwen2AudioModel instance with audio and language components.

Parameters:

Returns:

Qwen2AudioModel instance with HF audio encoder and Megatron language model

provide_language_model( pre_process=None, post_process=None, vp_stage=None, ) → megatron.core.models.gpt.GPTModel#

Provide just the language model component without audio.

Parameters:

Returns:

MCoreGPTModel instance (language model only)