`bridge.recipes.qwen_vl.qwen25_vl_dataset`#

Module Contents#

`MockQwen25VLDataset`	Mock vision-language dataset for Qwen2.5-VL that yields text+image samples.
`MockQwen25VLDatasetProvider`	DatasetProvider for a mock Qwen2.5-VL vision-language dataset.

class bridge.recipes.qwen_vl.qwen25_vl_dataset.MockQwen25VLDataset(size: int, config: Any)#

Bases: torch.utils.data.Dataset

Mock vision-language dataset for Qwen2.5-VL that yields text+image samples.

Each sample contains:

Initialization

_build_inputs() → Tuple[torch.Tensor, Optional[torch.Tensor], Optional[torch.Tensor]]#

class bridge.recipes.qwen_vl.qwen25_vl_dataset.MockQwen25VLDatasetProvider#

Bases: megatron.bridge.training.config.DatasetProvider

DatasetProvider for a mock Qwen2.5-VL vision-language dataset.

Builds train/valid/test datasets using a HF AutoProcessor and the MockQwen25VLDataset implementation.

build_datasets( context: megatron.bridge.training.config.DatasetBuildContext, )#

Create mock Qwen2.5-VL datasets for train/valid/test splits.