🌐Modelos multimodales

Descripción / Función

LLM especializado en imágenes y videos

Nombre modelo

Salamandra-VL-7B-2512

Comentario

Nueva versión de la familia de modelos de visión Salamandra y presenta importantes mejoras en su arquitectura y entrenamiento. Incorpora un codificador de imágenes SigLIP 2 Giantarrow-up-right, utiliza la base de Salamandra 7Barrow-up-right ajustada con datos de instrucciones recientes y un enfoque especial en lenguas europeas, y mejora su comprensión visual gracias a la integración de los conjuntos de datos PixMoarrow-up-right, que refuerzan el anclaje visual preciso y las capacidades de conteo.

Descripción / Función

LLM especializado en imágenes y videos

Nombre modelo

salamandra-7b-vision

Comentario

Modelo salamandra-7b adaptado para el procesamiento de imágenes y videos.

Descripción / Función

Traducción de voz a texto

Nombre modelo

SalamandraTAV-7b

Comentario

Versión ajustada de salamandraTA-7b-instructarrow-up-right, que utiliza mhubert-base-25hzarrow-up-right como codificador de voz. Ha sido entrenado con 12.000 horas de datos de reconocimiento de voz, 900 horas de datos de traducción de voz a texto y 113 millones de tokens de traducción de texto a texto para mantener el rendimiento del modelo original.

Descripción / Función

Modelo multimodal y muiltilingüe instruido

Nombre modelo

Latxa Qwen-3 VL 2B

Comentario

Modelo multimodal y multilingüe instruido, adaptado al euskera y construido sobre Qwen3-VL-2B-Instructarrow-up-right.

EL modelo ha sido entrenado con un corpus en euskera de 4,3 millones de documentos, así como un corpus de tamaño equivalente en Catalán y Gallego.

Descripción / Función

Modelo multimodal y muiltilingüe instruido

Nombre modelo

Latxa Qwen-3 VL 4B

Comentario

Modelo multimodal y multilingüe instruido, adaptado al euskera y construido sobre Qwen3-VL-4B-Instructarrow-up-right.

EL modelo ha sido entrenado con un corpus en euskera de 4,3 millones de documentos, así como un corpus de tamaño equivalente en Catalán y Gallego.

Última actualización