🔠Modelos de texto

Modelos listos para usar (instruidos)

_{Descripción / Función}

Modelo de lenguaje de gran escala (LLM) de propósito general (instruido)

_{Nombre modelo}

salamandra-7b-instruct

_{Model card}

https://huggingface.co/BSC-LT/salamandra-7b-instruct

_Comentarios

Modelo salamandra-7b entrenado con 276 mil instrucciones en inglés, español y catalán, recopiladas de diversos corpus abiertos.

_{Descripción / Función}

Modelo de lenguaje de gran escala (LLM) de propósito general (instruido)

_{Nombre modelo}

salamandra-2b-instruct

_{Model card}

https://huggingface.co/BSC-LT/salamandra-2b-instruct

_Comentarios

Modelo salamandra-2b entrenado con 276 mil instrucciones en inglés, español y catalán, recopiladas de diversos corpus abiertos.

Modelos para desarrolladores (fundacionales y para fine-tuning)

Descripción / Función

Modelo de lenguaje de gran escala (LLM) de propósito general (modelo fundacional)

Nombre modelo

ALIA-40b

Model card

https://huggingface.co/BSC-LT/ALIA-40b

Comentarios

Modelo generativo multilingüe, entrenado desde cero en 35 idiomas europeos, con 40 mil millones de parámetros y 9,37 billones de tokens.

Descripción / Función

Modelo de lenguaje de gran escala (LLM) especializado en imágenes y videos

Nombre modelo

salamandra-7b-vision

Model card

https://huggingface.co/BSC-LT/salamandra-7b-vision

Comentarios

Modelo salamandra-7b adaptado para el procesamiento de imágenes y videos.

Descripción / Función

Modelo de lenguaje de gran escala (LLM) de propósito general (modelo fundacional)

Nombre modelo

salamandra-7b

Model card

https://huggingface.co/BSC-LT/salamandra-7b

Comentarios

Modelo generativo multilingüe, entrenado desde cero en 35 idiomas europeos, con 7 mil millones de parámetros y 12,875 billones de tokens.

Descripción / Función

Modelo de lenguaje de gran escala (LLM) de propósito general (modelo fundacional)

Nombre modelo

salamandra-2b

Model card

https://huggingface.co/BSC-LT/salamandra-2b

Comentarios

Modelo generativo multilingüe, entrenado desde cero en 35 idiomas europeos, con 2 mil millones de parámetros y 12,875 billones de tokens.

Descripción / Función

Modelo transformer

Nombre modelo

mRoBERTa

Model card

https://huggingface.co/BSC-LT/mRoBERTa

Comentarios

Modelo RoBERTa multilingüe, entrenado en 35 idiomas y 92 lenguajes de programación, con un volumen total de 12,8 TB de datos.

Descripción / Función

Modelo transformer

Nombre modelo

RoBERTa-ca

Model card

https://huggingface.co/BSC-LT/RoBERTa-ca

Comentarios

Modelo para catalán basado en RoBERTa, con pesos inicializados desde mRoBERTa y ajustes en embeddings para diferencias de tokenización. Preentrenado de forma continua con 95 GB de datos en catalán de alta calidad.

Descripción / Función

Modelo de lenguaje de gran escala (LLM) de propósito general (modelo fundacional)

Nombre modelo

Aitana-2B-S

Model card

https://huggingface.co/gplsi/Aitana-2B-S

Comentarios

Modelo de lenguaje generativo base de generación de texto, entrenado con base en Salamandra-2B, utilizando datos en valenciano para lograr una mayor representación de esta lengua minoritaria, muy similar al catalán.

Adaptación de modelos para tareas específicas

_{Descripción / Función}

Detección de fraudes

_{Nombre modelo}

mRoBERTa_FT1_DFT1_fraude_phishing

_{Model card}

https://huggingface.co/gplsi/mRoBERTa_FT1_DFT1_fraude_phishing

_Comentarios

Modelo fine-tuneado a partir de BSC-LT/mRoBERTa para la clasificación binaria de la detección de phishing en textos en inglés. Predice si un determinado SMS o correo electrónico pertenece o no a la categoría de phishing.

AnteriorInicio - ALIA Kit SiguienteModelos de Voz

Última actualización hace 7 días