🔠Models de text

Model massiu (LLM) generatiu de propòsit general (instruit)

FLOR (Bloom) 7B Instruit

Model generatiu trilingüe (ca,es,en) generatiu basat en Bloom entrenat amb 140B de tokens. Pot realitzar tasques de generació de text perquè està ajustat per a escenaris específics, com ara resum, resposta a preguntes, escriptura creativa, etc.

Model massiu (LLM) generatiu de propòsit general (sense instruir)

FLOR (Bloom) 7B

Model generatiu trilingüe (ca,es,en) generatiu basat en Bloom entrenat amb 140B de tokens.

Model massiu (LLM) generatiu de propòsit general (instruit)

FLOR (Bloom) 1.3B Instruit

Model generatiu trilingüe (ca,es,en) basat en Bloom entrenat amb 26B de tokens. Pot realitzar tasques de generació de text perquè està ajustat per a escenaris específics, com ara resum, resposta a preguntes, escriptura creativa, etc

Model massiu (LLM) generatiu de propòsit general (sense instruir)

FLOR (Bloom) 1.3B

Model generatiu trilingüe (ca,es,en) basat en Bloom entrenat amb 26B de tokens.

Model sentence-transformer

ST-NLI-c

Mapeja frases i paràgrafs a un espai vectorial dens de 768 dimensions. Es pot utilitzar per a tasques com l'agrupació o la cerca semàntica. Entrenaments amb mes dades del catalá dels embeddings paraphrase-multilingual-mpnet-base-v2

Model Longformer

Longformer base 4096 v2 base model

Model Longformer basat en el model RoBERTa-large que permet inputs de fins a 4096 tokens.

Model de llenguatge basat en transformers

RoBERTa base v2 base model

Model basat en el model RoBERTA

Classificació textual

RoBERTa based v2 fine-tuned for TeCla-based Text Classification

Model per avaluar la classificació textual

Implicació textual

RoBERTa base v2 fine-tuned for TE

El model roberta-base-ca-v2-cased-te es pot utilitzar per reconèixer la implicació textual (Textual Entailment).

Similitud textual semàntica

RoBERTa base v2 fine-tuned for STS

El model roberta-base-ca-v2-cased-sts es pot utilitzar per avaluar la similitud entre dos fragments de text

Classificació d’intents

RoBERTa base v2 fine-tuned for Intent Classification

Aquest model es pot utilitzar per a la predicció d'intents en frases de text

Model de llenguatge basat en transformers

RoBERTa large v2

Model basat en el model RoBERTA large

Paràfrasi

RoBERTa large v2 fine-tuned for Paraphrase Detection

El model roberta-large-ca-parafrase es pot utilitzar per detectar si dues frases estan en una relació de paràfrasi.

Classificació d’intents

RoBERTa large v2 fine-tuned for Intent Classification

Aquest model es pot utilitzar per a la predicció d'intents en frases de text

Identificació d’entitats

RoBERTa large fine-tuned for Named Entity Recognition

Model de reconeixement d'entitats nomenades en català

Identificació d’entitats i conceptes

DEBERTA_CIEL

El DEBERTA_CIEL és un model de reconeixement d'entitats nomenades multilingüe (NER). S'ha entrenat amb el corpus CEIL. Demo

Word embeddings Floret per al catalá

Entrenats amb un corpus textual català de més de 34 GB de dades utilitzant Floret

Last updated

© Projecte Aina | Language Technologies Unit at BSC