🔠Models de text
Model massiu (LLM) generatiu de propòsit general (instruit)
FLOR (Bloom) 7B Instruit
Model generatiu trilingüe (ca,es,en) generatiu basat en Bloom entrenat amb 140B de tokens. Pot realitzar tasques de generació de text perquè està ajustat per a escenaris específics, com ara resum, resposta a preguntes, escriptura creativa, etc.
Model massiu (LLM) generatiu de propòsit general (sense instruir)
FLOR (Bloom) 7B
Model generatiu trilingüe (ca,es,en) generatiu basat en Bloom entrenat amb 140B de tokens.
Model massiu (LLM) generatiu de propòsit general (instruit)
FLOR (Bloom) 1.3B Instruit
Model generatiu trilingüe (ca,es,en) basat en Bloom entrenat amb 26B de tokens. Pot realitzar tasques de generació de text perquè està ajustat per a escenaris específics, com ara resum, resposta a preguntes, escriptura creativa, etc
Model massiu (LLM) generatiu de propòsit general (sense instruir)
FLOR (Bloom) 1.3B
Model generatiu trilingüe (ca,es,en) basat en Bloom entrenat amb 26B de tokens.
Model sentence-transformer
ST-NLI-c
Mapeja frases i paràgrafs a un espai vectorial dens de 768 dimensions. Es pot utilitzar per a tasques com l'agrupació o la cerca semàntica. Entrenaments amb mes dades del catalá dels embeddings paraphrase-multilingual-mpnet-base-v2
Model Longformer
Longformer base 4096 v2 base model
Model Longformer basat en el model RoBERTa-large que permet inputs de fins a 4096 tokens.
Model de llenguatge basat en transformers
RoBERTa base v2 base model
Model basat en el model RoBERTA
Classificació textual
RoBERTa based v2 fine-tuned for TeCla-based Text Classification
Model per avaluar la classificació textual
Implicació textual
RoBERTa base v2 fine-tuned for TE
El model roberta-base-ca-v2-cased-te es pot utilitzar per reconèixer la implicació textual (Textual Entailment).
Similitud textual semàntica
RoBERTa base v2 fine-tuned for STS
El model roberta-base-ca-v2-cased-sts es pot utilitzar per avaluar la similitud entre dos fragments de text
Classificació d’intents
RoBERTa base v2 fine-tuned for Intent Classification
Aquest model es pot utilitzar per a la predicció d'intents en frases de text
Model de llenguatge basat en transformers
RoBERTa large v2
Model basat en el model RoBERTA large
Paràfrasi
RoBERTa large v2 fine-tuned for Paraphrase Detection
El model roberta-large-ca-parafrase es pot utilitzar per detectar si dues frases estan en una relació de paràfrasi.
Classificació d’intents
RoBERTa large v2 fine-tuned for Intent Classification
Aquest model es pot utilitzar per a la predicció d'intents en frases de text
Identificació d’entitats
RoBERTa large fine-tuned for Named Entity Recognition
Model de reconeixement d'entitats nomenades en català
Identificació d’entitats i conceptes
DEBERTA_CIEL
El DEBERTA_CIEL és un model de reconeixement d'entitats nomenades multilingüe (NER). S'ha entrenat amb el corpus CEIL. Demo
Word embeddings Floret per al catalá
Entrenats amb un corpus textual català de més de 34 GB de dades utilitzant Floret
Last updated