Models de traducció automàtica
Last updated
Last updated
SalamandraTA-7b-instruct
Model de traducció basat en SalamandraTA-7b-base, entrenat contínuament amb dades paral·leles (424 mil milios de tokens) i utilitzat internament. Cobreix 37 idiomes europeus i permet diverses tasques de traducció. Ha estat ajustat amb unes 135.000 instruccions, prioritzant el català, l’anglès i l’espanyol, amb dades addicionals per a llengües europees properes per millorar el rendiment global.
SalamandraTA-7b-instruct-GGUF
Versió quantificada en GGUF del model SalamandraTA-7b-instruct.
salamandraTA-2b
Plume256k
Plume128k
Plume32k
Català → Espanyol
aina-translator-ca-es
Espanyol → Català
aina-translator-es-ca
Català → Anglès
aina-translator-ca-en
Anglès → Català
aina-translator-en-ca
Català → Portuguès
aina-translator-ca-pt
Portuguès → Català
aina-translator-pt-ca
Català → Italià
aina-translator-ca-it
Italià → Català
aina-translator-it-ca
Català → Francès
aina-translator-ca-fr
Francès → Català
aina-translator-fr-ca
Català → Alemany
aina-translator-ca-de
Alemany → Català
aina-translator-de-ca
Català → Xinès
aina-translator-ca-zh
Xinès → Català
aina-translator-zh-ca
Gallec → Català
aina-translator-gl-ca
Basc → Català
aina-translator-eu-ca
Traducció automàtica multilingüe
Traducció automàtica multilingüe
Traducció automàtica multilingüe
Model entrenat amb 70.000 milions de tokens de dades paral·leles en 30 idiomes diferents. És el primer model de la sèrie SalamandraTA, està entrenat per a traducció automàtica a nivell de frases i paràgrafs.
Traducció automàtica multilingüe
Primer LLM entrenat des de zero per a traducció automàtica neuronal amb només dades paral·leles centrades en català. Té la mateixa arquitectura que .
Traducció automàtica multilingüe
Primer LLM entrenat des de zero per a traducció automàtica neuronal amb només dades paral·leles centrades en català. Té la mateixa arquitectura que .
Traducció automàtica multilingüe
Primer LLM entrenat des de zero per a traducció automàtica neuronal amb només dades paral·leles centrades en català. Té la mateixa arquitectura que .
Model de traducció català-espanyol entrenat des de zero amb i un conjunt de 92 milions de parells de frases.
Model de traducció espanyol-català entrenat des de zero amb i un conjunt de 92 milions de parells de frases.
Model de traducció català-anglès entrenat des de zero amb i un conjunt de 30.023.034 milions de parells de frases.
Model de traducció anglès-català entrenat des de zero amb i un conjunt de 30.023.034 milions de parells de frases.
Model de traducció català-portuguès entrenat des de zero amb i un conjunt d'aproximadament 100 milions de parells de frases, que inclou dades paral·leles autèntiques recollides de la web i dades paral·leles sintètiques creades amb el traductor .
Model de traducció portuguès-català entrenat des de zero amb i un conjunt d'aproximadament 100 milions de parells de frases, que inclou dades paral·leles autèntiques recollides de la web i dades paral·leles sintètiques creades amb el traductor .
Model de traducció català-italià entrenat des de zero amb i un conjunt d'aproximadament 100 milions de parells de frases, que inclou dades paral·leles autèntiques recollides de la web i dades paral·leles sintètiques creades amb el traductor .
Model de traducció italià-català entrenat des de zero amb i un conjunt d'aproximadament 100 milions de parells de frases, que inclou dades paral·leles autèntiques recollides de la web i dades paral·leles sintètiques creades amb el traductor .
Model de traducció català-francès entrenat des de zero amb i un conjunt d'aproximadament 100 milions de parells de frases, que inclou dades paral·leles autèntiques recollides de la web i dades paral·leles sintètiques creades amb el traductor .
Model de traducció francès-català entrenat des de zero amb i un conjunt d'aproximadament 100 milions de parells de frases, que inclou dades paral·leles autèntiques recollides de la web i dades paral·leles sintètiques creades amb el traductor .
Model de traducció català-alemany entrenat des de zero amb i un conjunt d'aproximadament 100 milions de parells de frases, que inclou dades paral·leles autèntiques recollides de la web i dades paral·leles sintètiques creades amb el traductor .
Model de traducció alemany-català entrenat des de zero amb i un conjunt d'aproximadament 100 milions de parells de frases, que inclou dades paral·leles autèntiques recollides de la web i dades paral·leles sintètiques creades amb el traductor .
Model de traducció català-xinès entrenat des de zero amb i un conjunt de 6.833.114 parells de frases, dels quals 174.507 són dades paral·leles recollides de la web i 6.658.607 són dades paral·leles sintètiques creades amb el traductor .
Model de traducció xinès-català entrenat des de zero amb i un conjunt de 6.833.114 parells de frases, dels quals 174.507 són dades paral·leles recollides de la web i 6.658.607 són dades paral·leles sintètiques creades amb el traductor .
Model de traducció gallec-català entrenat des de zero amb i un conjunt de aproximadament 75 milions de parells de frases, que inclou dades paral·leles autèntiques recollides de la web i dades paral·leles sintètiques creades amb el traductor .
Model de traducció basc-català entrenat des de zero amb i un conjunt de aproximadament 75 milions de parells de frases, que inclou dades paral·leles autèntiques recollides de la web i dades paral·leles sintètiques creades amb el traductor ES-EU de .