Inici - Aina Kit
Què és el Projecte Aina?
El Projecte Aina és una iniciativa estratègica impulsada per la Generalitat de Catalunya amb l'objectiu de fomentar i garantir un futur digital ple per a la llengua catalana. Se centra en el desenvolupament de tecnologies del llenguatge i intel·ligència artificial (IA) de codi obert i d'alta qualitat, específicament dissenyades i entrenades per al català i les seves variants. El projecte està desenvolupat pel Laboratori de Tecnologies del Llenguatge del Barcelona Supercomputing Center - Centre Nacional de Supercomputació (BSC-CNS).
La missió del Projecte Aina va més enllà de la simple creació d'eines; busca construir una infraestructura d'IA pública, oberta, transparent i responsable per al català. Això implica no només desenvolupar models i corpus lingüístics, sinó també assegurar que aquests recursos siguin accessibles per a empreses, administracions públiques, investigadors i la societat en general. Fent això, el projecte persegueix la sobirania digital de Catalunya, proporcionant alternatives robustes a les tecnologies d'IA comercials dominades per grans corporacions i garantint que el català tingui una presència sòlida i competitiva en l'ecosistema digital global.
Què és l'Aina Kit?
L'Aina Kit és la materialització tangible del Projecte Aina. És una col·lecció completa i organitzada de models i conjunts de dades oberts desenvolupats pel projecte per a la comunitat. Funciona com un conjunt d'eines ("kit") perquè qualsevol persona o entitat interessada pugui construir productes i serveis basats en intel·ligència artificial en llengua catalana.
El contingut de l'Aina Kit és divers i abasta tot el cicle de vida del desenvolupament d'aplicacions d'IA:
Models de Llenguatge: Inclou una àmplia gamma de models d'IA instruïts i fundacionals per a tasques de text (generació, classificació, etc.), parla (reconeixement i síntesi de veu) i traducció automàtica.
Datasets (Conjunts de Dades): Ofereix els corpus de text, veu i traducció automàtica, tant generals com especialitzats, que s'han utilitzat per entrenar i avaluar els models.
Eines d'Integració: Proporciona eines per facilitar la integració d'aquests recursos en aplicacions i fluxos de treball existents.
Guia d'Adopció (FAQ): La guia d'adopció (FAQ) recull de manera estructurada tota la informació essencial per entendre i aprofitar els recursos de l'Aina Kit: quines famílies de models hi ha, com es poden utilitzar (instruïts, fundacionals, per a NER, RAG, etc.), com desplegar-los i adaptar-los a cada cas d’ús. També inclou informació sobre llicències, requisits tècnics i eines de suport.
Demostradors: Els demostradors mostren exemples pràctics i aplicacions dels models en funcionament, que serveixen d'inspiració i punt de partida.

Els models i els datasets (conjunts de dades) creats en el marc del Projecte Aina estan a disposició de totes aquelles entitats públiques i privades que els vulguin fer servir. Els recursos es publiquen en obert i amb llicències permissives.
Aquest és un document viu, que anirà evolucionant. Si ens vols fer arribar comentaris, correccions i/o sugerències de millora pots fer-ho via el formulari de contacte.
Per estar al dia del Projecte Aina
El Projecte Aina es troba en constant evolució. Per a tots aquells interessats a seguir de prop el seu desenvolupament, resoldre dubtes o fins i tot col·laborar-hi activament, existeixen diverses plataformes i canals de comunicació.
Com a primer recurs, aquesta mateixa pàgina de l’Aina Kit, amb les descripcions dels recursos.
Si no es troba la resposta, consulta la guia d’adopció (FAQ), que conté respostes a les preguntes més freqüents, breus tutorials i vídeos específics.
Un tercer nivell es farà col·lectivament amb un canal Discord en què es pot compartir dubtes i solucions. Si hi ha preguntes més específiques, hi ha canals específics de models de Text, Veu, Traducció i Datasets on tant la comunitat com els investigadors del BSC podran resoldre els dubtes.
A continuació, estan disponibles els enllaços oficials per no perdre cap novetat i formar part d'aquesta comunitat:
🌐 Web i butlletí del projecte
🕸️ Xarxes socials
@projecte_aina a Twitter / X
Projecte Aina a LinkedIn
👥 Espais de treball col·laboratiu i repositoris
Hugging Face - Projecte Aina
GitHub - Projecte Aina
Common Voice - Common Voice català
Zenodo - Recursos de text en català
Last updated