Inici - Aina Kit

Què és el Projecte Aina?

El Projecte Aina és una iniciativa estratègica impulsada per la Generalitat de Catalunya amb l'objectiu de fomentar i garantir un futur digital ple per a la llengua catalana. Se centra en el desenvolupament de tecnologies del llenguatge i intel·ligència artificial (IA) de codi obert i d'alta qualitat, específicament dissenyades i entrenades per al català i les seves variants. El projecte està desenvolupat pel Laboratori de Tecnologies del Llenguatge del Barcelona Supercomputing Center - Centre Nacional de Supercomputació (BSC-CNS).

La missió del Projecte Aina va més enllà de la simple creació d'eines; busca construir una infraestructura d'IA pública, oberta, transparent i responsable per al català. Això implica no només desenvolupar models i corpus lingüístics, sinó també assegurar que aquests recursos siguin accessibles per a empreses, administracions públiques, investigadors i la societat en general. Fent això, el projecte persegueix la sobirania digital de Catalunya, proporcionant alternatives robustes a les tecnologies d'IA comercials dominades per grans corporacions i garantint que el català tingui una presència sòlida i competitiva en l'ecosistema digital global.

Què és l'Aina Kit?

L'Aina Kit és la materialització tangible del Projecte Aina. És una col·lecció completa i organitzada de models i conjunts de dades oberts desenvolupats pel projecte per a la comunitat. Funciona com un conjunt d'eines ("kit") perquè qualsevol persona o entitat interessada pugui construir productes i serveis basats en intel·ligència artificial en llengua catalana.

El contingut de l'Aina Kit és divers i abasta tot el cicle de vida del desenvolupament d'aplicacions d'IA:

  • Models de Llenguatge: Inclou una àmplia gamma de models d'IA instruïts i fundacionals per a tasques de text (generació, classificació, etc.), parla (reconeixement i síntesi de veu) i traducció automàtica.

  • Datasets (Conjunts de Dades): Ofereix els corpus de text, veu i traducció automàtica, tant generals com especialitzats, que s'han utilitzat per entrenar i avaluar els models.

  • Eines d'Integració: Proporciona eines per facilitar la integració d'aquests recursos en aplicacions i fluxos de treball existents.

  • Guia d'Adopció (FAQ): La guia d'adopció (FAQ) recull de manera estructurada tota la informació essencial per entendre i aprofitar els recursos de l'Aina Kit: quines famílies de models hi ha, com es poden utilitzar (instruïts, fundacionals, per a NER, RAG, etc.), com desplegar-los i adaptar-los a cada cas d’ús. També inclou informació sobre llicències, requisits tècnics i eines de suport.

  • Demostradors: Els demostradors mostren exemples pràctics i aplicacions dels models en funcionament, que serveixen d'inspiració i punt de partida.

Els models i els datasets (conjunts de dades) creats en el marc del Projecte Aina estan a disposició de totes aquelles entitats públiques i privades que els vulguin fer servir. Els recursos es publiquen en obert i amb llicències permissives.

Aquest és un document viu, que anirà evolucionant. Si ens vols fer arribar comentaris, correccions i/o sugerències de millora pots fer-ho via el formulari de contacte.

Per estar al dia del Projecte Aina

El Projecte Aina es troba en constant evolució. Per a tots aquells interessats a seguir de prop el seu desenvolupament, resoldre dubtes o fins i tot col·laborar-hi activament, existeixen diverses plataformes i canals de comunicació.

  • Com a primer recurs, aquesta mateixa pàgina de l’Aina Kit, amb les descripcions dels recursos.

  • Si no es troba la resposta, consulta la guia d’adopció (FAQ), que conté respostes a les preguntes més freqüents, breus tutorials i vídeos específics.

  • Un tercer nivell es farà col·lectivament amb un canal Discord en què es pot compartir dubtes i solucions. Si hi ha preguntes més específiques, hi ha canals específics de models de Text, Veu, Traducció i Datasets on tant la comunitat com els investigadors del BSC podran resoldre els dubtes.

A continuació, estan disponibles els enllaços oficials per no perdre cap novetat i formar part d'aquesta comunitat:

🌐 Web i butlletí del projecte

🕸️ Xarxes socials

👥 Espais de treball col·laboratiu i repositoris

Last updated