🧰Via pre-integració amb entorns de codi obert per a tecnologies del llenguatge
Aquest apartat llista els entorns i llibreries de codi obert de l’entorn de tecnologies de llenguatge en què el sistema Aina s’ha integrat fins ara.
Last updated
Aquest apartat llista els entorns i llibreries de codi obert de l’entorn de tecnologies de llenguatge en què el sistema Aina s’ha integrat fins ara.
Last updated
Si teniu interès en que el sistema Aina estigui integrat en altres entorns de codi obert, feu-nos arribar la petició a través del formulari de contacte.
spaCy és una biblioteca de programari de codi obert per al processament avançat del llenguatge natural escrita en els llenguatges de programació Python i Cython.
Spacy 3.7 permet ara la integració directa dels models Transformers d’AINA, inclosos LLMs: spacy-huggingface-pipelines | spacy-transformers | curated-transformers | spacy-llm
Accés: https://spacy.io/models/ca
Spark NLP és un accés unificat a més de 15.000 models gratuïts amb una línia de codi NLP responsable i explicable de codi obert. Inclou biblioteques empresarials per al sector Salut, Legal, Finances i NLP Visual.
Rasa Open Source és una plataforma d'IA conversacional de codi obert que us permet entendre i mantenir converses i connectar-vos a canals de missatgeria i sistemes de tercers mitjançant un conjunt d'API. Proporciona els blocs de construcció per crear assistents virtuals (digitals) o xatbots.
Accés: https://rasa.com/
Per exemple 1MillionBot ha integrat Rasa per als seus productes que fan servir els models d’Aina
Coqui és una startup que ofereix tecnologia de la parla oberta
Accés: https://coqui.ai/
NVIDIA NeMo, part de la plataforma NVIDIA AI, és un marc per crear, entrenar i ajustar (fine-tuning) la veu i la comprensió del llenguatge natural (NLU) accelerada per GPU.
eSpeak NG és un sintetitzador de veu de codi obert que admet més de cent idiomes i accents, s'utilitza com a transcriptor fonètic pels motors neuronals de TTS.
Demo: Dos motors de transcripció fonètica, per convertir lletres a fonemes per a quatre dialectes del català: central, nord-occidental, valencià i balear.
Accés: https://huggingface.co/spaces/projecte-aina/transcripcio-fonetica-catala.
En col·laboració amb la UPC, que els seus resultats estan implementats a https://github.com/rhasspy/gruut
oTranscriobe+ és una aplicació web gratuïta per a la transcripció d'entrevistes gravades.
OpenNMT és un ecosistema de codi obert per a la traducció automàtica neuronal i l'aprenentatge de seqüències neuronals.
Accés: https://opennmt.net/