Aina Kit
Aina Kit
  • Inici
  • 🤗Models
    • 🔠Models de text
    • 🗣️Models de parla
    • ↔️Models de traducció automàtica
    • 🏆Avaluació de models en llengua catalana
  • 📚Datasets
    • 🔠Dades i eines per a models de text
    • 🗣️Dades i eines per a models de veu
    • ↔️Dades per a la traducció automàtica
  • ▶️Testing
    • 🤗Via Hugging Face
    • ☁️Via integració amb serveis al núvol
    • 🐋Via Docker
    • 🧰Via pre-integració amb entorns de codi obert per a tecnologies del llenguatge
  • ▶️EINES D'INTEGRACIÓ
    • ☁️MTUOC
  • 🕹️Demostradors
    • 🤗A Spaces de Hugging Face
    • Page
Powered by GitBook

Social

  • Web
  • Twitter
  • Linkedin
  • Contacte

Tech

  • Blog
  • Huggingface
  • Github
  • Dockerhub

© Projecte Aina | Language Technologies Unit at BSC

On this page
  1. Models

Models de parla

Last updated 5 months ago

Descripció / Funció
Nom model
Model card
Comentaris
Descripció / Funció
Nom model
Model card
Comentaris
Descripció / Funció
Nom model
Model card
Comentaris
Descripció / Funció
Nom model
Model card
Comentaris
Descripció / Funció
Nom model
Model card
Comentaris
Descripció / Funció
Nom model
Model card
Comentaris
Descripció / Funció
Nom model
Model card
Comentaris

🤗
🗣️

Síntesi de la parla (multiparlant i multidialectal)

Matxa-TTS Catalan Multiaccent

Model de síntesi de la parla multiparlant i multidialectal (balear, central, nord-occidental i valencià). S'ha entrenat amb el conjunt de dades .

Síntesi de la parla (multiparlant)

Matxa-TTS Catalan Multispeaker

Model de síntesi de parla multiparlant. S'ha entrenat amb els conjunts de dades i .

Síntesi de la parla

alVoCat

Codificador de veu per a la síntesi de la parla en català a partir d'espectrogrames de mel basat en l'arquitectura Vocos. S'ha entrenat amb els conjunts de dades , i .

Reconeixement de la parla (bilingüe)

stt_ca-es_conformer_transducer_large

Model de reconeixement de la parla basat en ajustat amb un conjunt de dades bilingüe ca-es que consta de 7426 hores d'enregistraments.

Reconeixement de la parla

faster-whisper-large-v3-ca-3catparla

Model de reconeixement de la parla, resultat de convertir el model en un model més lleuger amb .

Reconeixement de la parla

stt-ca-citrinet-512

Model de reconeixement de la parla ajustat a partir del model pre-entrenat espanyol amb el conjunt d'eines NeMo. Té uns 36,5 milions de paràmetres i s'ha entrenat amb .

Reconeixement de la parla

whisper-large-v3-ca-3catparla

Model de reconeixement de la parla ajustat a partir del model amb 710 hores d'enregistraments.

https://huggingface.co/projecte-aina/matxa-tts-cat-multiaccent
https://huggingface.co/projecte-aina/matxa-tts-cat-multispeaker
https://huggingface.co/projecte-aina/alvocat-vocos-22khz
https://huggingface.co/projecte-aina/stt_ca-es_conformer_transducer_large
https://huggingface.co/projecte-aina/faster-whisper-large-v3-ca-3catparla
https://huggingface.co/projecte-aina/stt-ca-citrinet-512
https://huggingface.co/projecte-aina/whisper-large-v3-ca-3catparla
LaFrescat
Festcat
OpenSLR69
Festcat
OpenSLR69
LaFrescat
NVIDIA/stt_es_conformer_transducer_large
whisper-large-v3-ca-3catparla
faster-whisper
stt-es-citrinet-512
Common Voice v11.0
whisper-large-v3