🗣️Models de parla
Reconeixement de la parla
hubert-base-ca-2k
Model HuBERT Base preentrenat amb 1.778 hores de registre de veu en català. Manté la mateixa arquitectura que el model hubert-base-ls960 original.
Síntesi de la parla (multiparlant i multidialectal)
Matxa-TTS Catalan Multiaccent
Model de síntesi de la parla multiparlant i multidialectal (balear, central, nord-occidental i valencià) entrenat amb el conjunt de dades LaFrescat.
Síntesi de la parla (multiparlant)
Matxa-TTS Catalan Multispeaker
Síntesi de la parla
alvocat-vocos-22khz
Reconeixement de la parla (bilingüe)
stt_ca-es_conformer_transducer_large
Model de reconeixement de la parla derivat de NVIDIA/stt_es_conformer_transducer_large i ajustat amb un corpus bilingüe català-castellà de 7.426 hores d'àudio
Reconeixement de la parla
whisper-large-v3-tiny-caesar
Model de reconeixement de la parla derivat del model whisper-large-v3, optimitzat per al reconeixement automàtic de la parla en contextos de canvi de codi entre català i castellà.
Reconeixement de la parla
whisper-large-v3-ca-3catparla
Model de reconeixement de la parla ajustat a partir del model whisper-large-v3 amb 710 hores d'enregistraments.
Reconeixement de la parla
faster-whisper-large-v3-ca-3catparla
Model de reconeixement de la parla, resultat de convertir el model whisper-large-v3-ca-3catparla a un model més lleuger amb faster-whisper.
Reconeixement de la parla
stt-ca-citrinet-512
Model de reconeixement de la parla ajustat a partir del model pre-entrenat espanyol stt-es-citrinet-512 amb el conjunt d'eines NeMo. Té uns 36,5 milions de paràmetres i s'ha entrenat amb Common Voice v11.0.
Last updated