🗣️Models de parla
Reconeixement de la parla
whisper-large-v3-ca-punctuated-3370h
Model per al reconeixement automàtic de la parla en català, optimitzat a partir del model whisper-large-v3 amb 4.700 hores d’enregistraments en català. Entrenat amb dades acuradament transcrites, que inclouen puntuació i majúscules, el model genera transcripcions estructurades i llegibles, superant els models estàndard de reconeixement de la parla.
Reconeixement de la parla
faster-whisper-large-v3-ca-punctuated-3370h
Model de reconeixement de la parla, resultat de convertir el model whisper-large-v3-ca-punctuated-3370 ha un model més lleuger amb faster-whisper.
Reconeixement de la parla
whisper-bsc-large-v3-cat
Model per al reconeixement automàtic de la parla en català, optimitzat a partir del model whisper-large-v3 amb 4.700 hores d’enregistraments en català. El model està dissenyat per transcriure àudio en català a text pla, sense signes de puntuació.
Reconeixement de la parla
faster-whisper-bsc-large-v3-cat
Model de reconeixement de la parla, resultat de convertir el model whisper-bsc-large-v3-cat a un model més lleuger amb faster-whisper.
Reconeixement de la parla
hubert-base-ca-2k
Model HuBERT Base preentrenat amb 1.778 hores de registre de veu en català. Manté la mateixa arquitectura que el model hubert-base-ls960 original.
Síntesi de la parla (multiparlant i multidialectal)
Matxa-TTS Catalan Multiaccent
Model de síntesi de la parla multiparlant i multidialectal (balear, central, nord-occidental i valencià) entrenat amb el conjunt de dades LaFrescat.
Síntesi de la parla (multiparlant)
Matxa-TTS Catalan Multispeaker
Síntesi de la parla
alvocat-vocos-22khz
Reconeixement de la parla (bilingüe)
stt_ca-es_conformer_transducer_large
Model de reconeixement de la parla derivat de NVIDIA/stt_es_conformer_transducer_large i ajustat amb un corpus bilingüe català-castellà de 7.426 hores d'àudio
Reconeixement de la parla
whisper-large-v3-tiny-caesar
Model de reconeixement de la parla derivat del model whisper-large-v3, optimitzat per al reconeixement automàtic de la parla en contextos de canvi de codi entre català i castellà.
Reconeixement de la parla
whisper-large-v3-ca-3catparla
Model de reconeixement de la parla ajustat a partir del model whisper-large-v3 amb 710 hores d'enregistraments.
Reconeixement de la parla
faster-whisper-large-v3-ca-3catparla
Model de reconeixement de la parla, resultat de convertir el model whisper-large-v3-ca-3catparla a un model més lleuger amb faster-whisper.
Reconeixement de la parla
stt-ca-citrinet-512
Model de reconeixement de la parla ajustat a partir del model pre-entrenat espanyol stt-es-citrinet-512 amb el conjunt d'eines NeMo. Té uns 36,5 milions de paràmetres i s'ha entrenat amb Common Voice v11.0.
Last updated