# Models de parla

Descripció / Funció	Nom model	Model card	Comentaris
Reconeixement de la parla	whisper-large-v3-ca-punctuated-3370h	https://huggingface.co/BSC-LT/whisper-large-v3-ca-punctuated-3370h	Model per al reconeixement automàtic de la parla en català, optimitzat a partir del model whisper-large-v3 amb 4.700 hores d’enregistraments en català. Entrenat amb dades acuradament transcrites, que inclouen puntuació i majúscules, el model genera transcripcions estructurades i llegibles, superant els models estàndard de reconeixement de la parla.
Reconeixement de la parla	faster-whisper-large-v3-ca-punctuated-3370h	https://huggingface.co/BSC-LT/faster-whisper-large-v3-ca-punctuated-3370h	Model de reconeixement de la parla, resultat de convertir el model whisper-large-v3-ca-punctuated-3370 ha un model més lleuger amb faster-whisper.
Reconeixement de la parla	whisper-bsc-large-v3-cat	https://huggingface.co/BSC-LT/whisper-bsc-large-v3-cat	Model per al reconeixement automàtic de la parla en català, optimitzat a partir del model whisper-large-v3 amb 4.700 hores d’enregistraments en català. El model està dissenyat per transcriure àudio en català a text pla, sense signes de puntuació.
Reconeixement de la parla	faster-whisper-bsc-large-v3-cat	https://huggingface.co/BSC-LT/faster-whisper-bsc-large-v3-cat	Model de reconeixement de la parla, resultat de convertir el model whisper-bsc-large-v3-cat a un model més lleuger amb faster-whisper.
Reconeixement de la parla	hubert-base-ca-2k	https://huggingface.co/BSC-LT/hubert-base-ca-2k	Model HuBERT Base preentrenat amb 1.778 hores de registre de veu en català. Manté la mateixa arquitectura que el model hubert-base-ls960 original.
Síntesi de la parla (multiparlant i multidialectal)	Matxa-TTS Catalan Multiaccent	https://huggingface.co/projecte-aina/matxa-tts-cat-multiaccent	Model de síntesi de la parla multiparlant i multidialectal (balear, central, nord-occidental i valencià) entrenat amb el conjunt de dades LaFrescat.
Síntesi de la parla (multiparlant)	Matxa-TTS Catalan Multispeaker	https://huggingface.co/projecte-aina/matxa-tts-cat-multispeaker	Model de síntesi de parla multiparlant entrenat amb els conjunts de dades Festcat i OpenSLR69.
Síntesi de la parla	alvocat-vocos-22khz	https://huggingface.co/projecte-aina/alvocat-vocos-22khz	Codificador de veu per a la síntesi de la parla en català a partir d'espectrogrames de mel basat en l'arquitectura Vocos entrenat amb els conjunts de dades Festcat, OpenSLR69 i LaFrescat.
Reconeixement de la parla (bilingüe)	stt_ca-es_conformer_transducer_large	https://huggingface.co/projecte-aina/stt_ca-es_conformer_transducer_large	Model de reconeixement de la parla derivat de NVIDIA/stt_es_conformer_transducer_large i ajustat amb un corpus bilingüe català-castellà de 7.426 hores d'àudio
Reconeixement de la parla	whisper-large-v3-tiny-caesar	https://huggingface.co/projecte-aina/whisper-large-v3-tiny-caesar	Model de reconeixement de la parla derivat del model whisper-large-v3, optimitzat per al reconeixement automàtic de la parla en contextos de canvi de codi entre català i castellà.
Reconeixement de la parla	whisper-large-v3-ca-3catparla	https://huggingface.co/projecte-aina/whisper-large-v3-ca-3catparla	Model de reconeixement de la parla ajustat a partir del model whisper-large-v3 amb 710 hores d'enregistraments.	https://huggingface.co/projecte-aina/whisper-large-v3-ca-3catparla
Reconeixement de la parla	faster-whisper-large-v3-ca-3catparla	https://huggingface.co/projecte-aina/faster-whisper-large-v3-ca-3catparla	Model de reconeixement de la parla, resultat de convertir el model whisper-large-v3-ca-3catparla a un model més lleuger amb faster-whisper.

--- # Agent Instructions: Querying This Documentation If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question. Perform an HTTP GET request on the current page URL with the `ask` query parameter: ``` GET https://langtech-bsc.gitbook.io/aina-kit/models/models-de-parla.md?ask= ``` The question should be specific, self-contained, and written in natural language. The response will contain a direct answer to the question and relevant excerpts and sources from the documentation. Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.