🗣️Modelos de Voz

Descripció / Funció

Reconocimiento de voz

Nom model

whisper-bsc-large-v3-cat

Comentaris

Modelo para el reconocimiento automático de voz en catalán, optimizado a partir del modelo whisper-large-v3 con 4.700 horas de grabaciones en catalán. El modelo está diseñado para transcribir audio en catalán a texto plano, sin signos de puntuación.

Descripció / Funció

Reconocimiento de voz

Nom model

faster-whisper-bsc-large-v3-cat

Comentaris

Modelo de reconocimiento de voz, resultado de convertir el modelo whisper-bsc-large-v3-cat en un modelo más ligero con faster-whisper.

Descripció / Funció

Reconocimiento de voz (bilingüe ca-es)

Nom model

stt_ca-es_conformer_transducer_large

Comentaris

Modelo de reconocimiento de voz derivado de NVIDIA/stt_es_conformer_transducer_large, ajustado mediante un corpus bilingüe catalán-español compuesto por 7.426 horas de audio.

Descripció / Funció

Reconocimiento de voz (es)

Nom model

parakeet-rnnt-1.1b_cv17_es_ep18_1270h

Comentaris

Modelo acústico derivado de nvidia/parakeet-rnnt-1.1b, optimizado para tareas de reconocimiento automático de voz en español.

Última actualización