🗣️Modelos de Voz
Reconocimiento de voz
whisper-3cat-cv21-valencian
Modelo para el reconocimiento automático de voz en valenciano, optimizado a partir del modelo whisper-large-v3 con 397 horas y 55 minutos de grabaciones.
Reconocimiento de voz
faster-whisper-3cat-cv21-valencian
Modelo de reconocimiento de voz, resultado de convertir el modelo whisper-3cat-cv21-valencian en un modelo más ligero con faster-whisper.
Reconocimiento de voz
whisper-3cat-balearic
Modelo para el reconocimiento automático de voz en balear, optimizado a partir del modelo whisper-large-v3 con 90 horas.
Reconocimiento de voz
faster-whisper-3cat-balearic
Modelo de reconocimiento de voz, resultado de convertir el modelo whisper-3cat-balearic en un modelo más ligero con faster-whisper.
Reconocimiento de voz
whisper-bsc-large-v3-cat
Modelo para el reconocimiento automático de voz en catalán, optimizado a partir del modelo whisper-large-v3 con 4.700 horas de grabaciones en catalán. El modelo está diseñado para transcribir audio en catalán a texto plano, sin signos de puntuación.
Reconocimiento de voz
faster-whisper-bsc-large-v3-cat
Modelo de reconocimiento de voz, resultado de convertir el modelo whisper-bsc-large-v3-cat en un modelo más ligero con faster-whisper.
Reconocimiento de voz (bilingüe ca-es)
stt_ca-es_conformer_transducer_large
Modelo de reconocimiento de voz derivado de NVIDIA/stt_es_conformer_transducer_large, ajustado mediante un corpus bilingüe catalán-español compuesto por 7.426 horas de audio.
Reconocimiento de voz (es)
parakeet-rnnt-1.1b_cv17_es_ep18_1270h
Modelo acústico derivado de nvidia/parakeet-rnnt-1.1b, optimizado para tareas de reconocimiento automático de voz en español.
Última actualización
