Precisión de reconocimiento en ruso llega hasta el 90%
El discurso del cliente y del empleado se separa en orden cronológico
Compatibilidad con el modo stream mediante los protocolos gRPC y MRCP
Capacidad de actualizar rápidamente el diccionario con nuevo vocabulario sobre cualquier tema y área temática
El texto reconocido se vincula automáticamente al habla. Navegue por las grabaciones, pasando al fragmento necesario al hacer clic en las palabras clave
los signos de puntuación se colocan automáticamente. Los números se muestran en formato numérico, no alfabético
Podemos adaptar los modelos de lenguaje y acústicos existentes a cualquier área temática para mejorar la calidad del reconocimiento.
El modelo está optimizado para procesar transmisiones de televisión, programas de radio, podcasts y películas.
El modelo está adaptado al vocabulario y las tareas del el soporte técnico y atención al cliente en el ámbito del comercio electrónico, las telecomunicaciones, la banca y los servicios médicos
El modelo está diseñado para procesar grabaciones de conversaciones telefónicas sobre temas arbitrarios.
El modelo está también optimizado para procesar archivos de audio grabados con un micrófono externo, por ejemplo, entrevistas.
WAV PCM, 8 kHz/16 bits
Multimedia (broadcast):WAV PCM, 16 kHz/16 bits