SOTA VOX Kit автоматически проставляет знаки препинания в расшифровках. Предложения и имена собственные начинаются с заглавных букв. Благодаря этому работать с текстом комфортно, а транскрипт по качеству не уступает ручному форматированию.
Каждая расшифровка автоматически размечается по времени для каждого слова, что позволяет быстро находить нужные фрагменты в исходной аудиозаписи или привязывать субтитры по временной метке.
В базовый словарь можно добавлять новые слова для получения максимально точных расшифровок слов и фраз, связанных с конкретной предметной областью, таких как названия продуктов, техническая терминология или имена отдельных лиц.
Стрим-режим позволяет обрабатывать записи в режиме, близком к реальному времени. Поддерживается протокол MRCPv2.
Возможность гибко настроить список слов или фраз, которые будут удалены из расшифровки, например ненормативная лексика, коммерческая информация или персональные данные.
Автоматическое разделение дикторов, например в моно-записях, где оператор и клиент пишутся в один канал. Применение механизма диаризации существенно повышает качество распознавания и удобство дальнейшей работы с текстовой расшифровкой.