SOTA VOX Kit

AI-платформа для создания продуктов и бизнес решений на основе речевых технологий.

Единый API для доступа ко всем сервисам

ОБЛАСТИ ПРИМЕНЕНИЯ

ASR / Распознавание речи
Встраивайте поддержку распознавания речи в любые приложения, сервисы и боты.
NLU / Обработка и понимание естественного языка
Используйте функции расширенного анализа текста для извлечения значимых данных, именованных сущностей, тематик, фактов, взаимосвязей и ключевых слов.
Voice ID / Идентификация по голосу
Повысьте безопасность и скорость обслуживания с помощью функции текстонезависимой идентификации по голосу на любом языке и с высокой точностью.
Системы речевой аналитики
Решения для автоматизации анализа клиентской коммуникации и контроля качества обслуживания.
Голосовые роботы
Научим ваших голосовых роботов и ассистентов общаться на естественном языке.
Протоколирование совещаний
Используйте SOTA VOX Kit в системах протоколирования офлайн совещаний и онлайн конференций.
Субтитры для ТВ и фильмов
Создавайте субтитры для ТВ-передач, эфиров, подкастов или видеофильмов.
Защита бизнеса от
фрода
Распознавание клиента по голосу на любом языке. Сокращайте время на идентификацию клиентов и минимизируйте риски от мошеннических действий.
Озвучивание контента
Озвучивайте любой контент: видеоролики, аудиокниги, инструкции, интерфейс сайта.

Функциональные особенности

Функциональные особенности
Использование пауз
Произнесение аббревиатур
Поддержка аудио шаблонов и предзаписанного аудио
Синтез речи на русском языке
Интонирование речи в соответствии с общепринятыми правилами
Автоматическая постановка ударений
Распознавание речи
Автоматическое разделение дикторов в моно-записях
Автоматическое определение языка
Определение пола, возраста и эмоций в канале оператора и клиента
Транскрибация с точностью более 95%
Поддерживаемые языки:
- русский,
- английский,
- казахский и узбекский, в т.ч. смешанная речь
Функциональные особенности
Текстонезависимая технология, не зависит от языка
Создание голосовых «слепков» от 20 сек естественной речи
Голосовая идентификация с точностью до 98%
Голосовая идентификация и верификация от 5 сек

SOTA VOX Kit

Голосовая биометрия
Модуль текстонезависимой голосовой биометрии для идентификации и поиска целевых голосов в аудиозаписях
Распознавание речи
Интеллектуальный движок распознавания речи (ASR) с возможностью обучения для повышения точности
Извлечение знаний
Движок текстовой аналитики (NLP|NLU) для понимания смысла и извлечения необходимых данных с учетом контекста
SOTA VOX API
Гибкий, безопасный и быстрый API

Технические особенности

SOTA VOX Kit автоматически проставляет знаки препинания в расшифровках. Предложения и имена собственные начинаются с заглавных букв. Благодаря этому работать с текстом комфортно, а транскрипт по качеству не уступает ручному форматированию.

Каждая расшифровка автоматически размечается по времени для каждого слова, что позволяет быстро находить нужные фрагменты в исходной аудиозаписи или привязывать субтитры по временной метке.

В базовый словарь можно добавлять новые слова для получения максимально точных расшифровок слов и фраз, связанных с конкретной предметной областью, таких как названия продуктов, техническая терминология или имена отдельных лиц.

Стрим-режим позволяет обрабатывать записи в режиме, близком к реальному времени. Поддерживается протокол MRCPv2.

Возможность гибко настроить список слов или фраз, которые будут удалены из расшифровки, например ненормативная лексика, коммерческая информация или персональные данные.

Автоматическое разделение дикторов, например в моно-записях, где оператор и клиент пишутся в один канал. Применение механизма диаризации существенно повышает качество распознавания и удобство дальнейшей работы с текстовой расшифровкой.