SOTA VOX TTS Синтез речи

Озвучивайте тексты и контент. Используйте для роботов, обзвона и голосовых меню. Создайте свой уникальный голос для любых задач.

Преимущества
Brand Voice - Поможем создать уникальный голос для озвучки фирменного контента в любых каналах.
Cloud | On-Premis
Возможность использовать как облачный сервис или развернуть ПО на своих GPU-серверах.
Реалистичные голоса
Высококачественный синтез речи на базе нейросетевой архитектуры Tacotron2 и WaveNet.
Высокая скорость
Минимум пауз и задержек при озвучке для более реалистичного диалога.
API
Поддержка REST API и gRPC. Простая интеграция по протоколу HTTP/HTTPS.

Синтезируйте высококачественные
голоса для любых задач

IVR
Телефония
Микрофон
Системы оповещения

Технические особенности

Русский язык:
1. Мужской
2. Женский

‍Английский язык:
1. Мужской
2. Женский

‍Казахский язык:
1. Мужской
2. Женский

‍Узбекский язык:
1. Мужской
2. Женский

1. 64-х разрядная операционная система на базе Linux (CentOS не ниже 7.X, Debian не ниже 10.x , Astra Linux не ниже 1.7)
2. docker, nvidia-docker, docker-compose
3. драйвер cuda версии 10.2+

- 2-х CPU (2 физических ядер) с частотой 2.4 GHz
- GPU NVIDIA с поддержкой CUDA и объемом ОЗУ не менее 8 ГБ
- 8 ГБ ОЗУ
- 30 ГБ дискового пространства

1. Частота дискретизации 22050 Гц
2. Кодек pcm_s16le
3. Количество каналов 1