Система анализа, синтеза и нормализации речи

Речевые технологии (распознавание, синтез и клонирование речи)

Цель проекта — создать удобный инструмент, который умеет автоматически определять язык речи, сравнивать качество синтезированной речи с оригиналом и выравнивать громкость аудиозаписей. Такая система помогает быстрее анализировать аудио и улучшать результаты работы речевых технологий.

📌Что сделано:
🎤Создана система, которая определяет язык по звучанию речи и выдаёт уровень уверенности
📈Реализован автоматический анализ качества синтезированной речи по множеству объективных показателей
🔊Добавлена функция нормализации громкости, чтобы все записи звучали на одном уровне и без резких перепадов
🎧Сделана наглядная визуализация и возможность прослушивания исходных и обработанных аудиофайлов
📑Подготовлен полный отчёт с графиками, таблицами и сравнением разных систем

📊Результат проекта:
✅Система позволяет быстро оценивать и сравнивать качество синтеза речи
✅Все записи приводятся к одинаковой громкости и звучат комфортно
✅Графики и визуализации делают результаты анализа понятными даже для неподготовленных пользователей

💡Где может использоваться:
🔹В разработке голосовых ассистентов и чат-ботов
🔹Для тестирования и улучшения систем синтеза речи
🔹В исследовательских проектах по обработке аудиосигналов
🔹Для подготовки презентаций и демонстраций качества TTS-систем

Система анализа, синтеза и нормализации речи

Дополнительные изображения: