ПРИМЕНЕНИЕ ЦИФРОВОЙ ОБРАБОТКИ ГОЛОСОВЫХ СИГНАЛОВ ДЛЯ УЛУЧШЕНИЯ РАСПОЗНАВАНИЯ РЕЧИ

А.А.  Дмитриев; Д.А.  Дмитриев

№ 10 (2022): ПРОБЛЕМЫ ПРАВОВОЙ И ТЕХНИЧЕСКОЙ ЗАЩИТЫ ИНФОРМАЦИИ

PDF

Опубликован: июн 27, 2023

Ключевые слова:

распознавание речи, цифровая фильтрация, обработка сигналов

А.А. Дмитриев

Алтайский государственный университет

Email: dmitriev@asu.ru

Д.А. Дмитриев

Алтайский государственный университет

Email: dmitriev.d.a@vc.asu.ru

Аннотация

В работе предложен метод предварительной обработки голосовыхаудиозаписей, полученных по телефонной линии связи при разговоре пользователя сголосовым помощником. Для распознавания слов в работе использован программноаппаратный комплекс, построенный на основе программного обеспечения Kaldi.Показано, что полученные голосовые сигналы могут быть искажены шумом,связанным с работой устройств телефонной сети. Поэтому для надежногораспознавания слов в записанной речи применена предварительная фильтрациясигнала. Для выполнения обработки использован полосовой фильтр. Применениецифровой фильтрации позволило улучшить качество записи и уменьшить ошибку враспознавании отдельных слов в записанных сигналах.

Скачивания

Данные скачивания пока недоступны.

Как цитировать

1. Дмитриев А., Дмитриев Д. ПРИМЕНЕНИЕ ЦИФРОВОЙ ОБРАБОТКИ ГОЛОСОВЫХ СИГНАЛОВ ДЛЯ УЛУЧШЕНИЯ РАСПОЗНАВАНИЯ РЕЧИ // ПРОБЛЕМЫ ПРАВОВОЙ И ТЕХНИЧЕСКОЙ ЗАЩИТЫ ИНФОРМАЦИИ, 2023. № 10. С. 4-8. URL: http://journal.asu.ru/ptzi/article/view/13171.

Выпуск

№ 10 (2022): ПРОБЛЕМЫ ПРАВОВОЙ И ТЕХНИЧЕСКОЙ ЗАЩИТЫ ИНФОРМАЦИИ

Раздел

Проблемы технического обеспечения информационной безопасности

Литература

Беленко М.В., Балакшин П.В. Сравнительный анализ систем распознавания речи с открытым кодом // Международный научно-исследовательский журнал. – 2017. - №4(58). – С. 13-18.

Jha M. Improved unsupervised speech recognition system using MLLR speaker adaptation and confidence measurement // V Jornadas en Tecnologıas del Habla (VJTH’2008). – 2008. – P. 255-258.

Ravanelli M., Parcollet T., Bengio Y. The pytorch-kaldi speech recognition toolkit // 2019 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). – 2019. – P. 6465-6469.

Брайант Р., Медсен Л., Меггелен Д. В. Asterisk: окончательное руководство // O'Reilly Media, 2013. – 641 p.

Povey D., Ghoshal A., Boulianne G. The Kaldi Speech Recognition Toolkit // IEEE 2011 Workshop on Automatic Speech Recognition and Understanding. – 2011. – P. 1-4 .

Берзинь А.У. Применение i-векторов для автоматизированного определения уровня близости языков // Труды ИСП РАН. – 2019. – Т. 31. Вып. 5. – С. 153 - 164.

Peddinti V., Povey D., Khudanpur S. A time delay neural network architecture for efficient modeling of long temporal contexts // Interspeech. – 2015. – P. 3214-3218.

Georgescu A.-L., Cucu H., Burileanu C. Kaldi-based DNN Architectures for Speech Recognition in Romanian // 2019 International Conference on Speech Technology and Human-Computer Dialogue (SpeD). – 2019. – P. 1-6.

Сергиенко А.Б. Цифровая обработка сигналов // СПб. : Питер, 2002. – 608 с.

Карпов А.А., Кипяткова И.С. Методология оценивания работы систем автоматического распознавания речи // ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. – 2012. – T. 55, № 11. – С. 38-43.

Статья боковой панели

Основное содержание статьи

Аннотация

Скачивания

Детали статьи

Литература