МЕТОДИКА СНИЖЕНИЯ ВЛИЯНИЯ МАЛОИНФОРМАТИВНЫХ УЧАСТКОВ АУДИОФАЙЛОВ НА ПОЛУЧАЕМЫЙ ЦИФРОВОЙ ОТПЕЧАТОК УДК 004.056
Основное содержание статьи
Аннотация
В данной работе предложена методика снижения влияния малоинформативных участков музыкальных аудиозаписей, содержащих мелодические конструкции, на качество цифровых отпечатков по оригинальному алгоритму. Предварительно проанализированы фрагменты хроматограмм аудиофайлов в области отсутствия полезного сигнала. Показана эффективность применения предварительной фильтрации сигналов на отрезках времени, не содержащих частоты основного тона, в отношение мелодии, исполненной на духовом музыкальном инструменте. Разработанный подход позволил сократить длину вычисляемого отпечатка, что в свою очередь приводит к ускорению работы алгоритмов сопоставления мелодических конструкций между собой. Проведена апробация методики на модификациях аудиозаписей по темпу звучания для различных музыкальных инструментов. Приведены результаты вычислений медианного значения степени схожести цифровых отпечатков до применения фильтрации и после неё, что показало улучшение качества сопоставления мелодических конструкций в среднем на 1,5%, а в отдельных случаях и до 3%. Эмпирически подобран порог фильтрации для аккордовых и безаккордовых мелодий. Данная методика может быть применена в задачах автоматического проведения экспертных оценок при установлении нарушении прав
Скачивания
Детали статьи
Литература
Ладыгин П.С., Мансуров А.В., Рудер Д.Д. Сравнение векторов признаков аудиофайлов, полученных с помощью хроматограмм и питч-трекера CREPE // Проблемы правовой и технической защиты информации. 2020 № 8 С. 29–34.
Sonnleitner, R., & Widmer, G. (2015). Robust quad-based audio fingerprinting. IEEE/ACM Transactions on Audio, Speech, and Language Processing, 24(3), 409-421.
Cancela, P., Rocamora, M., & López, E. (2009, October). An Efficient Multi-Resolution Spectral Transform for Music Analysis. In ISMIR (pp. 309-314).
Müller, Meinard; Kurth, Frank; Clausen, Michael (2005). "Audio Matching via Chroma-Based Statistical Features". Proceedings of the International Conference on Music Information Retrieval: 288–295.
Van Nieuwenhuizen, H. A., Venter, W. C., & Grobler, L. M. (2012). The study and implementation of shazam’s audio fingerprinting algorithm for advertisement identification. In Proceedings of SATNAC 2011.
Разработка сверточной нейронной сети для классификации амплитудно-частотных характеристик аудиосигналов / В. Н. Попов, П. С. Ладыгин, В. В. Карев, Я. И. Борцова // Известия Алтайского государственного университета. – 2022. – № 1(123). – С. 116–120. – DOI 10.14258/izvasu(2022)1-19. – EDN QIQVEZ.
Ладыгин, П. С. Идентификация записей звуковых сигналов с применением нейронных сетей / П. С. Ладыгин, В. В. Поляков // Вестник Кыргызского государственного университета строительства, транспорта и архитектуры им. Н.Исанова. – 2021. – № 4(74). – С. 570–575. – DOI 10.35803/1694-5298.2021.4.570-575. – EDN JKGGHT.
Мансуров А. В., Ладыгин П. С. Способ формирования цифрового отпечатка аудиофайла на основе вектора признаков, получаемого с использованием Constant-Q и Фурье преобразований // Современная наука: актуальные проблемы теории и практики. Серия: Естественные и Технические Науки. -2020–№08. -С. 79–87 DOI 10.37882/2223-2966.2020.08.21
Ладыгин, П. С. Определение подлинности музыкальных аудиозаписей с помощью цифровых отпечатков на основе STFT- и CQT-хроматограмм / П. С. Ладыгин, А. А. Лепендин, А. В. Мансуров // Высокопроизводительные вычислительные системы и технологии. – 2023. – Т. 7, № 1. – С. 46–52. – EDN MEXHSR.