A TECHNIQUE FOR REDUCING THE INFLUENCE OF UNINFORMATIVE SECTIONS OF AUDIO FILES ON THE RESULTING DIGITAL FINGERPRINT УДК 004.056
Main Article Content
Abstract
In this paper, a technique is proposed to reduce the influence of uninformative sections of musical audio recordings containing melodic constructions on the quality of digital prints according to the original algorithm. Fragments of chromatograms of audio files in the absence of a useful signal were previously analyzed. The effectiveness of the application of pre-filtering of signals on time intervals that do not contain the frequency of the fundamental tone in relation to the melody performed on a wind musical instrument is shown. The developed approach made it possible to reduce the length of the calculated print, which in turn leads to an acceleration of the algorithms for matching melodic constructions with each other. The methodology was tested on modifications of audio recordings according to the tempo of sound for various musical instruments. The results of calculations of the median value of the degree of similarity of digital prints before and after filtering are presented, which showed an improvement in the quality of matching melodic constructions by an average of 1.5%, and in some cases up to 3%. The filtering threshold for chord and chordless melodies is empirically selected. This technique can be applied in the tasks of automatic expert assessments when determining the violation of intellectual property rights for musical works.
Downloads
Article Details
References
Ладыгин П.С., Мансуров А.В., Рудер Д.Д. Сравнение векторов признаков аудиофайлов, полученных с помощью хроматограмм и питч-трекера CREPE // Проблемы правовой и технической защиты информации. 2020 № 8 С. 29–34.
Sonnleitner, R., & Widmer, G. (2015). Robust quad-based audio fingerprinting. IEEE/ACM Transactions on Audio, Speech, and Language Processing, 24(3), 409-421.
Cancela, P., Rocamora, M., & López, E. (2009, October). An Efficient Multi-Resolution Spectral Transform for Music Analysis. In ISMIR (pp. 309-314).
Müller, Meinard; Kurth, Frank; Clausen, Michael (2005). "Audio Matching via Chroma-Based Statistical Features". Proceedings of the International Conference on Music Information Retrieval: 288–295.
Van Nieuwenhuizen, H. A., Venter, W. C., & Grobler, L. M. (2012). The study and implementation of shazam’s audio fingerprinting algorithm for advertisement identification. In Proceedings of SATNAC 2011.
Разработка сверточной нейронной сети для классификации амплитудно-частотных характеристик аудиосигналов / В. Н. Попов, П. С. Ладыгин, В. В. Карев, Я. И. Борцова // Известия Алтайского государственного университета. – 2022. – № 1(123). – С. 116–120. – DOI 10.14258/izvasu(2022)1-19. – EDN QIQVEZ.
Ладыгин, П. С. Идентификация записей звуковых сигналов с применением нейронных сетей / П. С. Ладыгин, В. В. Поляков // Вестник Кыргызского государственного университета строительства, транспорта и архитектуры им. Н.Исанова. – 2021. – № 4(74). – С. 570–575. – DOI 10.35803/1694-5298.2021.4.570-575. – EDN JKGGHT.
Мансуров А. В., Ладыгин П. С. Способ формирования цифрового отпечатка аудиофайла на основе вектора признаков, получаемого с использованием Constant-Q и Фурье преобразований // Современная наука: актуальные проблемы теории и практики. Серия: Естественные и Технические Науки. -2020–№08. -С. 79–87 DOI 10.37882/2223-2966.2020.08.21
Ладыгин, П. С. Определение подлинности музыкальных аудиозаписей с помощью цифровых отпечатков на основе STFT- и CQT-хроматограмм / П. С. Ладыгин, А. А. Лепендин, А. В. Мансуров // Высокопроизводительные вычислительные системы и технологии. – 2023. – Т. 7, № 1. – С. 46–52. – EDN MEXHSR.