МЕТОДИКА ОЦЕНКИ СТЕПЕНИ СХОЖЕСТИ АУДИОФАЙЛОВ С ПРИМЕНЕНИЕМ АМТ-МОДЕЛИ

УДК 004.056.57

  • Павел Сергеевич Ладыгин Алтайский государственный университет, Барнаул Email: pavel-ladygin@yandex.ru
  • Андрей Игоревич Неверов Алтайский государственный университет, Барнаул Email: andrey.neverov2003@mail.ru
Ключевые слова: цифровой отпечаток, музыкальная транскрипция, машинное обучение, аудиофайлы

Аннотация

В статье рассматриваетсяразработка и экспериментальная оценка нового метода создания цифровых отпечатковаудиофайлов на основе автоматической музыкальной транскрипции (AMT) для повышения эффективности выявления пиратского контента. В качестве методологическойосновы предлагается алгоритм, преобразующий аудиосигнал в символьное представление (MIDI) с помощью специально обученной нейросетевой модели «Google Onsets andFrames». Данная модель, архитектура которой включает два U-Net блока и слои BiLSTM,была обучена на датасете фортепианных записей MAPS. Для оценки схожести исходного и предсказанного MIDI-представленияиспользовалось расстояние Левенштейна.Экспериментальные результаты выявили сильную зависимость точности модели от характера аудиоданных. Наивысшаяточность (89,36%) была достигнута на полифонических фортепианных композициях, соответствующих обучающим данным,тогда как на монофонических и гитарныхтреках результаты были значительно ниже(35–56 %). Для повышения надежности метода был предложен и успешно апробированалгоритм постобработки, отфильтровывающий ложные ноты по порогу длительности  Эта процедура позволила достичь 100% схожести для большинства тестовых фортепианных записей, что доказывает эффективность подхода. Таким образом, исследованиедемонстрирует перспективность использования AMT для создания устойчивых цифровыхотпечатков и пути для дальнейшего улучшения модели, включая расширение обучающейвыборки данными различных инструментов.

Скачивания

Данные скачивания пока недоступны.

Литература

1. Чевтаева Л.Н. Интернет-пиратство: вчера и сегодня // Вестник Саратовского государственного технического университета. 2013. С. 1–6.

2. Борисова С.Н. Методы защиты аудиофайлов от несанкционированного копирования и распространения // Фундаментальные исследования. 2015. № 5 (часть 3). С. 481–487.

3. Гражданский кодекс Российской Федерации (часть четвертая) от 18.12.2006 N 230-ФЗ (ред. от 03.07.2016, с изм. от 13.12.2016) (с изм. и доп., вступ. в силу с 01.01.2017) // КонсультантПлюс: справочно-правовая система. URL: http://www.consultant.ru/document/cons_doc_ LAW_64629/ (дата обращения: 5.06.2025).

4. Google LLC: Как работает система Content ID : сайт. 2025. URL: https://support.google.com/youtube/answer/2797370?hl=ru (дата обращения: 24.04.2025).

5. Андрадэ А.И., Насуро Е.В. Средство музыкальной транскрипции при помощи методов машинного обучения // BIG DATA and Advanced Analytics = BIG DATA и анализ высокого уровня : сборник материалов V Международной научно-практической конференции, Минск, 13–14 марта 2019 г.: в 2 ч. Ч. 1 / Белорусский государственный университет информатики и радиоэлектроники; редкол. : В.А. Богуш [и др.]. Минск, 2019. С. 376–380.

6. Kin Wai Cheuk ReconVAT: A Semi Supervised Automatic Music Transcription Framework for Low-Resource Real-World Data / Kin Wai Cheuk, Dorien Herremans, Li Su // ACM International Conference on Multimedia (China, 24.10.2021), China, 2021. C. 1–9.

7. ADASP: MAPS Database: a Piano database for multipitch estimation and automatic transcription of music : сайт. 2025. URL: https:// adasp.telecom-paris.fr/resources/2010-07-08- maps-database/ (дата обращения: 13.02.2025).

8. Левенштейн В.И. Двоичные коды с исправлением выпадений, вставок и замещений символов // Доклады АН СССР, 1965. Т. 163. № 4. С. 845–848.
Опубликован
2026-02-10
Как цитировать
1. Ладыгин П. С., Неверов А. И. МЕТОДИКА ОЦЕНКИ СТЕПЕНИ СХОЖЕСТИ АУДИОФАЙЛОВ С ПРИМЕНЕНИЕМ АМТ-МОДЕЛИ // ПРОБЛЕМЫ ПРАВОВОЙ И ТЕХНИЧЕСКОЙ ЗАЩИТЫ ИНФОРМАЦИИ, 2026. № 13. С. 21-29. URL: https://journal.asu.ru/ptzi/article/view/18847.
Раздел
Проблемы технического обеспечения информационной безопасности