ПОДГОТОВКА НАБОРА ДАННЫХ ДЛЯ ОБУЧЕНИЯ НЕЙРОННОЙ СЕТИ, ИСПОЛЬЗУЕМОЙ В ЗАДАЧАХ СРАВНЕНИЯ АУДИОФАЙЛОВ
Современные компьютерные алгоритмы достаточно эффективно анализируют аудиальную информацию. Важной задачей для создания современных экспертных систем по проверке музыки на плагиат является построение качественного вектора признаков аудиофайла. Одним из актуальных инструментов для обработки данного вида информации стали глубокие нейронные сети. Для их обучения необходимо иметь большой набор данных, который применим к задаче. В данной работе определены критерии выбора набора данных для обучения нейронной сети для извлечения цифровых отпечатков аудиофайлов. Проанализированы существующие наборы данных в соответствии с определенными критериями. Собран набор данных и представлен в удобном виде для дальнейшего использования.
Modern computer algorithms analyze auditory information quite effectively. An important task for creating modern expert systems for checking music for plagiarism is the construction of a qualitative vector of audio file features. Deep neural networks have become one of the most relevant tools for processing this type of information. To train them, it is necessary to have a large data set that is applicable to the task. In this paper, the criteria for selecting a data set for training a neural network for extracting digital prints of audio files are defined. The existing data sets are analyzed in accordance with certain criteria. A data set has been collected and presented in a convenient form for further use.
Keywords: DEEP NEURAL NETWORK, DIGITAL FINGERPRINTS OF AUDIO FILES, AUDIO FILE FEATURE VECTOR