Skip navigation
Please use this identifier to cite or link to this item: https://libeldoc.bsuir.by/handle/123456789/43814
Title: Акустическая локализация источника сигнала при помощи глубокого обучения
Other Titles: Acoustic source localization using deep learning
Authors: Калоша, А. Л.
Стержанов, М. В.
Keywords: материалы конференций;библиотека Librosa;библиотека TensorFlow;нейронные сети;Librosa library;TensorFlow library;neural networks
Issue Date: 2021
Publisher: БГУИР
Citation: Калоша, А. Л. Акустическая локализация источника сигнала при помощи глубокого обучения / А. Л. Калоша, М. В. Стержанов // BIG DATA and Advanced Analytics = BIG DATA и анализ высокого уровня: VII Международная научно-практическая конференция [Электронный ресурс] : сборник материалов VII Международной научно-практической конференции, Минск, 19-20 мая 2021 года / Белорусский государственный университет информатики и радиоэлектроники ; редкол.: В. А. Богуш [и др.]. – Минск, 2021. – С. 137–140. – Режим доступа : http://bigdataminsk.bsuir.by/files/2021_materialy.pdf.
Abstract: Цель данной работы заключается в создании системы для определения источника аудио сигнала. Для достижения данной цели использовалась нейронная сеть, которая обучена на наборе метрик, описывающих значимые характеристики звука: MFCC, спектральный центроид, скорость пересечения нуля, частоты цветности, спад спектра. Для получения данных метрики использовалась библиотека Librosa, в которой уже реализовано получение метрик из аудиофайла. Данные записывались с использованием 2 микрофонов, работающих одновременно. Обучение нейронной сети производилось на 1 000 аудиофайлов. В результате обучения нейронная сеть способна предсказать координаты источника сигнала с точностью в 81%. Улучив качество оборудования для записи звука, размер обучающей выборки, или подобрав более точно гиперпараметры нейронной сети, можно увеличить точность системы.
Alternative abstract: The purpose of this paper is to create a system for identifying the source of an audio signal. This system uses a neural network, which is trained on a set of metrics describing significant characteristics of audio: MFCC, spectral centroid, zero crossing rate, chromaticity frequencies, and spectrum decay. The Librosa library was used to retrieve metric data, which already implements retrieval of metrics from an audio file. The data was recorded using 2 microphones working simultaneously. The neural network was trained on 1,000 audio files. As a result of training, the neural network is able to predict the coordinates of the signal source with 81% accuracy. By improving the equipment for audio recording, increasing the size of the learning samples, or by selecting the hyperparameters more accurately of the neural network, you can increase accuracy of the system.
URI: https://libeldoc.bsuir.by/handle/123456789/43814
Appears in Collections:BIG DATA and Advanced Analytics = BIG DATA и анализ высокого уровня : материалы конференции (2021)

Files in This Item:
File Description SizeFormat 
Kalosha_Akusticheskaya.pdf976.07 kBAdobe PDFView/Open
Show full item record Google Scholar

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.