Skip navigation
Please use this identifier to cite or link to this item: https://libeldoc.bsuir.by/handle/123456789/51174
Full metadata record
DC FieldValueLanguage
dc.contributor.authorVishniakou, U. A.-
dc.contributor.authorShaya, B. H.-
dc.coverage.spatialМинскru_RU
dc.date.accessioned2023-04-29T08:21:08Z-
dc.date.available2023-04-29T08:21:08Z-
dc.date.issued2023-
dc.identifier.citationVishniakou, U. A. Voice Detection Using Convolutional Neural Network=Распознавание голоса с использованием свёрточной нейронной сети / U. A. Vishniakou, B. H. Shaya // Доклады БГУИР. – 2023. – Т. 21, № 2. – С. 114-120.ru_RU
dc.identifier.urihttps://libeldoc.bsuir.by/handle/123456789/51174-
dc.description.abstractThe article presents an approach, methodology, the software system based on a machine learning technologies for convolutional neural network and its use for voice (cough) recognition. Tasks of article are receiving evaluating a voice detection system with deep learning, the use of a convolutional neural network and Python language for patients with cough. The convolutional neural network has been developed, trained and tested using various datasets and Python libraries. Unlike the existing modern works related to this area, proposed system was evaluated using a real set of environmental sound data, and not only on filtered or separated voice audio tracks. The final compiled model showed a relatively high average accuracy of 85.37 %. Thus, the system is able to detect the sound of a voice in a crowded public place, and there is no need for a sound separation phase for prprocessing, as other modern systems require. Several volunteers recorded their voice sounds using microphones of their smartphones, and it was guaranteed that they would test their voices in public places to make noise, in addition to some audio files that were uploaded online. The results showed an average recognition accuracy – of 85.37 %, a minimum accuracy – of 78.8 % and a record – of 91.9 %.ru_RU
dc.language.isoenru_RU
dc.publisherБГУИРru_RU
dc.subjectдоклады БГУИРru_RU
dc.subjectvoice detectionru_RU
dc.subjectconvolution neural networkru_RU
dc.titleVoice Detection Using Convolutional Neural Networkru_RU
dc.title.alternativeРаспознавание голоса с использованием свёрточной нейронной сетиru_RU
dc.typeArticleru_RU
dc.identifier.DOIhttp://dx.doi.org/10.35596/1729-7648-2023-21-2-114-120-
local.description.annotationПредставлены подход, методология, программная система, основанные на свёрточной нейронной сети, для распознавания голоса (кашля) в условиях зашумленности с использованием технологий машинного обучения. Разработана и оценена система распознавания кашля на основе машинного обучения, использования свёрточной нейронной сети и библиотек языка Python. Свёрточная нейронная сеть протестирована с помощью различных наборов данных и библиотек. В отличие от существующих современных работ в этой области предложенная система оценивалась с применением реального набора звуковых данных окружающей среды, а не только отфильтрованных или разделенных звуковых параметров голоса. Окончательная скомпилированная модель показала относительно высокую среднюю точность – 85,37 %. Предлагаемая система способна распознавать звук голоса в многолюдном общественном месте, и нет необходимости в фазе разделения звука для предварительной обработки, как в других системах. Несколько добровольцев записали звуки своего голоса с помощью смартфонов. Затем они протестировали свои голоса в общественных местах на предмет шума в дополнение к некоторым аудиофайлам, которые были загружены онлайн. Результаты показали среднюю точность распознавания – 85,37 %, минимальную – 78,8 % и рекордную – 91,9 %.ru_RU
Appears in Collections:Том 21, № 2

Files in This Item:
File Description SizeFormat 
Vishniakou_Voice.pdf619.31 kBAdobe PDFView/Open
Show simple item record Google Scholar

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.