Skip navigation
Please use this identifier to cite or link to this item: https://libeldoc.bsuir.by/handle/123456789/60355
Full metadata record
DC FieldValueLanguage
dc.contributor.authorКраснопрошин, Д. В.-
dc.date.accessioned2025-06-19T11:17:14Z-
dc.date.available2025-06-19T11:17:14Z-
dc.date.issued2025-
dc.identifier.citationКраснопрошин, Д. В. Применение рекурентных нейронных сетей с долгой краткосрочной памятью для задачи распознавания эмоций по речи = Application of recurrent neural networks with long short-term memory for speech emotion recognition tasks / Д. В. Краснопрошин // Компьютерные системы и сети : материалы 61-й научной конференции аспирантов, магистрантов и студентов, Минск, 22–26 апреля 2025 г. / Белорусский государственный университет информатики и радиоэлектроники. – Минск, 2025. – C. 592–595.en_US
dc.identifier.urihttps://libeldoc.bsuir.by/handle/123456789/60355-
dc.description.abstractЭкспериментально исследуется возможность применения рекуррентных нейронных сетей с долгой краткосрочной памятью нейронных сетей для классификации эмоций в речи. Представлены варианты реализации классификатора на основе рекуррентных сетей с одним, двумя и тремя скрытыми слоями. В качестве исходных речевых признаков использовались мелчастотные кепстральные коэффициенты. Наилучший результат классификации показала трехслойная LSTM-сеть, продемонстрировав значением метрики точности UAR=32%. Также предложены варианты улучшения модели, которые, потенциально могут улучшить качество классификации.en_US
dc.language.isoruen_US
dc.publisherБГУИРen_US
dc.subjectматериалы конференцийen_US
dc.subjectнейронные сетиen_US
dc.subjectглубокое обучениеen_US
dc.subjectраспознавание эмоцийen_US
dc.titleПрименение рекурентных нейронных сетей с долгой краткосрочной памятью для задачи распознавания эмоций по речиen_US
dc.title.alternativeApplication of recurrent neural networks with long short-term memory for speech emotion recognition tasksen_US
dc.typeArticleen_US
local.description.annotationThe possibility of applying recurrent neural networks with long-term memory for classifying emotions in human speech is experimentally studied. Variants of classifier implementation based on recurrent networks with one, two and three hidden layers are presented. Mel-frequency cepstral coefficients (MFCCs) were used as initial speech features. A three-layer LSTM network showed the best classification results, with an accuracy metric (UAR) of 32%. Possible improvements to the model have also been proposed, which could potentially enhance the quality of the classification.en_US
Appears in Collections:Компьютерные системы и сети : материалы 61-й научной конференции аспирантов, магистрантов и студентов : сборник статей (2025)

Files in This Item:
File Description SizeFormat 
Krasnoproshin_Primenenie.pdf840.04 kBAdobe PDFView/Open
Show simple item record Google Scholar

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.