Skip navigation
Please use this identifier to cite or link to this item: https://libeldoc.bsuir.by/handle/123456789/60355
Title: Применение рекурентных нейронных сетей с долгой краткосрочной памятью для задачи распознавания эмоций по речи
Other Titles: Application of recurrent neural networks with long short-term memory for speech emotion recognition tasks
Authors: Краснопрошин, Д. В.
Keywords: материалы конференций;нейронные сети;глубокое обучение;распознавание эмоций
Issue Date: 2025
Publisher: БГУИР
Citation: Краснопрошин, Д. В. Применение рекурентных нейронных сетей с долгой краткосрочной памятью для задачи распознавания эмоций по речи = Application of recurrent neural networks with long short-term memory for speech emotion recognition tasks / Д. В. Краснопрошин // Компьютерные системы и сети : материалы 61-й научной конференции аспирантов, магистрантов и студентов, Минск, 22–26 апреля 2025 г. / Белорусский государственный университет информатики и радиоэлектроники. – Минск, 2025. – C. 592–595.
Abstract: Экспериментально исследуется возможность применения рекуррентных нейронных сетей с долгой краткосрочной памятью нейронных сетей для классификации эмоций в речи. Представлены варианты реализации классификатора на основе рекуррентных сетей с одним, двумя и тремя скрытыми слоями. В качестве исходных речевых признаков использовались мелчастотные кепстральные коэффициенты. Наилучший результат классификации показала трехслойная LSTM-сеть, продемонстрировав значением метрики точности UAR=32%. Также предложены варианты улучшения модели, которые, потенциально могут улучшить качество классификации.
Alternative abstract: The possibility of applying recurrent neural networks with long-term memory for classifying emotions in human speech is experimentally studied. Variants of classifier implementation based on recurrent networks with one, two and three hidden layers are presented. Mel-frequency cepstral coefficients (MFCCs) were used as initial speech features. A three-layer LSTM network showed the best classification results, with an accuracy metric (UAR) of 32%. Possible improvements to the model have also been proposed, which could potentially enhance the quality of the classification.
URI: https://libeldoc.bsuir.by/handle/123456789/60355
Appears in Collections:Компьютерные системы и сети : материалы 61-й научной конференции аспирантов, магистрантов и студентов : сборник статей (2025)

Files in This Item:
File Description SizeFormat 
Krasnoproshin_Primenenie.pdf840.04 kBAdobe PDFView/Open
Show full item record Google Scholar

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.