DC Field | Value | Language |
dc.contributor.author | Краснопрошин, Д. В. | - |
dc.date.accessioned | 2025-06-19T11:17:14Z | - |
dc.date.available | 2025-06-19T11:17:14Z | - |
dc.date.issued | 2025 | - |
dc.identifier.citation | Краснопрошин, Д. В. Применение рекурентных нейронных сетей с долгой краткосрочной памятью для задачи распознавания эмоций по речи = Application of recurrent neural networks with long short-term memory for speech emotion recognition tasks / Д. В. Краснопрошин // Компьютерные системы и сети : материалы 61-й научной конференции аспирантов, магистрантов и студентов, Минск, 22–26 апреля 2025 г. / Белорусский государственный университет информатики и радиоэлектроники. – Минск, 2025. – C. 592–595. | en_US |
dc.identifier.uri | https://libeldoc.bsuir.by/handle/123456789/60355 | - |
dc.description.abstract | Экспериментально исследуется возможность применения рекуррентных нейронных сетей с долгой краткосрочной
памятью нейронных сетей для классификации эмоций в речи. Представлены варианты реализации классификатора на основе рекуррентных сетей с одним, двумя и тремя скрытыми слоями. В качестве исходных речевых признаков использовались мелчастотные кепстральные коэффициенты. Наилучший результат классификации показала трехслойная LSTM-сеть, продемонстрировав значением метрики точности UAR=32%. Также предложены варианты улучшения модели, которые, потенциально могут улучшить качество классификации. | en_US |
dc.language.iso | ru | en_US |
dc.publisher | БГУИР | en_US |
dc.subject | материалы конференций | en_US |
dc.subject | нейронные сети | en_US |
dc.subject | глубокое обучение | en_US |
dc.subject | распознавание эмоций | en_US |
dc.title | Применение рекурентных нейронных сетей с долгой краткосрочной памятью для задачи распознавания эмоций по речи | en_US |
dc.title.alternative | Application of recurrent neural networks with long short-term memory for speech emotion recognition tasks | en_US |
dc.type | Article | en_US |
local.description.annotation | The possibility of applying recurrent neural networks with long-term memory for classifying emotions in human speech is
experimentally studied. Variants of classifier implementation based on recurrent networks with one, two and three hidden layers are presented. Mel-frequency cepstral coefficients (MFCCs) were used as initial speech features. A three-layer LSTM network showed the best classification results, with an accuracy metric (UAR) of 32%. Possible improvements to the model have also been proposed, which could potentially enhance the quality of the classification. | en_US |
Appears in Collections: | Компьютерные системы и сети : материалы 61-й научной конференции аспирантов, магистрантов и студентов : сборник статей (2025)
|