| DC Field | Value | Language |
| dc.contributor.author | Краснопрошин, Д. В. | - |
| dc.coverage.spatial | Минск | en_US |
| dc.date.accessioned | 2026-06-04T08:59:17Z | - |
| dc.date.available | 2026-06-04T08:59:17Z | - |
| dc.date.issued | 2026 | - |
| dc.identifier.citation | Краснопрошин, Д. В. Применение LSTM моделей с механизмом внимания и остаточными связями для задачи классификации эмоций в речи = Application of LSTM models with attention mechanism and residual connections for speech emotion recognition tasks / Д. В. Краснопрошин // Компьютерные системы и сети : сборник материалов 62-й научной конференции аспирантов, магистрантов и студентов БГУИР, Минск, 13–17 апреля 2026 г. / Белорусский государственный университет информатики и радиоэлектроники. – Минск, 2026. – С. 269–271. | en_US |
| dc.identifier.uri | https://libeldoc.bsuir.by/handle/123456789/63996 | - |
| dc.description.abstract | Экспериментально исследуется возможность применения LSTM с механизмом внимания и остаточными связями для
классификации эмоций в речи. В качестве исходных речевых признаков использовались мелчастотные кепстральные
коэффициенты и хромограммы. Наилучший результат классификации показала ResLSTM-SA-сеть со скрытой размерность в 128 нейронов, продемонстрировав значением метрики точности UAR=56.4%. Также предложены варианты улучшения модели, которые, гипотетически могут улучшить качество распознавания. | en_US |
| dc.language.iso | ru | en_US |
| dc.publisher | БГУИР | en_US |
| dc.subject | материалы конференций | en_US |
| dc.subject | нейронные сети | en_US |
| dc.subject | распознавание эмоций | en_US |
| dc.subject | рекуррентные нейронные сети | en_US |
| dc.title | Применение LSTM моделей с механизмом внимания и остаточными связями для задачи классификации эмоций в речи | en_US |
| dc.title.alternative | Application of LSTM models with attention mechanism and residual connections for speech emotion recognition tasks | en_US |
| dc.type | Article | en_US |
| local.description.annotation | The feasibility of using an LSTM model with an attention mechanism and residual connections for classifying emotions in speech
is experimentally investigated. Mel-frequency cepstral coefficients (MFCCs) and chroma features were used as initial speech features. The ResLSTM-SA network with a hidden size of 128 neurons demonstrated the best result, yielding UAR metric = 56.4%. Model enhancements that could potentially improve performance are also proposed. | en_US |
| Appears in Collections: | Компьютерные системы и сети : материалы 62-й научной конференции аспирантов, магистрантов и студентов : сборник статей (2026)
|