Skip navigation
Please use this identifier to cite or link to this item: https://libeldoc.bsuir.by/handle/123456789/63996
Full metadata record
DC FieldValueLanguage
dc.contributor.authorКраснопрошин, Д. В.-
dc.coverage.spatialМинскen_US
dc.date.accessioned2026-06-04T08:59:17Z-
dc.date.available2026-06-04T08:59:17Z-
dc.date.issued2026-
dc.identifier.citationКраснопрошин, Д. В. Применение LSTM моделей с механизмом внимания и остаточными связями для задачи классификации эмоций в речи = Application of LSTM models with attention mechanism and residual connections for speech emotion recognition tasks / Д. В. Краснопрошин // Компьютерные системы и сети : сборник материалов 62-й научной конференции аспирантов, магистрантов и студентов БГУИР, Минск, 13–17 апреля 2026 г. / Белорусский государственный университет информатики и радиоэлектроники. – Минск, 2026. – С. 269–271.en_US
dc.identifier.urihttps://libeldoc.bsuir.by/handle/123456789/63996-
dc.description.abstractЭкспериментально исследуется возможность применения LSTM с механизмом внимания и остаточными связями для классификации эмоций в речи. В качестве исходных речевых признаков использовались мелчастотные кепстральные коэффициенты и хромограммы. Наилучший результат классификации показала ResLSTM-SA-сеть со скрытой размерность в 128 нейронов, продемонстрировав значением метрики точности UAR=56.4%. Также предложены варианты улучшения модели, которые, гипотетически могут улучшить качество распознавания.en_US
dc.language.isoruen_US
dc.publisherБГУИРen_US
dc.subjectматериалы конференцийen_US
dc.subjectнейронные сетиen_US
dc.subjectраспознавание эмоцийen_US
dc.subjectрекуррентные нейронные сетиen_US
dc.titleПрименение LSTM моделей с механизмом внимания и остаточными связями для задачи классификации эмоций в речиen_US
dc.title.alternativeApplication of LSTM models with attention mechanism and residual connections for speech emotion recognition tasksen_US
dc.typeArticleen_US
local.description.annotationThe feasibility of using an LSTM model with an attention mechanism and residual connections for classifying emotions in speech is experimentally investigated. Mel-frequency cepstral coefficients (MFCCs) and chroma features were used as initial speech features. The ResLSTM-SA network with a hidden size of 128 neurons demonstrated the best result, yielding UAR metric = 56.4%. Model enhancements that could potentially improve performance are also proposed.en_US
Appears in Collections:Компьютерные системы и сети : материалы 62-й научной конференции аспирантов, магистрантов и студентов : сборник статей (2026)

Files in This Item:
File Description SizeFormat 
Krasnoproshin_Primenenie.pdf497.04 kBAdobe PDFView/Open
Show simple item record Google Scholar

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.