Skip navigation
Please use this identifier to cite or link to this item: https://libeldoc.bsuir.by/handle/123456789/63894
Full metadata record
DC FieldValueLanguage
dc.contributor.authorБекарев, С. С.-
dc.coverage.spatialМинскen_US
dc.date.accessioned2026-06-01T09:30:55Z-
dc.date.available2026-06-01T09:30:55Z-
dc.date.issued2026-
dc.identifier.citationБекарев, С. С. Архитектура non-autoregressive синтеза речи с CTC-выравниванием на основе двухэтапного пайплайна / С. С. Бекарев // Компьютерные системы и сети : сборник материалов 62-й научной конференции аспирантов, магистрантов и студентов БГУИР, Минск, 13–17 апреля 2026 г. / Белорусский государственный университет информатики и радиоэлектроники. – Минск, 2026. – С. 247–248.en_US
dc.identifier.urihttps://libeldoc.bsuir.by/handle/123456789/63894-
dc.description.abstractВ работе представлена модульная архитектура синтеза речи, комбинирующая методы автоматического распознавания речи для получения точного выравнивания текста и аудио с non-autoregressive генерацией акустических признаков. Для преодоления проблем нестабильности attention-механизмов, характерных для seq2seq моделей семейства Tacotron, разработан двухэтапный пайплайн: на первом этапе обучается CTC-based модель распознавания речи, после чего алгоритм Витерби применяется для извлечения строгого монотонного alignment между символами текста русского языка и кадрами мел-спектрограммы. Полученные временные метки используются для обучения отдельного DurationPredictor (предиктор длительности), предсказывающего количество фреймов для каждого входного символа. Акустическая модель на основе расширенных эмбеддингов генерирует логарифмированные мел-спектрограммы (80 мел-фильтров).en_US
dc.language.isoruen_US
dc.publisherБГУИРen_US
dc.subjectматериалы конференцийen_US
dc.subjectсинтез речиen_US
dc.subjectавтоматическое распознавание речиen_US
dc.subjectдвухэтапный пайплайнen_US
dc.subjectакустическая моделиen_US
dc.subjectмел-спектрограммыen_US
dc.titleАрхитектура non-autoregressive синтеза речи с CTC-выравниванием на основе двухэтапного пайплайнаen_US
dc.typeArticleen_US
Appears in Collections:Компьютерные системы и сети : материалы 62-й научной конференции аспирантов, магистрантов и студентов : сборник статей (2026)

Files in This Item:
File Description SizeFormat 
Bekarev_Arhitektura.pdf415.21 kBAdobe PDFView/Open
Show simple item record Google Scholar

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.