| Title: | Построение высокоточной интеллектуальной системы обработки естественного туркменского языка на основе комбинированного трансформерного подхода |
| Other Titles: | Development of a high-precision intelligent natural language processing system for the turkmen language based on a combined transformer approach |
| Authors: | Мырадов, М. Т. |
| Keywords: | материалы конференций;Big Data;информационные системы;распознавание речи;языковые модели;архитектура transformer;глубокое машинное обучение;семантический анализ;синтез речи;туркменский язык |
| Issue Date: | 2026 |
| Publisher: | БГУИР |
| Citation: | Мырадов, М. Т. Построение высокоточной интеллектуальной системы обработки естественного туркменского языка на основе комбинированного трансформерного подхода = Development of a high-precision intelligent natural language processing system for the turkmen language based on a combined transformer approach / М. Т. Мырадов // Big Data и анализ высокого уровня = Big Data and Advanced Analytics : сборник научных статей XII Международной научно-практической конференции, Республика Беларусь, Минск, 23 апреля 2026 года : в 2 ч. Ч. 1 / Белорусский государственный университет информатики и радиоэлектроники [и др.] ; редкол.: В. А. Богуш [и др.]. – Минск, 2026. – С. 194–198. |
| Abstract: | Современные системы распознавания речи на базе моделей Whisper Large-v3 и Llama-3 используют архитектуру Transformer и механизмы семантического прогнозирования для высокоточной интерпретации акустических сигналов в текстовую последовательность. Применение оптимизированных алгоритмов Faster-Whisper и архитектуры синтеза VITS позволяет эффективно обрабатывать специфические особенности туркменского языка, обеспечивая при этом высокую скорость вычислений и естественность звучания. Экспериментальное обучение модели на массиве из 4000 часов аудиоданных с использованием графических процессоров NVIDIA А100 подтвердило значительное снижение потерь и достижение высокого уровня точности распознавания. |
| Alternative abstract: | Modem speech recognition systems based on Whisper Large-v3 and Llama-3 models utilize the Transformer architecture and semantic prediction mechanisms for high-precision interpretation of acoustic signals into text sequences. The application of optimized Faster-Whisper algorithms and the VITS synthesis architecture enables efficient processing of the specific features of the Turkmen language, while ensuring high computational speed and natural sound quality. Experimental training of the model on a dataset of 4000 hours of audio data using NVIDIA A100 GPUs confirmed a significant reduction in loss and the achievement of a high level of recognition accuracy. |
| URI: | https://libeldoc.bsuir.by/handle/123456789/63543 |
| Appears in Collections: | BIG DATA and Advanced Analytics = BIG DATA и анализ высокого уровня : сборник научных статей : в 2 ч. (2026)
|