Skip navigation
Please use this identifier to cite or link to this item: https://libeldoc.bsuir.by/handle/123456789/59753
Title: Semantic Analysis of Speaker Personality Traits for Voice User Interfaces of Intelligent Systems
Other Titles: Семантический анализ личностных черт диктора для голосовых интерфейсов интеллектуальных систем
Authors: Krischenovich, V.
Sokolovich, M.
Zahariev, V.
Rudolf, A.
Keywords: материалы конференций;semantic analysis;speech interfaces;intelligent systems;smart city
Issue Date: 2025
Publisher: БГУИР
Citation: Semantic Analysis of Speaker Personality Traits for Voice User Interfaces of Intelligent Systems = Семантический анализ личностных черт диктора для голосовых интерфейсов интеллектуальных систем / V. Krischenovich, M. Sokolovich, V. Zahariev, A. Rudolf // Открытые семантические технологии проектирования интеллектуальных систем = Open Semantic Technologies for Intelligent Systems (OSTIS) : сборник научных трудов / Белорусский государственный университет информатики и радиоэлектроники ; редкол.: В. В. Голенков [и др.]. – Минск, 2025. – Вып. 9. – С. 327–332.
Abstract: Modern speech interfaces have achieved remarkable advancements in intelligibility, naturalness of synthesized speech, and accuracy of speech recognition, enabling seamless integration into everyday life. These capabilities underpin the growing prevalence of voice-based interactions with artificial intelligence (AI) systems. However, enhancing user-machine interaction requires addressing empathy and personalization, adapting AI responses to users socio-cultural, professional, and psychological traits. This is particularly relevant as anthropomorphic robotic systems emerge, where voice may serve as the sole communication channel. This paper explores how semantic analysis of vocal characteristics can infer personal traits, leveraging open semantic technologies to improve intelligent systems adaptability and empathy. Speech interfaces (SI) or voice user interfaces (VUI) have evolved significantly, with text-to-speech (TTS) systems achieving high naturalness and speech-to-text (STT) systems boasting impressive recognition accuracy [1]. These advancements, driven by deep learning and large-scale datasets, have made voice a primary modality for interacting with AI, from virtual assistants like Siri and Alexa to cutting-edge models like ChatGPT with voice capabilities [2]. Currently, such systems are ubiquitous, facilitating tasks from ordinary scheduling to complex problem solving [3].
Alternative abstract: В статье представлен подход к повышению адаптивности и приданию свойств эмпатичного взаимодействия голосовым интерфейсам интеллектуальных систем за счёт семантического анализа личностных черт говорящего. Используя технологию OSTIS, предложено формализовать модель «Большой пятёрки» в семантической онтологии, связывающей акустические параметры речи с психометрическими шкалами и чертами личности. Это позволяет системам в реальном времени анализировать голосовые характеристики, такие как темп, эмоциональность и тональность, и адаптировать ответы под психологический профиль пользователя. Такой подход улучшает взаимодействие, делая его более персонализированным и эмоционально отзывчивым, что особенно важно для антропоморфных роботов и виртуальных ассистентов. Применение OSTIS обеспечивает гибкость и масштабируемость, создавая основу для нового поколения речевых интерфейсов, способных учитывать индивидуальные особенности пользователей.
URI: https://libeldoc.bsuir.by/handle/123456789/59753
Appears in Collections:OSTIS-2025

Files in This Item:
File Description SizeFormat 
Krischenovich_Semantic.pdf137.99 kBAdobe PDFView/Open
Show full item record Google Scholar

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.