Skip navigation
Please use this identifier to cite or link to this item: https://libeldoc.bsuir.by/handle/123456789/54260
Title: Малоразмерные спектральные признаки для машинного обучения в задачах анализа и классификации голосового сигнала
Other Titles: Small-size spectral features for machine learning in voice signal analysis and classification tasks
Authors: Лихачёв, Д. С.
Вашкевич, М. И.
Петровский, Н. А.
Азаров, И. С.
Keywords: публикации ученых;машинное обучение;голосовые сигналы;распознавание речи;авторегрессия;спектральные признаки
Issue Date: 2023
Publisher: ОИПИ НАН Беларуси
Citation: Малоразмерные спектральные признаки для машинного обучения в задачах анализа и классификации голосового сигнала = Small-size spectral features for machine learning in voice signal analysis and classification tasks / Д. С. Лихачёв [и др.] // Информатика. – 2023. – Т. 20, № 1. – С. 104–114.
Abstract: Цели. Решается задача разработки метода вычисления малоразмерных спектральных признаков, повышающего эффективность существующих систем машинного обучения для анализа и классификации голосовых сигналов. Методы. Спектральные признаки извлекаются с помощью генеративного подхода, который предполагает вычисление дискретного спектра Фурье последовательности отчетов, сгенерированной с использованием авторегрессионной модели входного голосового сигнала. Сгенерированная последовательность, обрабатываемая дискретным преобразованием Фурье, учитывает периодичность преобразования, позволяя тем самым повысить точность спектральной оценки анализируемого сигнала. Результаты. Предложен и описан генеративный метод вычисления спектральных признаков, предназначенных для применения в системах машинного обучения при анализе и классификации голосовых сигналов. Проведен экспериментальный анализ точности и стабильности представления спектра тестового сигнала с известным спектральным составом с использованием огибающих. Огибающие вычислялись с помощью предложенного генеративного метода и дискретного преобразования Фурье с различными окнами анализа (прямоугольным окном и окном Ханна). Проведенный анализ показал, что генеративный метод получения спектральных огибающих позволил добиться более точного представления спектра тестового сигнала по критерию минимума квадратичной ошибки. Проведено сравнение эффективности классификации голосового сигнала при использовании предложенных признаков и признаков на основе мел-частотных кепстральных коэффициентов. В качестве базовой тестовой системы для оценки эффективности предлагаемого подхода на практике использовалась система диагностики бокового амиотрофического склероза по голосу. Заключение. Результаты экспериментов показали ощутимое повышение точности классификации при использовании предлагаемых признаков для вычисления признаков по сравнению с признаками на основе мел-частотных кепстральных коэффициентов
Alternative abstract: Objectives. The problem of developing a method for calculating small-sized spectral features that increases the efficiency of existing machine learning systems for analyzing and classifying voice signals is being solved. Methods. Spectral features are extracted using a generative approach, which involves calculating a discrete Fourier spectrum for a sequence of samples generated using an autoregressive model of the input voice signal. The generated sequence processed by the discrete Fourier transform considers the periodicity of the transform and thereby increase the accuracy of spectral estimation of the analyzed signal. Results. A generative method for calculating spectral features intended for use in machine learning systems for the analysis and classification of voice signals is proposed and described. An experimental analysis of the accuracy and stability of the spectrum representation of a test signal with a known spectral composition has been carried out using the envelopes. The envelopes were calculated using the proposed generative method and using the discrete Fourier transform with different analysis windows (rectangular window and Hanna window). The analysis showed that the spectral envelopes obtained using the proposed method more accurately represent the spectrum of the test signal according to the criterion of minimum square error. A comparison of the effectiveness of the voice signal classification with proposed features and the features based on the mel-frequency kepstral coefficients is carried out. A diagnostic system for amyotrophic lateral sclerosis was used as a basic test system to evaluate the effectiveness of the proposed approach in practice. Conclusion. The obtained experimental results showed a significant increase of the classification accuracy when using the proposed approach for calculating features compared with the features based on the mel-frequency kepstral coefficients.
URI: https://libeldoc.bsuir.by/handle/123456789/54260
DOI: https://doi.org/10.37661/1816-0301-2023-20-1-104-114
Appears in Collections:Публикации в изданиях Республики Беларусь

Files in This Item:
File Description SizeFormat 
Lihachev_Malorazmernye.pdf719.31 kBAdobe PDFView/Open
Show full item record Google Scholar

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.