Система повышения разборчивости речи на основе модели слухового восприятия и компрессии динамического диапазона сигнала

Семенюк, Н. А.

Please use this identifier to cite or link to this item: https://libeldoc.bsuir.by/handle/123456789/44163

Title:	Система повышения разборчивости речи на основе модели слухового восприятия и компрессии динамического диапазона сигнала
Other Titles:	System for improving speech intelligibility based on an auditory perception model and dynamic signal range compression
Authors:	Семенюк, Н. А.
Keywords:	материалы конференций;звуковые сигналы;гаммафон-фильтры;аудиограммы;gammaton-filter;dynamic range compressor;audiogram
Issue Date:	2021
Publisher:	БГУИР
Citation:	Семенюк, Н. А. Система повышения разборчивости речи на основе модели слухового восприятия и компрессии динамического диапазона сигнала / Семенюк Н. А. // Компьютерные системы и сети : сборник статей 57-ой научной конференции аспирантов, магистрантов и студентов, Минск, 19-23 апреля 2021 г. / Белорусский государственный университет информатики и радиоэлектроники. – Минск, 2021. – С. 11–15.
Abstract:	В работе рассмотрена система повышения разборчивости речи на основе модели слухового восприятия и компрессии динамического диапазона сигнала. Функционирование системы сводится к субполосной обработке звукового сигнала, согласованной с механизмом работы слуховой системы человека. Банк гамматон-фильтров используется для разложения звукового сигнала на компоненты (субполосы). Каждая субполоса проходит через свой компрессор динамического диапазона, задача которого – автоматический выбор коэффициента усиления для текущей субполосы. Усиленные субполосы синтезируются в выходной сигнал путём суммирования. Настройка системы выполняется по аудиограмме тугоухого человека. Для проверки работоспособности системы проведено MATLAB-моделирование.
Alternative abstract:	The paper considers a system for improving speech intelligibility based on an auditory perception model and dynamic signal range compression. The functioning of the system is reduced to sub-band processing of the audio signal coordinated with human auditory system mechanism. A bank of gammaton-filters is used to decompose an audio signal into components (sub-bands). Each subband passes through its own dynamic range compressor whose task is to automatically select the gain for the current subband. The amplified sub-bands are synthesized into the output signal by summation. The system configuration is based on the audiogram of a deaf person. A MATLAB simulation was performed to check the system's performance.
URI:	https://libeldoc.bsuir.by/handle/123456789/44163
Appears in Collections:	Компьютерные системы и сети : материалы 57-й научной конференции аспирантов, магистрантов и студентов : сборник статей (2021)

Files in This Item:

File	Description	Size	Format
Semenyuk_Sistema.pdf		848.9 kB	Adobe PDF	View/Open

Show full item record Google Scholar