Title: | Система повышения разборчивости речи на основе модели слухового восприятия и компрессии динамического диапазона сигнала |
Other Titles: | System for improving speech intelligibility based on an auditory perception model and dynamic signal range compression |
Authors: | Семенюк, Н. А. |
Keywords: | материалы конференций;звуковые сигналы;гаммафон-фильтры;аудиограммы;gammaton-filter;dynamic range compressor;audiogram |
Issue Date: | 2021 |
Publisher: | БГУИР |
Citation: | Семенюк, Н. А. Система повышения разборчивости речи на основе модели слухового восприятия и компрессии динамического диапазона сигнала / Семенюк Н. А. // Компьютерные системы и сети : сборник статей 57-ой научной конференции аспирантов, магистрантов и студентов, Минск, 19-23 апреля 2021 г. / Белорусский государственный университет информатики и радиоэлектроники. – Минск, 2021. – С. 11–15. |
Abstract: | В работе рассмотрена система повышения разборчивости речи на основе модели слухового восприятия и компрессии динамического диапазона сигнала. Функционирование системы сводится к субполосной обработке звукового сигнала, согласованной с механизмом работы слуховой системы человека. Банк гамматон-фильтров используется для разложения звукового сигнала на компоненты (субполосы). Каждая субполоса проходит через свой компрессор динамического диапазона, задача которого – автоматический выбор коэффициента усиления для текущей субполосы. Усиленные субполосы синтезируются в выходной сигнал путём суммирования. Настройка системы выполняется по аудиограмме тугоухого человека. Для проверки работоспособности системы проведено MATLAB-моделирование. |
Alternative abstract: | The paper considers a system for improving speech intelligibility based on an auditory perception model and dynamic signal range compression. The functioning of the system is reduced to sub-band processing of the audio signal coordinated with human auditory system mechanism. A bank of gammaton-filters is used to decompose an audio signal into components (sub-bands). Each subband passes through its own dynamic range compressor whose task is to automatically select the gain for the current subband. The amplified sub-bands are synthesized into the output signal by summation. The system configuration is based on the audiogram of a deaf person. A MATLAB simulation was performed to check the system's performance. |
URI: | https://libeldoc.bsuir.by/handle/123456789/44163 |
Appears in Collections: | Компьютерные системы и сети : материалы 57-й научной конференции аспирантов, магистрантов и студентов : сборник статей (2021)
|