Национальный цифровой ресурс Руконт - межотраслевая электронная библиотека (ЭБС) на базе технологии Контекстум (всего произведений: 635050)
Контекстум
Руконтекст антиплагиат система
Фундаментальные и прикладные проблемы техники и технологии  / 3 2010

ПСИХОАКУСТИЧЕСКИЙ КЛАССИФИКАТОР КАДРОВ ПРИ НИЗКОСКОРОСТНОМ КОДИРОВАНИИ ШИРОКОПОЛОСНОГО РЕЧЕВОГО СИГНАЛА (90,00 руб.)

0   0
Первый авторИлюшин
АвторыАфанасьев А.А., Басов О.О.
Страниц5
ID494777
АннотацияСнижение скорости передачи и повышение качества синтезированного широкополосного речевого сигнала по показателям естественности его звучания и узнаваемости говорящего может быть достигнуто за счет учета особенностей восприятия речи человеком. В статье предложен новый метод использования свойств психоакустики. Показана возможность оптимизации распределения информационных ресурсов кодека с переменной структурой
УДК621.391
Илюшин, М.В. ПСИХОАКУСТИЧЕСКИЙ КЛАССИФИКАТОР КАДРОВ ПРИ НИЗКОСКОРОСТНОМ КОДИРОВАНИИ ШИРОКОПОЛОСНОГО РЕЧЕВОГО СИГНАЛА / М.В. Илюшин, А.А. Афанасьев, О.О. Басов // Фундаментальные и прикладные проблемы техники и технологии .— 2010 .— 3 .— С. 73-77 .— URL: https://rucont.ru/efd/494777 (дата обращения: 06.05.2024)

Предпросмотр (выдержки из произведения)

Фундаментальные и прикладные проблемы техники и технологии ПРИБОРОСТРОЕНИЕ И БИОТЕХНИЧЕСКИЕ СИСТЕМЫ УДК 621.391 М.В. ИЛЮШИН, А.А. АФАНАСЬЕВ, О.О. БАСОВ ПСИХОАКУСТИЧЕСКИЙ КЛАССИФИКАТОР КАДРОВ ПРИ НИЗКОСКОРОСТНОМ КОДИРОВАНИИ ШИРОКОПОЛОСНОГО РЕЧЕВОГО СИГНАЛА Снижение скорости передачи и повышение качества синтезированного широкополосного речевого сигнала по показателям естественности его звучания и узнаваемости говорящего может быть достигнуто за счет учета особенностей восприятия речи человеком. <...> В статье предложен новый метод использования свойств психоакустики. <...> Ключевые слова: широкополосный речевой сигнал, психоакустика, перцептуальная энтропия, линейное предсказание, адаптивная система. <...> В настоящее время в условиях развития глобального информационного общества, когда имеется возможность мобильного доступа к широкому спектру мультимедийных услуг, для реализации полноценного телекоммуникационного обмена в некоторых приложениях современных сетей связи необходимы низкоскоростное (менее 16 кбит/с) кодирование и передача речевого сигнала (РС). <...> При этом требуется обеспечить естественность звучания восстановленного речевого сигнала, включая возможность идентификации диктора, его эмоционального состояния и характеристик окружающей его акустической среды [1]. <...> Для низкоскоростного кодирования речи используются вокодеры, модель речеобразования которых основана на параметрическом представлении РС. <...> Перспективными направлениями повышения качества звучания восстановленного РС являются переход от кодирования узкополосного РС к передаче широкополосного речевого сигнала (ШРС) с диапазоном частот от 50 до 7000 Гц [2] и учет при кодировании особенностей восприятия речи человеком [3, 4]. <...> Современные кодеры широкополосного речевого сигнала (КШРС) используют метод линейного предсказания с кодовым возбуждением и строятся по встраиваемой технологии: с пирамидальной, многополосной и/или <...>