УДК 004.934.2 СИСТЕМА АНАЛИЗА ЗВУКОВЫХ ПОТОКОВ С РАСПОЗНАВАНИЕМ СЛИТНОЙ РЕЧИ SYSTEM ANALYSIS OF AUDIO STREAMS WITH CONTINUOUS SPEECH RECOGNITION Фархадов Маис Паша Оглы д-р техн. наук, зав. лабораторией E-mail: mais@ipu.ru Смирнов Валентин Александрович канд. техн. наук, ст. научн. сотрудник E-mail: speechdrive@mail.ru Васьковский Сергей Владимирович канд. техн. наук, ст. научн. сотрудник E-mail: v63v@yandex.ru Абраменков Александр Николаевич вед. инженер-программист E-mail: aabramenkov@asmon.ru Институт проблем управления РАН им. <...> В. А. Трапезникова, Москва Аннотация: Рассмотрены основные концепции систем анализа звуковых потоков на основе распознавания ключевых слов для русского языка с применением распознавания слитной речи с большим словарем. <...> Описаны основные алгоритмы и настройки системы, в том числе алгоритм вариации произношения и экспериментальные результаты из реальной жизни по данным телекомуникационных компаний. <...> Система основана на платформе распознавания речи, языковых моделей и алгоритмов CMU Sphinx с открытым исходным кодом. <...> Эффективное сочетание базовых статистических методов, обучающих данных из реального мира и широкое использование лингвистических знаний обеспечивает применимость системы для промышленного использования. <...> Ключевые слова: распознавание ключевых слов, распознавание слитной речи с большим словарем, лингвистические знания, комплекс анализа потоковых аудиоданных, глобальная система мониторинга информационного пространства. <...> ВВЕДЕНИЕ Необходимость обеспечения общественной безопасности и улучшения качества обслуживания клиентов вызвала интенсивное развитие речевых аналитических систем, преобразующих речевые данные в измеримый и доступный для поиска индекс слов, фраз и паралингвистических маркеров с применением технологии распознава28 Farkhadov Mais P. <...> The system is based on a speech recognition platform, language models, and algorithms of CMU Sphinx open source system. <...> Последний подход распространен в связи с доступностью базовых алгоритмов, дешевизной аппаратных средств для запуска <...>