Национальный цифровой ресурс Руконт - межотраслевая электронная библиотека (ЭБС) на базе технологии Контекстум (всего произведений: 634655)
Контекстум
.
Информационно-управляющие системы

Информационно-управляющие системы №4 2010

0   0
Страниц88
ID284633
Аннотация Журнал предназначен для руководителей и ведущих специалистов научно-исследовательских и опытно-конструкторских организаций и предприятий отраслей промышленности, выпускающих продукцию и предоставляющих услуги в области телекоммуникаций, защиты и обработки информации, систем управления, встраиваемых информационно-управляющих систем различного назначений. Также журнал может быть полезен научным сотрудникам, докторантам, аспирантам и студентам информационных и вычислительных специальностей вузов. Тематические разделы: обработка информации и управление, моделирование систем и процессов, программные и аппаратные средства, защита информации, кодирование и передача информации, информационные каналы и среды, информационно-измерительные системы, системный анализ, стохастическая динамика и хаос, управление в социально-экономических системах, управление в медицине и биологии, информационные технологии и образование, краткие научные сообщения, рецензии (на книги, журналы, статьи, диссертации), хроника и информация (о семинарах, конференциях, выставках, юбилеях, а также очерки по истории науки и техники).
Информационно-управляющие системы .— 2010 .— №4 .— 88 с. — URL: https://rucont.ru/efd/284633 (дата обращения: 23.04.2024)

Предпросмотр (выдержки из произведения)

Автоматическая обработка и статистический анализ новостного текстового корпуса для модели языка системы распознавания русской речи Воробьёв С. Н., Гирина Н. В., Лазарев И. В. <...> Оценивание временного положения импульсного сигнала инфОрмациОннО-управлЯющие системы Костоглотов А. А., Костоглотов А. И., Чеботарев А. В. <...> Радиомаркер на поверхностных акустических волнах с помехоустойчивым частотно-манипулированным кодом 22 Селиванова Е. Н., Городецкий А. Е. <...> Компьютерное моделирование процессов возбуждения и синхронизации колебаний ресничек мерцательных клеток 29 прОграммные и аппаратные средства Сольницев Р. И., Тревгода М. А. <...> Программное обеспечение подсистемы САПР замкнутой системы управления «Природа-техногеника» Суясов Д. И. <...> Выделение структурных признаков изображений символов на основе клеточных автоматов с метками Защита инфОрмации Григорьян А. К., Литвинов М. Ю. <...> Применение вейвлет-преобразования для внедрения ЦВЗ в видеопоток в режиме реального времени управление в медицине и биОлОгии Кузнецов А. А. <...> Количество информации и энтропия ярусной диаграммы ритма сердца Караев Р. А., Сафарли И. И., Нагиев М. А., Абдурагимов Т. Ф., Гюльмамедов Р. Г. Когнитивный анализ и управление инновационными проектами предприятий Тушавин В. А. <...> Методы расширения языков программирования (Часть 1) 46 15 2 9 ОбрабОтка инфОрмации и управление УДК 004.522 автОматическая ОбрабОтка и статистический анализ нОвОстнОгО текстОвОгО кОрпуса для мОдели языка системы распОзнавания русскОй речи И. С. Кипяткова, младший научный сотрудник А. А. Карпов, канд. техн. наук, старший научный сотрудник Санкт-Петербургский институт информатики и автоматизации РАН Описывается процесс автоматической обработки текстового корпуса, собранного из новостных лент ряда интернет-сайтов, для создания вероятностной n-граммной модели разговорного русского языка. <...> Ключевые слова — модель языка, текстовый корпус русского языка, автоматическая обработка текста <...>
Информационно-управляющие_системы_№4_2010.pdf
Стр.1
НАУЧНЫЙ ЖУРНАЛ 4(47)/2010 РЕЦЕНЗИРУЕМОЕ ИЗДАНИЕ Учредитель ОАО «Издательство “Политехника”» Главный редактор М. Б. Сергеев, доктор технических наук, профессор Зам. главного редактора Г. Ф. Мощенко Редакционный совет: Председатель А. А. Оводенко, доктор технических наук, профессор В. Н. Васильев, доктор технических наук, профессор В. Н. Козлов, доктор технических наук, профессор Ю. Ф. Подоплекин, доктор технических наук, профессор Д. В. Пузанков, доктор технических наук, профессор В. В. Симаков, доктор технических наук, профессор А. Л. Фрадков, доктор технических наук, профессор Л. И. Чубраева, доктор технических наук, профессор, чл.-корр. РАН Р. М. Юсупов, доктор технических наук, профессор, чл.-корр. РАН Редакционная коллегия: В. Г. Анисимов, доктор технических наук, профессор Е. А. Крук, доктор технических наук, профессор В. Ф. Мелехин, доктор технических наук, профессор А. В. Смирнов, доктор технических наук, профессор В. И. Хименко, доктор технических наук, профессор А. А. Шалыто, доктор технических наук, профессор А. П. Шепета, доктор технических наук, профессор З. М. Юлдашев, доктор технических наук, профессор Редактор: А. Г. Ларионова Корректор: Т. В. Звертановская Дизайн: А. Н. Колешко, М. Л. Черненко Компьютерная верстка: С. В. Барашкова Ответственный секретарь: О. В. Муравцова Адрес редакции: 190000, Санкт-Петербург, Б. Морская ул., д. 67, ГУАП, РИЦ Тел.: (812) 494-70-44 Факс: (812) 494-70-18 E-mail: 80x@mail.ru Сайт: www.i-us.ru Журнал зарегистрирован в Министерстве РФ по делам печати, телерадиовещания и средств массовых коммуникаций. Свидетельство о регистрации ПИ № 77-12412 от 19 апреля 2002 г. Журнал входит в «Перечень ведущих рецензируемых научных журналов и изданий, в которых должны быть опубликованы основные научные результаты диссертации на соискание ученой степени доктора и кандидата наук». Журнал распространяется по подписке. Подписку можно оформить через редакцию, а также в любом отделении связи по каталогам: «Роспечать»: № 48060, № 15385; «Пресса России»: № 42476. © Коллектив авторов, 2010 ОбрабОтка инфОрмации и управление Кипяткова И. С., Карпов А. А. Автоматическая обработка и статистический анализ новостного текстового корпуса для модели языка системы распознавания русской речи Воробьёв С. Н., Гирина Н. В., Лазарев И. В. Оценивание временного положения импульсного сигнала инфОрмациОннО-управлЯющие системы Костоглотов А. А., Костоглотов А. И., Чеботарев А. В. Метод объединенного принципа максимума в параметрических задачах оптимального управления мОделирОвание систем и прОцессОв Койгеров А. С., Дмитриев В. Ф. Радиомаркер на поверхностных акустических волнах с помехоустойчивым частотно-манипулированным кодом 22 Селиванова Е. Н., Городецкий А. Е. Компьютерное моделирование процессов возбуждения и синхронизации колебаний ресничек мерцательных клеток 29 прОграммные и аппаратные средства Сольницев Р. И., Тревгода М. А. Программное обеспечение подсистемы САПР замкнутой системы управления «Природа-техногеника» Суясов Д. И. Выделение структурных признаков изображений символов на основе клеточных автоматов с метками Защита инфОрмации Григорьян А. К., Литвинов М. Ю. Применение вейвлет-преобразования для внедрения ЦВЗ в видеопоток в режиме реального времени управление в медицине и биОлОгии Кузнецов А. А. Количество информации и энтропия ярусной диаграммы ритма сердца Караев Р. А., Сафарли И. И., Нагиев М. А., Абдурагимов Т. Ф., Гюльмамедов Р. Г. Когнитивный анализ и управление инновационными проектами предприятий Тушавин В. А. Менеджмент качества службы поддержки пользователей в области информационных технологий Карасев В. В., Соложенцев Е. Д. Тематика исследований по логиковероятностному управлению риском и эффективностью в структурносложных системах краткие сООбщениЯ Курбанов В. Г. Метод оценки надежности сложных технических систем 75 сведениЯ Об автОраХ аннОтации Сдано в набор 20.05.10. Подписано в печать 11.08.10. Формат 60×841/8. Бумага офсетная. Гарнитура SchoolBookC. Печать офсетная. Усл. печ. л. 11,0. Уч.-изд. л. 14,0. Тираж 1000 экз. Заказ 267. Оригинал-макет изготовлен в редакционно-издательском центре ГУАП. 190000, Санкт-Петербург, Б. Морская ул., 67. Отпечатано с готовых диапозитивов в редакционно-издательском центре ГУАП. 190000, Санкт-Петербург, Б. Морская ул., 67. ЛР № 010292 от 18.08.98. 77 82 57 управление в сОциальнО-экОнОмическиХ системаХ 63 69 72 53 34 39 Михеева В. Д. Методы расширения языков программирования (Часть 1) 46 15 2 9
Стр.2
ОбрабОтка инфОрмации и управление УДК 004.522 автОматическая ОбрабОтка и статистический анализ нОвОстнОгО текстОвОгО кОрпуса для мОдели языка системы распОзнавания русскОй речи И. С. Кипяткова, младший научный сотрудник А. А. Карпов, канд. техн. наук, старший научный сотрудник Санкт-Петербургский институт информатики и автоматизации РАН Описывается процесс автоматической обработки текстового корпуса, собранного из новостных лент ряда интернет-сайтов, для создания вероятностной n-граммной модели разговорного русского языка. Приводится статистический анализ данного корпуса, даются результаты по подсчету частоты появления различных n-грамм слов. Представлен обзор существующих типов статистических моделей языка. Ключевые слова — модель языка, текстовый корпус русского языка, автоматическая обработка текста. Введение Для генерации грамматически правильных и осмысленных гипотез произнесенной фразы распознавателю речи необходима некоторая модель языка или грамматика, описывающая допустимые фразы. Процесс распознавания речи может быть представлен как поиск наиболее вероятной последовательности слов [1]: W PW A == P A W PW argmax ( | ) argmax ( | ) ( ), WW где P(A|W), P(W) — вероятности появления гипотезы по оценке акустической и языковой модели соответственно. Для многих языков (например, английского) разработаны методы создания моделей языка, которые позволяют повысить точность распознавания речи. Но эти методы не могут быть напрямую применены для русского языка из-за свободного порядка слов в предложениях и на личия большого количества словоформ для каждого слова. Одной из наиболее эффективных моделей естественного языка является статистическая модель на основе n-грамм слов, цель которой состоит в оценке вероятности появления цепочки слов W = (w1, w2, …, wm) в некотором тексте. 2 ИНФОРМАЦИОННОУПРАВЛЯЮЩИЕ СИСТЕМЫ n-граммы представляют собой последовательность из n элементов (например, слов), а n-граммная модель языка используется для предсказания элемента в последовательности, содержащей n – 1 предшественников. Эта модель основана на предположении, что вероятность какой-то определенной n-граммы, содержащейся в неизвестном тексте, можно оценить, зная, как часто она встречается в некотором обучающем тексте. Вероятность P(w1, w2, ..., wm) можно представить в виде произведения условных вероятностей входящих в нее n-грамм [2]: m P w w w P w w w w− = ( 1, ,..., )=∏ ( | , ,..., i 1 2 m i 1 2 P w w w P w w w1, i=1 2 m P w w− + ,...,wi−1)= ( |i i n 1 ( 1, ,..., )≅∏ ( |i i n i n i 1) или аппроксимируя P(W) при ограниченном контексте длиной n – 1: m − + − +2,...,wi−1). Вероятность появления n-граммы вычисляется на практике следующим образом: 1 C(wi n− + ,..., )wi C(wi n− +1,...,wi−1) , где С — количество появлений последовательности в обучающем корпусе. № 4, 2010
Стр.3