Национальный цифровой ресурс Руконт - межотраслевая электронная библиотека (ЭБС) на базе технологии Контекстум (всего произведений: 634617)
Контекстум
.
Вестник Воронежского государственного университета. Серия: Системный анализ и информационные технологии  / №2 2007

МОДЕЛЬ ГРАФЕМАТИЧЕСКОГО АНАЛИЗА В СИСТЕМЕ ОБРАБОТКИ ЕСТЕСТВЕННОГО ЯЗЫКА (90,00 руб.)

0   0
Первый авторСедунов
Страниц9
ID519585
АннотацияСистемы обработки текста на естественном языке в настоящее время представляют собой одно из наиболее перспективных направлений информационных технологий. Обработка текста в таких системах представляет собой комплексный многоэтапный процесс. В настоящей работе рассматривается задача графематического анализа и предлагается вариант ее программного решения в рамках конкретной ЕЯ-системы. Для решения данной задачи разработан формальный подход к графематическому анализу текста. В рамках этого подхода построена информационная модель анализа и выполнена ее программная реализация
УДК004.912
Седунов, А.А. МОДЕЛЬ ГРАФЕМАТИЧЕСКОГО АНАЛИЗА В СИСТЕМЕ ОБРАБОТКИ ЕСТЕСТВЕННОГО ЯЗЫКА / А.А. Седунов // Вестник Воронежского государственного университета. Серия: Системный анализ и информационные технологии .— 2007 .— №2 .— С. 67-75 .— URL: https://rucont.ru/efd/519585 (дата обращения: 20.04.2024)

Предпросмотр (выдержки из произведения)

УДК 004.912 МОДЕЛЬ ГРАФЕМАТИЧЕСКОГО АНАЛИЗА В СИСТЕМЕ ОБРАБОТКИ ЕСТЕСТВЕННОГО ЯЗЫКА А. А. <...> Седунов Воронежский государственный университет Системы обработки текста на естественном языке в настоящее время представляют собой одно из наиболее перспективных направлений информационных технологий. <...> В настоящей работе рассматривается задача графематического анализа и предлагается вариант ее программного решения в рамках конкретной ЕЯ-системы. <...> В рамках этого подхода построена информационная модель анализа и выполнена ее программная реализация. <...> ВВЕДЕНИЕ Системы обработки текста на естественном языке [1, 2, 3] в настоящее время представляют собой одно из наиболее перспективных направлений информационных технологий. <...> В настоящей работе рассматривается задача графематического анализа и предлагается вариант ее программного решения в рамках конкретной ЕЯ-системы. <...> Графематический анализ представляет собой начальный этап обработки текста, в ходе которого определяются элементы грамматической структуры (слова, знаки пунктуации, числа, сокращения и т. д.) <...> . Можно выделить следующие основные функции графематического анализа [1]: • разбиение текста на графемы; • определение границ предложений; • различение слов и служебных графем (например, знаков пунктуации) • определение регистра слов • распознавание собственных имен • распознавание сокращений Для решения этих задач мы, опираясь на методы теории языков, разработали формальный подход к графематическому анализу текста. <...> В рамках этого подхода была построена информационная модель анализа и выполнена ее программная реализация. <...> Рассмотрению этих © Седунов А. А., 2007 вопросов посвящено содержание предлагаемой статьи. <...> Прежде всего, дадим определение самому понятию графематического анализа с точки зрения теории формальных языков [4, 5]. <...> При формулировке требований к языку (в частности, в следующем определении графематического разбиения) мы будем, главным <...>