УДК 004.912 МОДЕЛЬ ГРАФЕМАТИЧЕСКОГО АНАЛИЗА В СИСТЕМЕ ОБРАБОТКИ ЕСТЕСТВЕННОГО ЯЗЫКА А. А. <...> Седунов Воронежский государственный университет Системы обработки текста на естественном языке в настоящее время представляют собой одно из наиболее перспективных направлений информационных технологий. <...> В настоящей работе рассматривается задача графематического анализа и предлагается вариант ее программного решения в рамках конкретной ЕЯ-системы. <...> В рамках этого подхода построена информационная модель анализа и выполнена ее программная реализация. <...> ВВЕДЕНИЕ Системы обработки текста на естественном языке [1, 2, 3] в настоящее время представляют собой одно из наиболее перспективных направлений информационных технологий. <...> В настоящей работе рассматривается задача графематического анализа и предлагается вариант ее программного решения в рамках конкретной ЕЯ-системы. <...> Графематический анализ представляет собой начальный этап обработки текста, в ходе которого определяются элементы грамматической структуры (слова, знаки пунктуации, числа, сокращения и т. д.) <...> . Можно выделить следующие основные функции графематического анализа [1]: • разбиение текста на графемы; • определение границ предложений; • различение слов и служебных графем (например, знаков пунктуации) • определение регистра слов • распознавание собственных имен • распознавание сокращений Для решения этих задач мы, опираясь на методы теории языков, разработали формальный подход к графематическому анализу текста. <...> В рамках этого подхода была построена информационная модель анализа и выполнена ее программная реализация. <...> Рассмотрению этих © Седунов А. А., 2007 вопросов посвящено содержание предлагаемой статьи. <...> Прежде всего, дадим определение самому понятию графематического анализа с точки зрения теории формальных языков [4, 5]. <...> При формулировке требований к языку (в частности, в следующем определении графематического разбиения) мы будем, главным <...>