Национальный цифровой ресурс Руконт - межотраслевая электронная библиотека (ЭБС) на базе технологии Контекстум (всего произведений: 634794)
Контекстум
Руконтекст антиплагиат система
0   0
Первый авторСедунов
Страниц4
ID519531
АннотацияВ данной работе рассматривается разработка структур данных, алгоритмов и объектно-ориентированных моделей, обеспечивающих реализацию процесса автоматического морфологического анализа, как одного из важных этапов комплексного анализа текста на естественном языке. Практическим результатом данной работы является программная система, в которой указанные модели реализованы для слов русского языка
УДК001.103:002
Седунов, А.А. СИСТЕМА МОРФОЛОГИЧЕСКОГО АНАЛИЗА РУССКИХ СЛОВ / А.А. Седунов // Вестник Воронежского государственного университета. Серия: Системный анализ и информационные технологии .— 2007 .— №1 .— С. 90-93 .— URL: https://rucont.ru/efd/519531 (дата обращения: 25.04.2024)

Предпросмотр (выдержки из произведения)

УДК 001.103:002 СИСТЕМА МОРФОЛОГИЧЕСКОГО АНАЛИЗА РУССКИХ СЛОВ А. А. <...> Седунов Воронежский государственный университет В данной работе рассматривается разработка структур данных, алгоритмов и объектно-ориентированных моделей, обеспечивающих реализацию процесса автоматического морфологического анализа, как одного из важных этапов комплексного анализа текста на естественном языке. <...> Практическим результатом данной работы является программная система, в которой указанные модели реализованы для слов русского языка. <...> ВВЕДЕНИЕ В данной работе рассматриваются основные алгоритмы морфологического анализа текстов, составленных на естественном языке. <...> Задача морфологического анализа возникает в качестве одного из этапов обработки естественноязыковых данных в таких приложениях, как информационно-поисковые системы, машинный перевод, классификация документов. <...> Морфологический анализ — процесс, в ходе которого формы слова, обнаруженные в исходном тексте, ассоциируются с определенным набором грамматических атрибутов, частью речи и основной формой этого слова (т. н. леммой). <...> Морфологический анализ не учитывает контекст и значение слова, поэтому на дано этапе некоторые разновидности неоднозначностей (например, омонимию) разрешить нельзя. <...> Данная работа основана на материалах разработки компьютерной системы морфологического анализа русских слов. <...> Рассматриваются ключевые алгоритмы, составляющие основу информационной модели морфологического анализа. <...> При описании алгоритмов применяется псевдокод, сопровождаемый текстовыми комментариями. <...> РЕАЛИЗАЦИЯ КОНЕЧНЫХ АВТОМАТОВ Конечные автоматы представляют собой основную структуру данных, применяемую в процессе анализа [2]. <...> Конечный автомат может быть представлен в виде ориентированного графа, вершинами которого являются элементы некоторого конечного множества состояний, а дуги имеют символьные метки и соответствуют © Седунов А. А., 2007 переходу из одного <...>