УДК 519.767/519.237.8 КЛАССИФИКАЦИЯ ФРАГМЕНТОВ ТЕКСТОВ С ОПИСАНИЕМ ЗАВИСИМОСТЕЙ ПРАВИЛАМИ НА ИНТЕРПРЕТИРУЕМОМ ЭКСПЕРТАМИ ЯЗЫКЕ П. А. <...> Ключевым моментом методов извлечения информации из текстов является классификация фрагментов текста. <...> Желательно, чтобы правила извлечения были описаны на понятном экспертам языке и могли быть изменены экспертами вручную. <...> В данной работе предлагается подход, основанный на построении дискретных процедур распознавания. <...> Настройка процедур распознавания сопровождается автоматическим построением правил извлечения фрагментов. <...> Ключевые слова: извлечение информации, текст, фрагмент текста, язык правил, классификация, дискретные процедуры распознавания, выбор признаков, географическая привязка текстов. <...> ВВЕДЕНИЕ Задача извлечения информации из текста относится к разряду тех, для которых практически невозможно построить математическую модель в общепринятом смысле. <...> Частным случаем задачи извлечения информации из текста является отнесение фрагментов в тексте к одному или нескольким заранее определенным классам. <...> В работе извлечение информации использовалось для разрешения неоднозначностей выделения географических объектов в текстах. <...> В работах [1,4] используются методы автоматического построения логических правил на © Прокофьев П. А., 2012 174 этапе настройки классификатора. <...> Все это делает проблематичным использование этих методов в задаче извлечения информации в текстах. <...> В работе предлагается метод формального описание правил извлечения информации. <...> В рамках данной работы предлагается формальное описание языка правил извлечения фрагментов текста и метод автоматического построения правил при настройке алгоритмов классификации, используемых при извлечении информации в тексте. <...> Алгоритмы классификации строятся с помощью дискреционных процедур распознавания по прецедентам, описанных в работах [6, 7, 8]. <...> Методы рассмотренные в настоящей работе оценивались при решении <...>