ИНФОРМАТИКА БЕЗ ГРАНИЦ УДК 004.896 М.А. Коряковцев, Тюменский государственный университет Использование конечных автоматов для извлечения текстовых данных электронных резюме сайтов трудоустройства HeadHunter, Superjob и Работа.Ru ляющие функции по интеграции данных, называются системами интеграции данных. <...> Упомянутая совокупность источников может быть задана как во время проектирования системы интеграции данных, так и пополняться в процессе ее работы. <...> Для пользователя информационной системы совокупность интегрируемых источников данных представляется как новый единый источник данных. <...> Работа осуществляется только с этим единым источником, поэтому пользователь не имеет представления об интегрируемых источниках данных. <...> Их количество для русскоязычного сегмента сети Интернет, по данным сервиса «Яндекс. <...> Каталог», уже к середине 2015 года составляло более 200, а число электронных резюме, размещенных на некоторых сайтах, более 1 млн. <...> В связи с этим при проектировании и разработке кадровой информационной системы очень важным является обеспечение интеграции с банками электронных резюме сайтов трудоустройств. <...> © Коряковцев М.А., 2016 18 Интеграция данных в информационных системах понимается как обеспечение единого унифицированного интерфейса для доступа к некоторой совокупности неоднородных независимых источников данных. <...> Источники могут содержать как неизменные, так и обновляемые данные. <...> Информационные системы или их части, предоставВ рамках настоящей работы мы будем рассматривать математическую модель интеграции данных, используемую в кадровой информационной системе для работы с банками электронных резюме трех сайтов трудоустройства: HeadHunter, Superjob и Работа.Ru. <...> В первую очередь установим способ доступа к данным электронных резюме. <...> Способ доступа к электронным резюме обуславливает выбор оптимального подхода и алгоритма интеграции данных. <...> В зависимости от сайта трудоустройства доступ к электронным <...>