МАШИННОЕ ОБУЧЕНИЕ ПРОГРАММНЫХ АГЕНТОВ, РАБОТАЮЩИХ С ТЕКСТАМИ НА ЕСТЕСТВЕННОМ ЯЗЫКЕ АНТОН КОЛОНИН akolonin@gmail.com В работе обсуждается подход к машинному обучению программных агентов для решения ряда задач автоматизации человеческой деятельности в Интернете, таких как автоматическая навигация по ссылкам, упреждающий поиск информации и анализ новостей в Интернете, а также обучение персональных ассистентов на основе опыта их взаимодействия с пользователем. <...> ПРОГРАММНЫЕ АГЕНТЫ, РАБОТАЮЩИЕ С ТЕКСТОМ На сегодня можно выделить несколько прикладных задач, связанных с машинным обучением программных агентов, оперирующих в том или ином виде текстовой информацией. <...> Эти задачи: • целенаправленная навигация по страницам в Интернете [1] на основе целеуказаний пользователя; • упреждающий поиск информации в поисковых системах [2], позволяющий предложить пользователю искомый результат до того, как он будет запрошен явно; • прогнозирование развития событий по лентам интернет-новостей [3] в задачах бизнес-разведки; • ведение диалогов между пользователем и его персональным ассистентом или чат-ботом [4]. <...> В настоящее время во многих случаях задача решается явным кодированием правил поведения таких агентов на основе разбора поступающей на вход текстовой информации. <...> Мы же рассмотрим унифицированный подход, основанный на машинном обучении, потенциально способный решить задачи в перечисленных ситуациях. <...> Навигация по страницам Навигация по страницам в Интернете представляет собой поиск «целевой» интернет-страницы с нужной информацией [1], начиная с некоторой «стартовой» страницы и проходя через ряд промежуточных, в соответствии с определенными типовыми сценариями. <...> Например, поиск руководителя компании на ее сайте может начинаться со страницы index.html, далее по ссылке «Информация #3 (57), 2015 CONTROL ENGINEERING РОССИЯ ИННОВАЦИИ I 83 о компании» переход на страницу company.html, с которой по ссылке «Руководство компании» переход <...>