Аспирант и соискатель, № 6, 2010 Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей Табарча А.И., аспирант СанктПетербургского государственного университета информационных технологий, механики и оптики АНАЛИЗ И СРАВНЕНИЕ МЕТОДОВ АВТОМАТИЧЕСКОГО ИЗВЛЕЧЕНИЯ ТЕРМИНОВ ИЗ ТЕКСТА Введение Под методами автоматического извлечения терминов в данной работе подразумеваются эвристические подходы извлечения терминоподобных конструкций (словосочетаний). <...> Задача автоматического выделения ключевых слов и терминов из текста возникает в библиотечном деле, лексикографии и терминоведении, а также в информационном поиске. <...> Объемы и динамика информации, которая подлежит обработке в этих областях в настоящее время, делают особенно актуальной задачу автоматического выделения терминов и ключевых слов [1,2]. <...> Задача автоматического извлечения терминов из текста является базовой для многих задач обработки естественного языка, таких как классификация документов, кластеризация документов, индексирование текста, реферирование, определение общей темы документа. <...> В данной статье рассматриваются различные методы автоматического извлечения терминов из текста. <...> За историю развития вопроса автоматического извлечения терминов, было разработано большое количество методов, поэтому в данной работе предпринята попытка к систематизации, выделению общего и различного. <...> Методы рассматриваются с теоретической точки зрения, анализируются их основы и то, каких результатов можно ожидать от них. <...> Постановка задачи Целью данной работы является анализ, сравнение и систематизация методов автоматического извлечения терминов из текста. <...> Рассмотреть предложенные классы методов Основная часть После предварительного анализа существующих методов автоматического извлечения терминов из текста, они были сгруппированы по следующим пяти критериям: 1. <...> Способ фильтрования слов общей лексики <...>