УДК 004.89 Д.М. Коробкин, канд. техн. наук, Н.В. Крапивина, С.А. Фоменков, д-р техн. наук (Волгоградский государственный технический университет); e-mail: saf@vstu.ru СЕМАНТИЧЕСКАЯ СЕТЬ ОПИСАНИЯ ФИЗИЧЕСКОГО ЭФФЕКТА В ЕСТЕСТВЕННО-ЯЗЫКОВОМ ТЕКСТЕ Рассмотрен процесс извлечения описаний физических эффектов из текстов на естественном языке. <...> Поскольку в настоящее время большинство современных открытий в области физики описывается посредством английского языка, то актуальна задача разработки семантической сети описания физического эффекта в англоязычном тексте. <...> This article describes the process of extracting descriptions of physical effects from natural language text. <...> Currently, most modern discoveries in physics are described by the English language, the task of developing a semantic network describing the physical effect on the English text is the actual problem. <...> Введение В настоящее время фонд физических эффектов (ФЭ) (около 1600 описаний) [1, 2] содержит знания из разных областей физики, в том числе на основе новейших открытий и изобретений. <...> Однако до настоящего момента пополнение фонда ФЭ шло только на основе советской (российской) периодической литературы, такой как, например, журнал «Успехи физических наук» [3]. <...> Исследования и открытия зарубежных физиков отслеживались только в виде переводной литературы. <...> Тем самым не охватывался пласт физических изобретений и открытий иностранных ученых, не переведенных на русский язык. <...> Поскольку в основном иностранные публикации идут на международном (английском) языке, то актуальной является задача автоматизации процедуры извлечения описания ФЭ из текста данных публикаций. <...> В работе проанализированы существующие системы Text Mining (поиск информации в неструктурированных текстовых массивах), такие как коммерческие: AeroText [4], TextAnalyst [5], Wordstat [6], Attensity [7] и открытые системы: Carrot2 [8], GATE [9], OpenNLP [10], Natural Language Toolkit [11], RapidMiner [12]. <...> Большинство систем обеспечивает возможности построения семантических сетей; извлечение фактов, понятий; поиск по ключевым словам; создание таксономий и тезаурусов, но ни одна из них не позволяет <...>