Л. В. Найханова, Н. Н. Аюшеева, Н. Б. Хаптахаева
ПОСТРОЕНИЕ СЕМАНТИЧЕСКОЙ СЕТИ ПРЕДМЕТНОЙ
ОБЛАСТИ НА ОСНОВЕ ИЗВЛЕЧЕНИЯ ЗНАНИЙ
ИЗ НАУЧНОГО ТЕКСТА
Данная работа посвящена построению семантической сети номенклатуры
предметной области, под которой понимается проекция терминосистемы на определенную в научном тексте подобласть знаний или задачу, релевантную предметной области. <...> Семантическая сеть построена в виде сети знаков-фреймов. <...> Извлечение знаний из научных (монологических) текстов позволяет создать номенклатуру предметной области как проекции терминосистемы на определенную в научном тексте подобласть знаний или задачу, релевантную предметной области. <...> В этом случае онтология предметной
области представляется в виде иерархии, в корне которой находится терминосистема, а в узлах – номенклатура. <...> В качестве модели представления знаний как терминосистемы, так и номенклатур предлагается использовать семантические сети знаков-фреймов. <...> Данная работа посвящена решению задачи построения семантической
сети номенклатуры предметной области. <...> 2) множество векторов морфологической информации лексем Μ = {μi |
i = 1...k, k – количество лексем текста Θ}; <...> 3) множество векторов статистической информации о лексемах F = {fi |
i = 1...k, k – общее количество лексем}; <...> 4) множество терминов (устойчивых словосочетаний) T = {ti | i = 1...m,
m – количество терминов}; <...> 5) множество векторов статистической информации о терминах
F ′ = { fi′ i = 1...m}, m – общее количество терминов}; <...> 6) множество модифицированных графов зависимостей G = {gi |
i = 1...n, n – количество предложений в тексте Θ}, в которых отдельные лексемы объединены в словосочетания; множество G является результатом синтаксического анализа простых предложений текста, которые получены посредством разбиения сложных предложений на простые; в сложных предложениях предварительно произведена замена местоимений; <...> 7) множество графов семантической окрестности термина G* = {g*i |
i = 1...q, q – количество <...>