Вестник Воронежского государственного университета. Серия: Системный анализ и информационные технологии / №1 2010

АЛГОРИТМЫ ОПРЕДЕЛЕНИЯ СЕМАНТИЧЕСКОЙ БЛИЗОСТИ КЛЮЧЕВЫХ СЛОВ ПО ИХ ОКРУЖЕНИЮ В ТЕКСТЕ (90,00 руб.)

Первый автор	Воронина
Авторы	Кретов А.А., Попова И.В.
Страниц	6

90,00р

ID	519805
Аннотация	Рассматриваются алгоритмы определения семантической близости ключевых слов: алгоритм Гинзбурга и его программная реализация и алгоритм с учетом частей речи и проблемы его реализации. Анализируются результаты вычислительного эксперимента
УДК	001.103:002

Воронина, И.Е. АЛГОРИТМЫ ОПРЕДЕЛЕНИЯ СЕМАНТИЧЕСКОЙ БЛИЗОСТИ КЛЮЧЕВЫХ СЛОВ ПО ИХ ОКРУЖЕНИЮ В ТЕКСТЕ / И.Е. Воронина, А.А. Кретов, И.В. Попова // Вестник Воронежского государственного университета. Серия: Системный анализ и информационные технологии .— 2010 .— №1 .— С. 147-152 .— URL: https://rucont.ru/efd/519805 (дата обращения: 21.02.2026)

Вы уже смотрели

Направляющие системы электросвязи. В 2 т. Т. 1. Теория передачи и влияния

Направляющие системы электросвязи. В 2 т... 500,00 руб

Вопросы детской диетологии №6 2012 594,00 руб

Предпросмотр (выдержки из произведения)

КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА И ОБРАБОТКА ЕСТЕСТВЕННОГО ЯЗЫКА УДК 001.103:002 АЛГОРИТМЫ ОПРЕДЕЛЕНИЯ СЕМАНТИЧЕСКОЙ БЛИЗОСТИ КЛЮЧЕВЫХ СЛОВ ПО ИХ ОКРУЖЕНИЮ В ТЕКСТЕ И. Е. <...> Воронина, А. А. Кретов, И. В. Попова Воронежский государственный университет Поступила в редакцию 01.03.2010 г. Аннотация. <...> Рассматриваются алгоритмы определения семантической близости ключевых слов: алгоритм Гинзбурга и его программная реализация и алгоритм с учетом частей речи и проблемы его реализации. <...> Ключевые слова: компьютерная лингвистика семантическое поле слов, выделение ключевых слов, вычислительный эксперимент, алгоритм Гинзбурга, алгоритм с учетом частей речи. <...> Разработано множество методов, различных по своим характеристикам и параметрам (например, [1]). <...> Выделенные с их помощью ключевые слова могут служить основой для определения предметной области текста, его тематики и стилистической отнесенности. <...> Поэтому важно иметь инструмент для выявления отношений между ключевыми словами, для определения семантической близости этих слов. <...> © Воронина И. Е., Кретов А. А., Попова И. В., 2010 148 Рассмотрим алгоритмы, с помощью которых можно количественно оценить силу связи между словоформами в рамках исследуемого текста. <...> АЛГОРИТМ ГИНЗБУРГА Алгоритм Гинзбурга [2] предназначен для поиска контекста данного слова в рамках рассматриваемого текста. <...> Находим в тексте Т для каждой словоформы а ее относительную частоту – ОЧТ(а) (частное от деления наблюдаемой, абсолютной частоты на количество слов в тексте T). <...> Для совокупности всех этих предложений T* построим частотный словарь V(T*), содержащий абсолютную и относительную (частное от деления наблюдаемой, абсолютной частоты на количество слов в Т*) частоты. <...> Относительную частоту словоформы а в V(T*) обозначим ОТЧ* (а). <...> Сравниваем полученные относительные частоты в T и T*: Вводится Индекс значимости словоформы а в контексте слова С (ИнЗ(а)), вычисляемый по формуле: ВЕСТНИК ВГУ, СЕРИЯ: СИСТЕМНЫЙ АНАЛИЗ И ИНФОРМАЦИОННЫЕ <...>

Облако ключевых слов *

* - вычисляется автоматически


	Для выхода нажмите Esc или