Национальный цифровой ресурс Руконт - межотраслевая электронная библиотека (ЭБС) на базе технологии Контекстум (всего произведений: 634840)
Контекстум
Руконтекст антиплагиат система
Вестник Воронежского государственного университета. Серия: Системный анализ и информационные технологии  / №1 2007

МЕТОД ФОРМАЛЬНОГО ВЫДЕЛЕНИЯ ТЕМАТИЧЕСКИ НЕЙТРАЛЬНОЙ ЛЕКСИКИ (НА ПРИМЕРЕ СТАРОСЛАВЯНСКИХ ТЕКСТОВ) (90,00 руб.)

0   0
Первый авторКретов
Страниц10
ID519530
АннотацияВ статье введены понятия тематически маркированной и тематически нейтральной лексики; предложен метод системного взвешивания слов по двум функциональным параметрам: прямому (частотному — Q-параметр) и косвенному (длина слова — F-параметр). Первый параметр характеризует функционирование слова в данном тексте, второй — его функционирование на продолжительном отрезке времени — настолько продолжительном, чтобы функционирование успело повлиять на длину слова; введен Индекс тематической маркированности слова (ИнТеМ), вычисляемый по формуле ИнТеМ = Q-вес — F-вес, где Q-вес — вес слова по частоте, а F-вес — вес слова по длине. Установлено, что в словаре-источнике более 98 % слов с отрицательным значением ИнТеМа относятся к тематически нейтральной лексике.
УДК811.161.1’04’371
Кретов, А.А. МЕТОД ФОРМАЛЬНОГО ВЫДЕЛЕНИЯ ТЕМАТИЧЕСКИ НЕЙТРАЛЬНОЙ ЛЕКСИКИ (НА ПРИМЕРЕ СТАРОСЛАВЯНСКИХ ТЕКСТОВ) / А.А. Кретов // Вестник Воронежского государственного университета. Серия: Системный анализ и информационные технологии .— 2007 .— №1 .— С. 80-89 .— URL: https://rucont.ru/efd/519530 (дата обращения: 27.04.2024)

Предпросмотр (выдержки из произведения)

УДК 811.161.1’04’371 МЕТОД ФОРМАЛЬНОГО ВЫДЕЛЕНИЯ ТЕМАТИЧЕСКИ НЕЙТРАЛЬНОЙ ЛЕКСИКИ (НА ПРИМЕРЕ СТАРОСЛАВЯНСКИХ ТЕКСТОВ) А. А. Кретов Воронежский государственный университет В статье введены понятия тематически маркированной и тематически нейтральной лексики; предложен метод системного взвешивания слов по двум функциональным параметрам: прямому (частотному — Q-параметр) и косвенному (длина словаF-параметр). <...> Первый параметр характеризует функционирование слова в данном тексте, второй — его функционирование на продолжительном отрезке времени — настолько продолжительном, чтобы функционирование успело повлиять на длину слова; введен Индекс тематической маркированности слова (ИнТеМ), вычисляемый по формуле ИнТеМ = Q-вес — F-вес, где Q-вес — вес слова по частоте, а F-вес — вес слова по длине. <...> Установлено, что в словаре-источнике более 98 % слов с отрицательным значением ИнТеМа относятся к тематически нейтральной лексике. <...> ВВЕДЕНИЕ Лексика любого текста может быть разделена на две части: одна из них связана с темой текста (назовем ее тематически маркированной лексикой), другая — никак не указывает на тему текста и может встретиться в тексте любой другой тематики (назовем ее тематически нейтральной лексикой). <...> Материалом послужит «Старославянский словарь (по рукописям X—XI веков)» [1]: около 10 000 слов Авторы: Э. <...> МЕТОД ФОРМАЛЬНОГО ВЫДЕЛЕНИЯ ТЕМАТИЧЕСКИ НЕЙТРАЛЬНОЙ ЛЕКСИКИ В Научно-методическом центре компьютерной лингвистики факультета РГФ ВГУ создана электронная версия этого словаря (исполнитель — лаборант А. В. Кашкина). <...> Поскольку служебные и дискурсивные слова являются своего рода «цементом» текста и не определяют его содержательного наполнения, в электронную версию словаря были включены только полнозначные слова: глаголы, существительные и прилагательные, а также причастия, употребляемые в функции существительного или прилагательного. <...> Традиционным способом выявления тематически маркированной <...>