Национальный цифровой ресурс Руконт - межотраслевая электронная библиотека (ЭБС) на базе технологии Контекстум (всего произведений: 634928)
Контекстум
Руконтекст антиплагиат система
Вестник Воронежского государственного университета. Серия: Лингвистика и межкультурная коммуникация  / №2 2007

ПРИРОДА ЭКСПОНЕНЦИАЛЬНОГО РАСПРЕДЕЛЕНИЯ СЛОВ ПО ЧИСЛУ ЗНАЧЕНИЙ (90,00 руб.)

0   0
Первый авторСелезнев
Страниц4
ID526238
АннотацияПредлагается математическая модель динамики распределения слов по числу значений. Модель основана на математическом аппарате цепей Маркова и используется для анализа словарей романских языков
УДК81’32, 811.13, 519.765
Селезнев, Г.Д. ПРИРОДА ЭКСПОНЕНЦИАЛЬНОГО РАСПРЕДЕЛЕНИЯ СЛОВ ПО ЧИСЛУ ЗНАЧЕНИЙ / Г.Д. Селезнев // Вестник Воронежского государственного университета. Серия: Лингвистика и межкультурная коммуникация .— 2007 .— №2 .— С. 42-45 .— URL: https://rucont.ru/efd/526238 (дата обращения: 30.04.2024)

Предпросмотр (выдержки из произведения)

Селезнев Воронежский государственный университет Предлагается математическая модель динамики распределения слов по числу значений. <...> Модель основана на математическом аппарате цепей Маркова и используется для анализа словарей романских языков. <...> В работах В. Т. Титова [1, 2] представлены распределения количества слов в словарях романских языков по числу их значений [1, табл. <...> Частотный анализ текстов и словарей показывает, что чаще встречаются слова с малым числом значений — одним, двумя; гораздо реже встречаются слова с тремя, четырьмя и более значениями (до 14 в латинском языке). <...> Чем больше значений имеет слово, тем реже оно встречается. <...> В настоящей работе предпринята попытка математического анализа и теоретического осмысления этих экспериментальных данных. <...> ЭКСПОНЕНЦИАЛЬНОЕ РАСПРЕДЕЛЕНИЕ СЛОВ ПО ЧИСЛУ ЗНАЧЕНИЙ Для корректности сравнения распределения для разных языков нормировались, т.е. вычислялась вероятность количества слов с данным числом значений, и результат умножался на 10000; тем самым предполагалось, что такое количество слов содержит некий усредненный словарь. <...> Наилучший результат достигается при аппроксимации данных экспоненциальным распределением вида NVp K ia== - где Ni ii exp( ), (1) i, i = 1, 2,…, n; V — объем словаря соответствующего языка (принимался равным 10000); pi — количество слов с числом значений равным — вероятность распределения слов по числу значений; α, K — подбираемые при аппроксимации показатель экспоненты и масштабный коэффициент. <...> Для увеличения достоверности аппроксимации для некоторых языков не принимались в расчет слова с самым большим количеством значений; не более 6 слов для румынского словаря (0.08 % от объема словаря). <...> Латинский 12265 0.73 Итальянский 48841 1,88 Испанский 33774 1,54 Португальский 50771 1,73 Французский 28645 1,47 Румынский 37144 1,69 Таблица 1 Язык Kα Достоверность аппроксимации (%) 99.2 98.7 99.5 99.8 99.8 96.3 Природа экспоненциального распределения слов по числу значений По результатам аппроксимации <...>