Национальный цифровой ресурс Руконт - межотраслевая электронная библиотека (ЭБС) на базе технологии Контекстум (всего произведений: 634620)
Контекстум
.
Вестник Воронежского государственного университета. Серия: Системный анализ и информационные технологии  / №1 2013

СТАТИСТИЧЕСКАЯ ОБРАБОТКА ЛИНГВИСТИЧЕСКИХ ДАННЫХ НИДЕРЛАНДСКО-РУССКИХ СЛОВАРЕЙ (90,00 руб.)

0   0
Первый авторВоевудский
АвторыТушавин В.А.
Страниц8
ID511706
АннотацияВ статье произведен анализ распределения длины нидерландских слов в трех нидерландско-русских словарях. На основании проведенного анализа построена математическая модель, выявляющая закономерность в распределении частот слов различной длины в зависимости от средней длины слова в анализируемых словарях посредством аппроксимации распределения Пуассона методом максимального правдоподобия. Произведена проверка адекватности полученной модели методом Монте-Карло. Теоретически обоснована и практически верифицирована математическая модель разности в длине двух случайных слов на основе распределения Скеллама
УДК811.11
Воевудский, Д.С. СТАТИСТИЧЕСКАЯ ОБРАБОТКА ЛИНГВИСТИЧЕСКИХ ДАННЫХ НИДЕРЛАНДСКО-РУССКИХ СЛОВАРЕЙ / Д.С. Воевудский, В.А. Тушавин // Вестник Воронежского государственного университета. Серия: Системный анализ и информационные технологии .— 2013 .— №1 .— С. 169-176 .— URL: https://rucont.ru/efd/511706 (дата обращения: 19.04.2024)

Предпросмотр (выдержки из произведения)

Воевудский*, В. А. Тушавин** * Воронежский государственный университет ** Санкт-Петербургский государственный университет аэрокосмического приборостроения Поступила в редакцию 04.12.2012 г. Аннотация. <...> В статье произведен анализ распределения длины нидерландских слов в трех нидерландско-русских словарях. <...> На основании проведенного анализа построена математическая модель, выявляющая закономерность в распределении частот слов различной длины в зависимости от средней длины слова в анализируемых словарях посредством аппроксимации распределения Пуассона методом максимального правдоподобия. <...> Произведена проверка адекватности полученной модели методом Монте-Карло. <...> Теоретически обоснована и практически верифицирована математическая модель разности в длине двух случайных слов на основе распределения Скеллама. <...> Ключевые слова: длина слов, нидерландский язык, распределение Пуассона, метод МонтеКарло, распределение Скеллама, GNU R. <...> Based on the analysis, a mathematical model reveals regularity in the distribution of word frequencies of different length depending on the average length of words in dictionaries analyzed by Poisson approximation method of maximum likelihood. <...> Theoretically grounded and practically verified mathematical model of the difference in the length of two random words on the basis of Skellam distribution. <...> Keywords: length of words, the Dutch language, Poisson distribution, Monte Carlo method, Skellam distribution, GNU R. <...> ВВЕДЕНИЕ Нидерландский, или как его раньше называли голландский, язык входит в западногерманскую подгруппу германских языков. <...> Общее количество лиц, для которых он является родным, составляет примерно 21 млн. <...> Целью предлагаемого исследования является выявление закономерностей распределения количества слов по длине посредством построения адекватной стохастической модели. <...> Для достижения поставленной цели были решены следующие задачи: 1) создание электронных баз данных исследуемых словарей; 2) обработка и аппроксимация полученных данных различными видами распределений с © Воевудский Д. С., Тушавин В. А., 2013 помощью GNU R; 3) проверка полученных результатов с помощью метода Монте-Карло. <...> Показателем <...>