Национальный цифровой ресурс Руконт - межотраслевая электронная библиотека (ЭБС) на базе технологии Контекстум (всего произведений: 635836)
Контекстум
Руконтекст антиплагиат система
Актуальные проблемы современной науки  / №5(84) 2015

АВТОМАТИЧЕСКАЯ РАССТАНОВКА УДАРЕНИЙ В СЛОВАХ РУССКОГО ЯЗЫКА С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ (100,00 руб.)

0   0
Первый авторВладимиров
Страниц2
ID488935
АннотацияДанная статья посвящена исследованию применимости методов машинного обучения к задаче автоматической расстановки ударений в словах русского языка
Владимиров, В.В. АВТОМАТИЧЕСКАЯ РАССТАНОВКА УДАРЕНИЙ В СЛОВАХ РУССКОГО ЯЗЫКА С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ / В.В. Владимиров // Актуальные проблемы современной науки .— 2015 .— №5(84) .— С. 74-75 .— URL: https://rucont.ru/efd/488935 (дата обращения: 16.05.2024)

Предпросмотр (выдержки из произведения)

Актуальные проблемы современной науки, № 5, 2015 ЕСТЕСТВЕННЫЕ НАУКИ Физико-математические науки Математика Теория вероятностей и математическая статистика Владимиров В.В. <...> АВТОМАТИЧЕСКАЯ РАССТАНОВКА УДАРЕНИЙ В СЛОВАХ РУССКОГО ЯЗЫКА С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ Данная статья посвящена исследованию применимости методов машинного обучения к задаче автоматической расстановки ударений в словах русского языка. <...> Автоматическое определение места ударения в слове имеет огромное значение в системах синтеза речи. <...> О качестве синтезатора речи можно судить не только по его сходству с человеческим голосом, но и по его способности быть понятным. <...> В тех системах, где все воспроизводятся предварительно записанные слова, проблем обычно не возникает. <...> Но создать полноценный синтезатор речи по такой системе очень сложно из-за большого количества слов. <...> Поэтому в большинстве синтезаторов слова генерируются из звуков. <...> Здесь и возникает проблема выбора места ударения. <...> Для большинства слов можно определить ударение по словарю. <...> Однако во многих словарях отсутствует значительная часть различных словоформ, терминов и составных слов. <...> Для автоматической расстановки ударения в русском языке необходимо провести комплексный анализ слов и ударений в них. <...> В том числе и методы машинного обучения. <...> Машинное обучение  обширный подраздел искусственного интеллекта, математическая дисциплина, использующая разделы математической статистики, численных методов оптимизации, теории вероятностей, дискретного анализа выделяющая знания из данных. <...> Для исследования в первую очередь необходима база данных слов русского языка с ударениями. <...> Для создания базы за основу был принят «Русский орфографический словарь» под редакцией В. В. Лопатина, состоящий из более чем 150 тысяч слов. <...> Также, для достоверности результатов, в базу были добавлены около 19 тысяч слов из некоторых литературных произведений. <...> Задача определения <...>