Актуальные проблемы современной науки, № 5, 2015 ЕСТЕСТВЕННЫЕ НАУКИ Физико-математические науки Математика Теория вероятностей и математическая статистика Владимиров В.В. <...> АВТОМАТИЧЕСКАЯ РАССТАНОВКА УДАРЕНИЙ В СЛОВАХ РУССКОГО ЯЗЫКА С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ Данная статья посвящена исследованию применимости методов машинного обучения к задаче автоматической расстановки ударений в словах русского языка. <...> Автоматическое определение места ударения в слове имеет огромное значение в системах синтеза речи. <...> О качестве синтезатора речи можно судить не только по его сходству с человеческим голосом, но и по его способности быть понятным. <...> В тех системах, где все воспроизводятся предварительно записанные слова, проблем обычно не возникает. <...> Но создать полноценный синтезатор речи по такой системе очень сложно из-за большого количества слов. <...> Поэтому в большинстве синтезаторов слова генерируются из звуков. <...> Здесь и возникает проблема выбора места ударения. <...> Для большинства слов можно определить ударение по словарю. <...> Однако во многих словарях отсутствует значительная часть различных словоформ, терминов и составных слов. <...> Для автоматической расстановки ударения в русском языке необходимо провести комплексный анализ слов и ударений в них. <...> В том числе и методы машинного обучения. <...> Машинное обучение обширный подраздел искусственного интеллекта, математическая дисциплина, использующая разделы математической статистики, численных методов оптимизации, теории вероятностей, дискретного анализа выделяющая знания из данных. <...> Для исследования в первую очередь необходима база данных слов русского языка с ударениями. <...> Для создания базы за основу был принят «Русский орфографический словарь» под редакцией В. В. Лопатина, состоящий из более чем 150 тысяч слов. <...> Также, для достоверности результатов, в базу были добавлены около 19 тысяч слов из некоторых литературных произведений. <...> Задача определения <...>