Национальный цифровой ресурс Руконт - межотраслевая электронная библиотека (ЭБС) на базе технологии Контекстум (всего произведений: 636193)
Контекстум
Руконтекст антиплагиат система
0   0
Первый авторАртемов
АвторыБердзенишвили Г.Г.
Страниц7
ID512047
АннотацияЗадача поиска ближайшего соседа встречается во множестве областей, таких как распознавание образов, классификация текстов, исправление ошибок и др. Для решения задачи поиска похожих строк (ближайшего соседа) с заданной точностью используются различные способы построения индекса. Одним из таких индексов является индекс, построенный на основе BK-дерева. Данный способ построения индекса позволяет решать вышеуказанную задачу достаточно эффективно. Однако, алгоритм требует сложных вычислений, занимающих много времени и требующих большое количество ресурсов. В данной статье представлено описание алгоритма HEngine, позволяющего построить более эффективный индекс, а также сравнение с индексом, построенным на основе BK-дерева, как по скорости поиска, так и по используемым ресурсам
УДК004.021
Артемов, М.А. СРАВНЕНИЕ АЛГОРИТМОВ ПОСТРОЕНИЯ ПОИСКОВОГО ИНДЕКСА / М.А. Артемов, Г.Г. Бердзенишвили // Вестник Воронежского государственного университета. Серия: Системный анализ и информационные технологии .— 2014 .— №3 .— С. 116-122 .— URL: https://rucont.ru/efd/512047 (дата обращения: 18.05.2024)

Предпросмотр (выдержки из произведения)

Артемов, Г. Г. Бердзенишвили Воронежский государственный университет Поступила в редакцию 28.04.2014 г. Аннотация. <...> Задача поиска ближайшего соседа встречается во множестве областей, таких как распознавание образов, классификация текстов, исправление ошибок и др. <...> Для решения задачи поиска похожих строк (ближайшего соседа) с заданной точностью используются различные способы построения индекса. <...> Данный способ построения индекса позволяет решать вышеуказанную задачу достаточно эффективно. <...> Однако, алгоритм требует сложных вычислений, занимающих много времени и требующих большое количество ресурсов. <...> В данной статье представлено описание алгоритма HEngine, позволяющего построить более эффективный индекс, а также сравнение с индексом, построенным на основе BK-дерева, как по скорости поиска, так и по используемым ресурсам. <...> ВВЕДЕНИЕ Задача поиска ближайшего соседа заключается в отыскании среди множества элементов, расположенных в метрическом пространстве, элементов близких к заданному, согласно некоторой функции близости (метрики). <...> Примером такой задачи является задача поиска изображения по видео. <...> Видео разбивается на набор изображений, которые в дальнейшем преобразуются в бинарные строки. <...> В полученном наборе строк происходит © Артемов М. А., Бердзенишвили Г. Г., 2014 поиск запрашиваемой строки (другого изображения, преобразованного в строку таким же образом) с заданной степенью похожести. <...> Для сравнения двух строк используется расстояние Хэмминга. <...> Для задачи поиска похожих строк (ближайшего соседа) с заданной точностью используются различные способы построения индекса и алгоритмы. <...> Похожие задачи рассматриваются в работах [1], [2], в которых предлагается метод поиска оптимальной ER-модели, основанный на поиске оптимального пути по графу или с помощью генетического алгоритма. <...> 116 ВЕСТНИК ВГУ, СЕРИЯ: СИСТЕМНЫЙ АНАЛИЗ И ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ, 2014, № 3 Сравнение алгоритмов построения поискового индекса <...>