Методика выбора параметров и интерпретации результатов анализа …
УДК 004.052.42
Методика выбора параметров и интерпретации
результатов анализа выбросов в данных
систем поддержки принятия решений
© В.И. Кузовлев, А.О. Орлов
МГТУ им. <...> Н.Э. Баумана, Москва, 105005, Россия
Описана модель анализа категориальных атрибутов данных. <...> Модель построена на
вычислении показателя локальной аномальности LOF, расчете расстояний между
значениями категориальных атрибутов с использованием формулы инверсной гравитации, понятиях плотности объектов и ядра. <...> Обнаружена зависимость результатов работы модели от параметра k, характеризующего число ближайших
объектов при расчете показателя LOF. <...> Предложены интервалы значений параметра k, показан вариант применения этих интервалов при определении лингвистических переменных для использования в создании правил нечеткого вывода с
целью обеспечения гибкости при выборе параметра k и возможности нечеткой
интерпретации значений показателя LOF. <...> Ключевые слова: показатель локальной аномальности, LOF, выбросы в данных,
аномалии в данных, категориальные атрибуты. <...> Объекты генеральной совокупности представляют собой экземпляры некоторых сущностей, обладающие одинаковым набором атрибутов. <...> Значения этих атрибутов
анализируются для выявления закономерностей среди всех объектов
генеральной совокупности (далее — объекты данных). <...> Выбросами,
или аномалиями, называются такие объекты данных, которые не удовлетворяют качествам, характерным для большинства других объектов генеральной совокупности. <...> Поскольку каждый объект данных
обладает рядом атрибутов, можно говорить о степени схожести объектов, основываясь на сравнении всех значений соответствующих
атрибутов этих объектов. <...> Большинство методов поиска выбросов в
данных построены на вычислении расстояний между объектами данных [1]. <...> В [2, 3] описывается метод поиска выбросов, основанный на
расчете показателя локальной аномальности LOF <...>