ПРИКЛАДНАЯИНФОРМАТИКА ¹ 2(20) 2009 А. А. Островский Реализация параллельного выполнения алгоритма FCM-кластеризации Огромные объемы информации зачастую провоцируют немалое количество объектов, выдаваемых по запросу пользователя. <...> Такой процесс группировки данных осуществляется с помощью кластеризации. <...> Алгоритм FCM Целью FCM (Fuzzy Classifier Means)—алгоритма кластеризации—является автоматическая классификация множества объектов, которые задаются векторами признаков в пространстве признаков. <...> Другими словами, такой алгоритм определяет кластеры и соответственно классифицирует объекты. <...> Кластеры представляются нечеткими множествами, и, кроме того, границы между кластерами также являются нечеткими. <...> Алгоритм FCM предполагает, что объекты принадлежат всем кластерам, причем с определенной функцией принадлежности. <...> Степень принадлежности определяется расстоянием от объекта до соответствующего кластерного центра. <...> По данному алгоритму итерационно вычисляются центры кластеров и новые степени принадлежности объектов. <...> Алгоритм основан на минимизации целевой функции: Ju xij||, j aE a a || 1 C ji N m ij c где N—количество документов; С—количество кластеров; uij (1) — степень принадлежности объекта i —i-й объект набора объектов; c j —j-й кластер набора кластеров; ЛабораторияИспытаниетехнологий кластеру j; m — любое действительное число, большее 1; xi ||xc ||ij E —норма, характеризующая расстояние от центра кластера j до объекта i. <...> Задачей FCMалгоритма является разбиение этого набора на заданное количество кластеров. <...> Для каждого документа составлен частотный портрет входящих в него значимых терминов. <...> Эти частотные портреты и являются векторами признаков объектов (электронных документов) кластеризации. <...> Инициализация Задаются параметры кластеризации и инициализируется первоначальная матрица принадлежности электронных документов кластерам. <...> Выбираются значения следующих параметров: экспоненциальный вес (m); мера расстояний <...>