Ю.А. Григорьев, Е.Ю. Ермаков
СРАВНЕНИЕ ПРОЦЕССОВ ОБРАБОТКИ ЗАПРОСА
К ОДНОЙ ТАБЛИЦЕ В ПАРАЛЛЕЛЬНОЙ СТРОЧНОЙ
И КОЛОНОЧНОЙ СИСТЕМЕ БАЗ ДАННЫХ
Приведены результаты сравнения процессов обработки запросов
в строчной и колоночной СУБД. <...> Показано преобразование Лапласа —
Стилтьеса (ПЛС) времени обработки запроса с планом πA(σF(R))
в этих СУБД. <...> E-mail: iu5vmch@rambler.ru
Ключевые слова: параллельные строчные и колоночные базы данных,
преобразование Лапласа — Стилтьеса, сравнение строчных и колоночных систем баз данных
Введение. <...> Согласно Майклу Стоунбрейкеру, пионеру исследований в области
больших баз данных [2], такая идея «безразмерности», когда традиционная архитектура СУБД, изначально разработанная и оптимизированная для обработки бизнес-данных, используется для поддержки
приложений, требующих обработки больших объемов данных, больше не применима к рынку баз данных. <...> Мир коммерческих СУБД будет дробиться на набор независимых, специализированных средств
управления базами данных [3]. <...> Одним из основных и самых перспективных архитектурных решений для специализированных СУБД в области хранилищ данных
является колоночное хранение данных: большой потенциал колоночных систем подтверждают аналитические исследования и прогнозы
аналитиков [1, 3—5]. <...> Это достигается за счет того, что из базы
данных читаются только те атрибуты, которые участвуют в запросе, а
также применяются эффективные методы сжатия столбцов. <...> Таким образом, перед проектировщиком системы обработки данных возникает непростая задача выбора между традиционными
(строчными — Oracle, MS SQL Server и др.) и специализированными
СУБД (колоночными — Vertica, ParAccel и др.) <...> В работе приведены результаты сравнения процессов обработки
запросов в параллельной строчной и колоночной системе баз данных,
а также времени выполнения запроса к одной таблице на основе математических методов, предложенных авторами в работах [11, 12] и
учитывающих особенности выполнения запросов к колоночным <...>