ОТКРЫТЫЕ СИСТЕМЫ. СУБД
Дмитрий ВолковГлавный редактор
, с.н.с., ИПМ РАН
Научный редактор
Наталья Дубова
Редакционный совет:
Валерий Аджиев, к.т.н., с.н.с.,
Национальный центр компьютерной анимации,
Университет Борнмута (Великобритания);
Фуад Алескеров, д.т.н., профессор, НИУ ВШЭ;
Михаил Горбунов-Посадов, д.физ.-мат.н.,
зав. отделом ИПМ РАН, доцент, МГУ;
Юрий Зеленков, д.т.н., зав. кафедрой прикладной
информатики, Финансовый университет
при Правительстве РФ;
Сергей Кузнецов, д.физ.-мат.н., профессор, МГУ;
Михаил Кузьминский, к.хим.н., с.н.с., ИОХ РАН;
Александр Легалов, д.т.н., профессор, СФУ;
Владимир Сухомлин, д.т.н., профессор, МГУ;
Павел Храмцов, к.т.н., доцент, МИФИ;
Игорь Федоров, к.т.н., профессор, МЭСИ;
Виктор Шнитман, д.т.н., профессор, МФТИ;
Леонид Эйсымонт, к.физ.-мат.н., научный
консультант, НИИ «Квант»
Корректор Ирина Карпушина
Верстка и графика Мария Рыжкова
Дизайн обложки Денис Кирков
Адрес для корреспонденции:
127254, г. Москва, а/я 42
Телефоны:
+7 495 725-4780/84, +7 499 703-1854
+7 495 725-4785 (распространение, подписка)
Факс: +7 495 725-4783
E-mail: osmag@osp.ru
Подписной индекс:
99482 — «Каталог российской прессы» (МАП)
72773 — Объединенный каталог «Пресса России» АПР
59869 — «Каталог. Издания органов научно-технической
информации»
Реклама
ООО «Рекламное агентство «Чемпионс» +7 499 750-0467
Содержание № 1 (211) 2016
Иак поссорились разработчики баз данных in-memory
осполнилось 25 лет первой в мире веб-странице
В Dператоры связи поддержат Open Compute Project
ос ataCamp появится групповое обучение
З новам обработки данных
НаНоВоСТИ. ФАКТы. ТеНДеНцИИ.
К чало конца шифрования
ра четыре года на неиспользуемое По
«астрачено 30 миллиардов долларов
ДаУмные» счетчики
Д нные «холодного» хранения
веля заблокированных по решению властей
Б б-страниц ввели особый код
Eольшая группа по Большим Данным
Аclipse Che выходит в бета-версии
Wлгоритм упростит общение с роботами
O atson в роли доктора и продавца
racle прекратит выпуск плагина Java
1ПЛАТФоРМы
Эычислений
рих Штромайер, Ханс Мойер,
Джек Донгарра, Хорст Саймон
0 Рейтинг Top500 и прогресс
в высокопроизводительных
На протяжении двух десятилетий рейтинг
Top500 пользовался успехом в качестве мерила
производительности суперкомпьютеров и был
первоисточником, позволяющим проследить
технологические тенденции. Но насколько этот
рейтинг применим в эпоху экзамасштабных
суперкомпьютеров?
1В ФоКУСе: МАШИННое оБУчеНИе
обучения
Виктор Китов
4 Практические аспекты машинного
Сегодня с машинным обучением связывают
много надежд, однако успешность его применения
определяется не только выбором адекватного
задаче алгоритма, но и правильными
шагами на этапах планирования, разработки
и внедрения модели.
18 Машинное обучение для
понимания естественного языка
Павел Велихов
© 2016 Издательство «Открытые системы»
в Минист Журнал зарегистрирован
Свидетельство ПИ № ФС 77-62328
ерстве РФ по делам печати,
Технологии обработки естественного языка
сегодня шагнули далеко вперед, и немалая
заслуга в этом принадлежит машинному обучению,
применяемому, в частности, для понимания
текстов.
22 Машинное обучение
телерадиовещания и средств массовых коммуникаций
03.07.2015
Журнал выходит 4 раза в год
Цена свободная
Выпуск издания осуществлен
при финансовой поддержке
Учредитель и издатель:
ООО «Издательство «Открытые cистемы»
проезд Добролюбова, дом 3, ст Россия, 127254, Москва,
роение 3
Президент Михаил Борисов
Генеральный директор Галина Герасина
Директор ИТ-направления Павел Христов
Коммерческий директор Татьяна Филина
Все права защищены.
При ис поль зо ва нии ма те ри а лов
не об хо ди мо раз ре ше ние ре дак ции и ав то ров.
В номере использованы иллюстрации
Отпечатано в ООО «Богородский
полиграфический комбинат»
142400, Московская область,
г. Ногинск,
12+
ул. Индустриальная, д. 40б
(495) 783-9366, (49651) 73179
Тираж 4 000 экз.
и фотографии: ООО «Издательство «Открытые
cистемы» и IEEE Computer Society.
Федерального агентства по печати
и массовым коммуникациям
для планирования запросов
Олег Иванов
Рост объемов данных требует от СУБД увеличения
производительности выполнения
запросов. Оптимизация плана выполнения
запроса с использованием средств машинного
обучения позволяет в разы уменьшить время
его обработки.
26 Машинное обучение
А для Больших Данных
ндрей Орлов
Теоретические основы машинного обучения появились
практически одновременно с первыми
компьютерами, однако при его практическом
применении всегда приходится учитывать специфику
конкретных систем. Работа с Большими
Данными средствами Hadoop требует инструментов
адаптации алгоритмов машинного
обучения к этой платформе.
28 оценка компетентностей студентов
на основе анализа социальных сетей
Михаил Захаров, Анатолий Карпенко,
Елена Смирнова
В третьем поколении Федеральных государственных
образовательных стандартов высшего
профессионального образования задачи
обучения формулируются в терминах компетентностей
учащихся, что делает актуальной
задачу их оценки. На помощь приходят средства
машинного обучения, позволяющие оценить
компетентности студентов на основе анализа
их поведения в социальных сетях.
3ИНТеРНеТ Вещей
1 Референтные архитектуры
для Интернета вещей
Михаэль Вейрих, Кристофер Эберт
Интернет вещей призван предоставить новые
возможности развития и повысить производительность
труда благодаря свободе коммуникации
различных устройств друг с другом.
Однако воплощению этих идей мешает нехватка
архитектурных шаблонов, описывающих
протоколы связи с учетом особенностей
конкретных отраслей.
34 Интернет вещей для энтузиастов:
метеостанция с визуализацией
Эдуард Лебедюк
Интернет вещей развивается сегодня благодаря
не только компаниям, предлагающим
решения, специально предназначенные для
работы в Интернете вещей, но и энтузиастам,
которым остро необходимы новые инструменты
работы с взаимодействующими «умными»
вещами.
3СУБД6 Стоимостные оптимизаторы
для СУБД: вчера и сегодня
Леонид Борчук
Оптимизаторы запросов для реляционных
СУБД прошли долгий путь развития, превратившись
сегодня в сложную программу оценки
стоимости вариантов, однако в СУБД нового
поколения стоимость выполнения запросов
во внимание почти не принимается. Что это —
шаг назад или два вперед? И нужна ли вообще
преемственность для стоимостных оптимизаторов
мира Больших Данных?
4оПыТ
0 частное облако для масс
Владимир Сигунов
На базе OpenStack сегодня можно построить
частное облако. Однако опыт реальных проектов
показывает, что малым и средним предприятиям
требуются типовые масштабируемые аппаратно-программные
решения, поставляемые
вместе с технической поддержкой.
4МИР2 ДИСПАК — операционная система
атомного проекта
Ирина Крайнева
Атомный проект сыграл определяющую роль в
политическом и социально-экономическом развитии
СССР в послевоенный период, в частности,
став стимулом к развитию вычислительной
техники, вычислительной математики и программирования.
Одной из наиболее известных
программистских разработок, зародившихся в
недрах атомного проекта, стала операционная
система ДИСПАК для ЭВМ БЭСМ-6.
4ИТ-УНИВеРСИТеТы
4 На пути к открытой Науке
Сергей Паринов
Новые информационные системы для организации
научных коммуникаций позволяют повысить
ответственность ученого за качество
выпускаемых работ и обеспечить более широкое
и открытое использование их результатов.
Одна из таких систем — «Соционет».
4БИБЛИоТеКА
6 ИТ на рубеже эпох
Александр Тыренко
Темы ноябрьского, декабрьского, январского
и февральского номеров журнала Computer
(IEEE Computer Society, Vol. 48, No. 11, 12 2015
и Vol. 49, No. 1, 2 2016) — суперкомпьютеры
экзафлопсной производительности, перспективы
развития компьютеров после окончания
действия закона Мура, слияние человека с
кибернетическими системами и новые тенденции
в мире облаков.
Стр.4