13–17 МАТЕМАТИКА УДК 519.63 ВЫЧИСЛИТЕЛЬНЫЕ АЛГОРИТМЫ И ОТКАЗОУСТОЙЧИВОСТЬ ГИПЕРЭКЗАФЛОПСНЫХ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМ © 2017 г. Академик РАН Б. Н. <...> Якобовский Поступило 15.09.2016 г. Рассматривается новый метод, обеспечивающий возможность проведения длительных непрерывных расчетов на вычислительных системах, состоящих из миллионов вычислительных устройств, некоторые из которых могут выходить из строя. <...> Метод опирается на свойства гиперболизированных систем уравнений в частных производных, для которых область влияния на решение локализована в пространстве, что позволяет выполнять ускоренный перерасчет части решения без перезапуска всего расчета. <...> Приведены оценки необходимого для перерасчета числа дополнительных процессоров. <...> DOI: 10.7868/S0869565217010042 Вычислительные системы экзафлопсной и более высокой производительности будут состоять из огромного количества вычислительных устройств – процессоров и ядер. <...> Создание систем сверхвысокой производительности требует серьезных технических решений, связанных с уменьшением энергопотребления и с охлаждением конструкции. <...> Однако наибольшую принципиальную трудность вызывает проблема обеспечения отказоустойчивости. <...> Она связана с тем, что, согласно теории вероятности, в огромном количестве вычислителей постоянно будут появляться неисправные экземпляры. <...> Однако с ростом производительности систем и, соответственно, ростом числа чипов период между появлением неисправных элементов будет сокращаться, несмотря на технические ухищрения [1–3]. <...> Большая глубина стека системного программного Федеральный исследовательский центр Институт прикладной математики им. <...> М.В. Келдыша Российской Академии наук, Москва *E-mail: chetver@imamod.ru 13 обеспечения и рост количества компонент прикладной составляющей также приводят к увеличению количества ошибок в программах и сокращению периода времени между их появлением. <...> Техническими средствами эту проблему можно на пределе решить для систем <...>