По прогнозам экспертов реальные экзафлопсные компьютеры с производительностью 1000 PFlops появятся ориентировочно в 2018 году. Предполагается гибридная архитектура их построения, содержащая от 10 до 100 млн. вычислительных ядер. Создание таких суперкомпьютеров потребует решения целого ряда проблем: технических (энергопотребление, охлаждение, надежность, память большого объема и др.); создания алгоритмического и программного обеспечения (переработка ОС, среды исполнения, компиляторов, библиотек, сред программирования и пр.).
В докладе рассматривается вариант применения системы моделирования для экзафлопсных вычислений, которая позволит прогнозировать организацию и функционирование будущих компьютеров. Предлагается использовать хорошо зарекомендовавший себя для масштабного распределённого моделирования агентно-ориентированный подход. Показана организация модели, основанная на делегировании управляющих функций в локальные области вычислений с использованием иерархической системы распределённого управления.
В качестве примера масштабной задачи, хорошо распараллеливаемой на произвольное количество вычислителей, используется задача численного статистического моделирования. Предлагаемый агентно-ориентированный подход к построению имитационной модели экзафлопсного компьютера, не требующий глобального централизованного управления, хорошо соответствует методике распределенного статистического моделирования.
Рассматривается вариант реализации мультиагентного моделирования для предотвращения сбоев и отказов вычислительных узлов. Динамическая система предотвращения сбоев состоит из агентов различного назначения и экспертной системы, содержащей свод правил поведения системы для предотвращения сбоев вычислительных узлов. Для каждой поступающей из очереди задачи инициируется система имитационного моделирования, которая прогнозирует и предотвращает сбойные ситуации.
Abstracts file: | Глинский и др. Тезисы.doc |