С ростом мощности и стоимости больших суперкомпьютерных вычислительных комплексов остро встаёт вопрос об эффективности их использования. На данный момент средств, позволяющих оценить эффективность вычислительного комплекса и эффективность параллельных программ без существенного вмешательства в работу программ практически нет.
В работе предлагается подход к оценке эффективности работы больших приложений на больших суперкомпьютерных вычислительных комплексах и эффективности работы самих вычислительных комплексов. В рамках подхода предлагается параллельный сбор и хранение данных мониторинга и параллельная обработка собранных данных. Предлагаемый подход нацелен не на определение проблемных участков кода, а на выявление наличия проблем в процессе работы программы или всего комплекса. Наличие проблем может означать как неэффективно написанную программу, так и неэффективную конфигурацию комплекса.
По данным полученным в результате анализа, администратор комплекса может провести оптимизацию настроек, а программисты — провести более глубокий анализ своих программ с целью оптимизации производительности.
Работы выполнялись с финансовой поддержкой из средств гранта РФФИ 09-07-00168-а.