Институт вычислительной математики РАН

37
Институт вычислительной математики РАН Томск, 2003 Воеводин В.В. ПАРАЛЛЕЛЬНЫЕ ВЫЧИСЛЕНИЯ ПАРАЛЛЕЛЬНЫЕ ВЫЧИСЛЕНИЯ

Upload: phelan-mcmillan

Post on 30-Dec-2015

79 views

Category:

Documents


3 download

DESCRIPTION

Институт вычислительной математики РАН. Воеводин В.В. ПАРАЛЛЕЛЬНЫЕ ВЫЧИСЛЕНИЯ. Томск, 2003. Почему возникают проблемы пользователей? Проблемы пользователей в примерах. Математические трудности решения проблемы. Информационная структура алгоритмов. Не научные проблемы. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Институт вычислительной математики РАН

Институт вычислительной математики РАН

Томск, 2003

Воеводин В.В.

ПАРАЛЛЕЛЬНЫЕ ВЫЧИСЛЕНИЯПАРАЛЛЕЛЬНЫЕ ВЫЧИСЛЕНИЯ

Page 2: Институт вычислительной математики РАН

• Почему возникают проблемы Почему возникают проблемы пользователей?пользователей?

• Проблемы пользователей в примерах.Проблемы пользователей в примерах.

• Математические трудности решения Математические трудности решения проблемы.проблемы.

• Информационная структура алгоритмов.Информационная структура алгоритмов.

• Не научные проблемы.Не научные проблемы.

Page 3: Институт вычислительной математики РАН

Увеличение производительности ЭВМ - Увеличение производительности ЭВМ - за счет чего?за счет чего?

EDSAC, 1949 год HP Superdome, 2001 год

такт: 2*10-6с 1.5*103 1.3*10-9с

произв.: 102 оп/с 1.9*109 1.9*1011 оп/c

Page 4: Институт вычислительной математики РАН

Earth Simulator - Earth Simulator - первое место в первое место в Top500Top500

• 5120 процессоров (640 * 8)

• Оперативная память - 10Тбайт

• Пиковая производительность - 40Tflops

• Производительность по Linpack - 35Tflops

flops - floating operations per second

M - 106, G - 109, T - 1012

Page 5: Институт вычислительной математики РАН

Системы параллельного Системы параллельного программирования программирования

• Зарубежные: Linda, PVM, MPI, High Performance Fortran, OpenMP ...

• Отечественные: НОРМА, DVM, Т-система, mpC ...

Все системы в той или иной мере требуют от пользователя дополнительную информацию

Page 6: Институт вычислительной математики РАН

Откуда брать дополнительную Откуда брать дополнительную информацию?информацию?

Образование и штатное программное обеспечение слабоподдерживают процессы ее получения.

Page 7: Институт вычислительной математики РАН

• Почему возникают проблемы Почему возникают проблемы пользователей?пользователей?

• Проблемы пользователей в примерах.Проблемы пользователей в примерах.

• Математические трудности решения Математические трудности решения проблемы.проблемы.

• Информационная структура алгоритмов.Информационная структура алгоритмов.

• Не научные проблемы.Не научные проблемы.

Page 8: Институт вычислительной математики РАН

Результаты оптимизации программыРезультаты оптимизации программыTRFD TRFD из пакета из пакета PERFECT CLUB PERFECT CLUB

BENCHMARK BENCHMARK на суперкомпьютерах на суперкомпьютерах CRAYCRAY

Baseline - результаты, полученные с помощью штатного компилятора

Manual opt. - результаты, полученные с помощью ручной оптимизации специалистами высокого класса

V-Ray opt. - результаты, полученные на основе информации, выданной V-Ray system

M90CPUs

BaselineMflop/s

Manual opt.Mflop/s

V-Ray opt.Mflop/s

148

56.1954.8654.34

81.72261.64481.03

247822954

C90CPUs

BaselineMflop/s

Manual opt.Mflop/s

V-Ray opt.Mflop/s

18

89.589.6

139.71962.68

579.72440.5

Page 9: Институт вычислительной математики РАН

Пользователь: почему?Пользователь: почему?

Aijk = Ai-1jk + Bjk + Bjk, i=1,40; j=1,40; k=1,1000

do k = 1, 1000

do j = 1, 40

do i = 1, 40

A(i,j,k) = A(i-1,j,k)+B(j,k)+B(j,k)

Производительность: 20 Mflops на Cray Y-MP C90

Page 10: Институт вычислительной математики РАН

Пользователь: почему?Пользователь: почему?

Aijk = Ai-1jk + Bjk + Bjk, i=1,40; j=1,40; k=1,1000

do i = 1, 40, 2

do j = 1, 40

do k = 1, 1000

A(i,j,k) = A(i-1,j,k)+2*B(j,k)

A(i+1,j,k) = A(i,j,k)+2*B(j,k)

Производительность: 700 Mflops на Cray Y-MP C90

Page 11: Институт вычислительной математики РАН

DO i = 1, n

DO j = 1, n

U( i + j ) = U( 2*n – i – j + 1)*q + p

EndDO

EndDO

Простой пример...Простой пример...

Page 12: Институт вычислительной математики РАН

DO i = 1, n

DO j = 1, n – i

U( i + j ) = U( 2*n – i – j + 1)*q + p

End DO

DO j = n – i + 1, n

U( i + j ) = U( 2*n – i – j + 1)*q + p

End DO

End DO

Простой пример...Простой пример...

Page 13: Институт вычислительной математики РАН
Page 14: Институт вычислительной математики РАН

Факт: нет хороших технологий “распараллеливания” вычислений и адаптации программ к требованиям больших вычислительных систем

Причина: в нужной мере не владеем знаниями и возможностями новой междисциплинарной математической области исследований - информационной структуры алгоритмов, объединяющей алгоритмы, программирование, модели вычислительных систем и др.

Page 15: Институт вычислительной математики РАН

• Почему возникают проблемы Почему возникают проблемы пользователей?пользователей?

• Проблемы пользователей в примерах.Проблемы пользователей в примерах.

• Математические трудности решения Математические трудности решения проблемы.проблемы.

• Информационная структура алгоритмов.Информационная структура алгоритмов.

• Не научные проблемы.Не научные проблемы.

Page 16: Институт вычислительной математики РАН

П рограммыМ атематическое описание

алгоритмов

Л.Лампорт и др. (1973 г.) А .П .Ерш ов и др. (1973 г.)С хемы

программ

Граф ы зависимостей М инимальны е граф ы зависимостей

Достаточны е условия

Тупик

И нф ормационная структура алгоритмов

М ногочисленные междисциплинарны е связи

Граф овые модели алгоритмов

Page 17: Институт вычислительной математики РАН

DO i = 1,n DO j = 1,n-i+1

A(I,J) = … B (I,J) … B(I,J) = … A (I,J) …

ENDDOENDDO

Л.Лампорт

А.П.Ершовi

j

Page 18: Институт вычислительной математики РАН

DO i = 1,n DO j = 1,n-i+1

A(I,J) = … B (I,J-1) … B(I,J) = … A (I,J) …

ENDDOENDDO

Л.Лампорт

А.П.Ершов

i

j

Page 19: Институт вычислительной математики РАН

S = 0DO i = 1,n

S = S + A(I)

ENDDO

Л.Лампорт

А.П.Ершов

Page 20: Институт вычислительной математики РАН

Базовая математическая задача Базовая математическая задача

Для любого вектора I ΩN построить множество векторов Ji Ωi

N, удовлетворяющих уравнениям:

piN(Ji) = qN(I),

и на этих множествах найти вектор J = J(I, N), лексикографически ближайший к I снизу.

Все объекты зависят от вектора внешних переменных N, который на момент решения базовой задачи неизвестен.

Решение необходимо находить точно и в явном виде.

Page 21: Институт вычислительной математики РАН

• Почему возникают проблемы Почему возникают проблемы пользователей?пользователей?

• Проблемы пользователей в примерах.Проблемы пользователей в примерах.

• Математические трудности решения Математические трудности решения проблемы.проблемы.

• Информационная структура алгоритмов.Информационная структура алгоритмов.

• Не научные проблемы.Не научные проблемы.

Page 22: Институт вычислительной математики РАН

Численные методы: огромное разнообразие; почти нет сведений об их структуре на уровне отдельных операций;

Языки программирования: большое разнообразие; зависимость от архитектуры параллельных компьютеров; трудно получать необходимую для программирования информацию, особенно касающуюся “параллельной” структуры алгоритмов;

Компиляторы: плохая диагностика и алгоритмы распараллеливания программ; более 85% индексных выражений не анализируются илианализируются плохо (Zhiyu Shen и другие, 1990)

Операционные системы: не эффективные алгоритмы распределения заданий между процессорами, особенно при работе с медленной памятью;

Компьютеры: большое разнообразие архитектур: отсутствие формализованной теории создания архитектуры;

Анализ вычислений: мало инструментальных средств для анализапричин не эффективного использования компьютеров.

Page 23: Институт вычислительной математики РАН

ОСНОВНАЯ ЦЕЛЬ ИССЛЕДОВАНИЙ

РЕШАТЬ ЗАДАЧИ

БЫСТРЕЕДЕШЕВЛЕ

ПРОЩЕ

НУЖЕН КОМПЛЕКСНЫЙ АНАЛИЗВСЕХ ЭТАПОВ !

Page 24: Институт вычислительной математики РАН

"Определение" алгоритма

машина Тьюринга

АЛГОРИТМЫвходные данные

последовательные языки программирования

обыкновенные компьютеры

машина Тьюринга с памятью

скорость

параллелизм

Page 25: Институт вычислительной математики РАН

нет подходящего "определения" параллельного алгоритма

АЛГОРИТМЫвходные данные

изучение структуры алгоритмов

нет подходящего определения параллельного компьютера

кластерывекторные, систолические, конвейерные, матричные,

параллельные, спецпроцессоры и другие

что делать, если что-то не так?

дополнительные сведения

PVM

HPFMPI

Linda

НормаmpCHPC DVM

Фортран, Си

Page 26: Институт вычислительной математики РАН

нет подходящего "определения" параллельного алгоритма

АЛГОРИТМЫвходные данные

Система исследования

структуры V-Ray граф-машина

нет подходящего определения параллельного компьютера

дополнительные сведения НЕ параллельные

математические задачи

Информационная структура

алгоритмов

преобразование программ

типовых информационных структур немного

Page 27: Институт вычислительной математики РАН

Метакомпьютинг? Метакомпьютинг!Метакомпьютинг? Метакомпьютинг!

• НИВЦ МГУ (Москва) - 112 процессоров• НИИЯФ МГУ (Москва) - 36 процессоров• ИПС РАН (Переславль-Залесский) - 32 процессора• ИММ УрО РАН (Екатеринбург) - 15 процессоров• УГАТУ (Уфа) - 60 процессоров• Взаимодействие - через Интернет

Задача - определение скрытой периодичности в генетических последовательностях,

Центр “Биоинженерия” РАН

Page 28: Институт вычислительной математики РАН

Метакомпьютинг? Метакомпьютинг!Метакомпьютинг? Метакомпьютинг!

-50

0

50

100

150

200

250

300

1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47

LHC

UFA

PER

UM16

SRCC

Total

Page 29: Институт вычислительной математики РАН

Информационная структура алгоритмовИнформационная структура алгоритмов

• Для широкого класса алгоритмов и программ разработаны эффективные методы нахождения всех графов зависимостей. Графы точно описываются конечными наборами простых функций.

• Используя явное представление графов, разработаны эффективные методы их исследования. Теперь об этих графах можно узнать практически все.

• Построена первая очередь автономной системы V-Ray system для обнаружения параллелизма в больших программных комплексах.

• Обнаружены многочисленные междисциплинарные связи.

Page 30: Институт вычислительной математики РАН

Близкие проблемыБлизкие проблемы

• Быстрое вычисление градиента и производной• Быстрое восстановление линейного функционала• Анализ влияния ошибок округления• Декомпозиция алгоритмов• Восстановление математических формул• Обнаружение узких мест алгоритма (по памяти, точности и т.п.)• Разработка параллельных численных методов• Разработка переносимого программного обеспечения• Использование распределенной и иерархической памяти• Выбор оптимальной архитектуры компьютера• Построение систолических массивов• Разработка параллелизующих компиляторов и многое другое

Page 31: Институт вычислительной математики РАН

ГипотезаГипотеза

Типовых

информационных структур алгоритмов

в конкретных областях

немного

Практика подтверждает гипотезу

Page 32: Институт вычислительной математики РАН

• Архитектуры параллельных вычислительных систем• Технологии параллельного программирования• Вычислительный полигон• Конфигурации современных кластерных систем• Учебные материалы, курсы, лекции, тестирование• Новости, рассылка, обмен опытом• История, персоналии, списки конференций• Параллельные вычисления в России• Среда общения профессионалов• ...

Центр создан при поддержке РФФИ

Информационно-аналитический Информационно-аналитический Центр в сети ИнтернетЦентр в сети Интернет

WWW.PARALLEL.RUWWW.PARALLEL.RU

Page 33: Институт вычислительной математики РАН

• Почему возникают проблемы Почему возникают проблемы пользователей?пользователей?

• Проблемы пользователей в примерах.Проблемы пользователей в примерах.

• Математические трудности решения Математические трудности решения проблемы.проблемы.

• Информационная структура алгоритмов.Информационная структура алгоритмов.

• Не научные проблемы.Не научные проблемы.

Page 34: Институт вычислительной математики РАН

Не научные проблемыНе научные проблемы

• катастрофическая нехватка кадров, особенно высококвалифицированных,

• недостаточная образованность на разных уровнях,

• недооценка трудностей использования больших вычислительных систем,

• разрозненность усилий специалистов,

• отсутствие учебников и учебных пособий,

• отсутствие полноценного программного сервиса,

• внедрение новых образовательных технологий,

• нерешительность в принятии волевых решений,

• ...

Page 35: Институт вычислительной математики РАН

ПАРАЛЛЕЛЬНЫЕ ПАРАЛЛЕЛЬНЫЕ ВЫЧИСЛЕНИЯВЫЧИСЛЕНИЯ

В.В.Воеводин, Вл.В.Воеводин

Рекомендовано Министерством образования РоссийскойФедерации в качестве учебного пособия для студентов высших

учебных заведений, обучающихся по направлению 510200“Прикладная математика и информатика”

БХВ-Петербург, 2002

Page 36: Институт вычислительной математики РАН

КОМУ и ЗАЧЕМ ЭТО НАДО?КОМУ и ЗАЧЕМ ЭТО НАДО?

количество экземпляров 3000

число страниц 608

количество знаков 2000000

размеры 24 см 17 см 3 см

вес 1 кг

время написания 500 дней + 20 лет

Page 37: Институт вычислительной математики РАН