Инженерная производительность и...
TRANSCRIPT
0 Copyright 2012 FUJITSU
Инженерная производительность
и суперкомпьютеры
Fujitsu
Павел Борох Fujitsu Technology Solutions
Fujitsu IT Future, сентябрь 2012
1 Copyright 2012 FUJITSU
HPC …
Потрясающий спектр приложений
2 Copyright 2012 FUJITSU
Потрясающий спектр приложений
От базового дизайна и оптимизации до сложных моделей и
симуляций
3 Copyright 2012 FUJITSU
Сегментация рынка HPC
Университеты и
академия
Государственные
лаборатории
Био-исследования CAE
Оборонный
сектор
Анализ
данных
Цифровой
контент
Гео-науки
Погода
12.0 11.9
18.9
9.6
7.0
6.3
6.0
4.2
Экономика, финансы Химические разработки
Проектирование
механизмов
17.6
Прочее
3 2
Source: IDC, April 2012
%
2011, доля доходов
4 Copyright 2012 FUJITSU
Анализ преимуществ HPC
Ключевые преимущества HPC
Высокоточные симуляции
позволяют отбросить
неудачные разработки до
стадии прототипирования
Открывает неожиданные
аспекты разработки
продукции, которые незаметны
без HPC
Способствует инновациям и
производительности
Значительно снижает затраты
на создание и тестиррование
Создает предпосылки для
успешной конкуренции на
глобальных рынках
Ключевые проблемы
Ускорить выход на рынок
инновационных
высококачественных продуктов
Сократить фазу дизайна и
минимизировать затраты и
время для тестирования
физических прототипов
Решения
Внедрение мощных HPC-
инфраструктур для
моделирования
Исследования и тестирование
моделей c помощью HPC перед
тестированием физического
прототипа
Source: Analysis of Case Studies published by the Council of Competitiveness
5 Copyright 2012 FUJITSU
Высокопроизводительные
вычисления и Fujitsu
6 Copyright 2012 FUJITSU
Japan’s First
Vector (Array)
Supercomputer(1977)
No.1 in Top500
(Nov. 1993)
Gordon Bell Prize
(1994, 95, 96)
F230-75APU
VPP5000
VPP300/700
AP3000
VPP500
AP1000
VP Series
NWT* Developed with NAL
World’s Fastest
Vector Processor (1999)
PRIMEPOWER HPC2500
World’s Most
Scalable
Supercomputer
(2003)
Japan’s Largest
Cluster in Top500
(July 2004)
Most Efficient Performance in Top500 (Nov. 2008)
PRIMERGY BX900 Cluster node
HX600 Cluster node
PRIMEQUEST
FX1
SPARC Enterprise
PRIMERGY RX200 Cluster node
*NWT: Numerical Wind Tunnel
ⒸJAXA
K computer
FX10 Trans-Exascale
Exascale
No.1 in Top500
(June and Nov., 2011)
PRIMERGY CX400
Next x86 generation
Fujitsu разрабатывает передовые суперкомпьютеры
с 1977 года!
PRIMERGY в HPC уже 10 лет!
Серверы Fujitsu для HPC - история
8 Copyright 2012 FUJITSU
Fujitsu PRIMEHPC FX10
Node Theoretical
computational
performance
236.5GFLOPS
Processor SPARC64™ IXfx
(1.848GHz, 16 cores)
x 1
Memory capacity 32GB, 64GB
Memory bandwidth 85GB/s
Inter-node transfer
rate
5GB/s × 2
(bidirectional) / link
System No. racks 4 ~ 1,024
Nodes 384 ~ 98,304
Theoretical
computational
performance
90.8 ~
23,248TFLOPS
Total memory 12 ~ 6,291TB
Interconnect “Tofu” Interconnect
Cooling Method Direct water cooling +
air cooling
(Optional: Exhaust
cooling unit)
Новый уровень суперкомпьютеров – с ноября 2011
SPARC64™ VIII / IX fx RAS coverage ranges
Hardware-based error
detection + possible self-
recovery range
Hardware-based error
detection range
Range in which errors
do not affect actual
operation
9 Copyright 2012 FUJITSU
Подход Fujitsu к рынку HPC
Fujitsu предлагает HPC-платформы для каждого сегмента
Workgroup
Supercomputer
Divisional
Departmental
Work Group
HPC решения
PRIMERGY
FX 10 Petascale
Supercomputer
Power Workstation
НОВИНКА
11 Copyright 2012 FUJITSU
Высокопроизводительные
вычисления с Fujitsu
HPC на основе PRIMERGY x86
12 Copyright 2012 FUJITSU
Элементы экосистемы PRIMERGY HPC
Серверы PRIMERGY
PCM
Edition
Cluster Operation Партнерства с
разработчиками и
исследователями
Open Petascale Libraries Network
PreDiCT Initiative
Консалтинг и интеграционные услуги
Sizing,
design
Proof of
concept
Integration into
customer environment
Готовые решения
Certified system
and production
environment
Complete assembly,
pre-installation and
quality assurance
Ready to
operate
delivery
СХД Eternus
13 Copyright 2012 FUJITSU
Потенциал роста для….
Scalability,
density &
energy costs
RX200
Scalability,
density &
availability
BX900
capacity
capability
Гибкость – для любых запросов НОВИНКА: PRIMERGY CX400
• Массивное масштабирование сверхплотными серверами
• Поддержка GPU-сопроцессоров для HPC
Новейшее поколение процессоров Intel® Xeon® серии E5
Наивысшая производительность памяти и высокая надежность
Infiniband Плотность на уровне передовых блейд-серверов Лидирующие решения ввода-вывода
CX400 BX400
NEW
14 Copyright 2012 FUJITSU
Рост производительности PRIMERGY
Новые возможности платформы
Romley / Sandy Bridge для HPC
До 2X FLOPS для HPC-нагрузок с Intel®
Advanced Vector Extensions (AVE)
Новые команды для улучшенной
векторизации
Увеличен размер регистров SSE FP
До 4 каналов DDR3 1600
До 120% прирост
производительности от предыдущего
поколения…
До 70% прирост в целом
До 120% в HPC - сценариях
… больше нагрузок на той же
системе
PRIMERGY S7/S3 по сравнению с
предыдущим поколением
Source: Intel Двухсокетные системы PRIMERGY справятся с сегодняшними и готовы к
завтрашним задачам
VMmark 2.0
SAP SD
SPECint_rate_
base2006
SPECfp_rate_
base2006
HPC LINPACK
SAP SD Server
Power
SPECpower
+39%
+56%
+70%
+80%
+120%
+43%
+73%
Eff
icie
ncy
Pe
rfo
rma
nce
Уровень предыд.
поколения
Превосходство
16 Copyright 2012 FUJITSU
PRIMERGY CX400 – для HPC
Оптимален для HPC
До 4 узлов (1U) или 2 узлов (2U) на
шасси 2U
2x Intel® Xeon® E5-2600 на узел
16 DIMMs, вплоть до 1600MHz
Избыточные БП гор. замены
До 24x HDD
FDR Infiniband как опция
Опция GPU (узлы 2U)
Поддержка Intel MIC Q1/ 2013 в планах
High Density / Scalability in 2U Chassis
Main usage scenario
Cloud HPC
CX400 комбинирует высокую вычислительную мощность с
высокой плотностью при разумных ценах
17 Copyright 2012 FUJITSU
High Performance Computing
with Fujitsu
Будущие технологии
• Parallelism next
• HPC in the Cloud
18 Copyright 2012 FUJITSU
The Future in High Performance Computing
Intel Xeon Processor
1 core, 2 threads
Intel Xeon E5 Processor
8 cores,16 threads
Towards
Many Core
Architectures
Exascale enforces a deployment of parallelism at each level to
the ultimate possible extent
Node level (distributed memory)
Multi socket (shared memory on nodes)
CPU level (number of cores)
Instruction level (SIMD)
Challenges
Increasing parallelism within the CPU results in demand for higher
memory bandwidth and thus greater complexity of the memory hierarchy
Node parallelism enforce the development and deployment of ultra-high-
speed interconnect
Increasing parallelism towards millions of cores leads to increase in
system errors
Amdahl‘s Law is more alive than ever and demonstrates that even the
smallest portion of serial code dominates (negatively) the overall
performance of a code
A tiny portion of just 1 per mill of sequential code within a parallel
application strictly limits the possible speedup to a factor of 1000
Nvidia
Tesla GPGPU
(M-Series)
Intel
Knights Ferry,
Knights Corner
19 Copyright 2012 FUJITSU
Главное: масштабируемое отказоустойчивое ПО
Open Petascale Libraries
Разработка овых алгоритмов и мат.библиотек, использующих
многоядерные HPC-системы для ускорения работы приложений
Совместный open-source проект с 2010
Открытые результаты для HPC-сообщества
Multi-core CPU Interconnect
Hybrid Programming Model (MPI + Threading)
Open Petascale Libraries Open Petascale Libraries Network
International
Research
Projects
20 Copyright 2012 FUJITSU
HPC in the Cloud
HPC in the Cloud – a different HPC delivery model
Benefits: cost savings (capex vs opex); biz flexibility (resources
when you need them); scale up & down (as much as you need)
Challenges for HPC Cloud have to be overcome:
Security and privacy guarantees (to protect corporate assets like software,
data, and personal information)
Performance degradation: data transfer, virtualization, sub-optimal h/w
ROI is often not clear: in-house HPC versus Cloud HPC
Learning curve may take time and money
Mental challenge: loosing control: hardware, software, data => TRUST
Fujitsu Technical Computing Cloud in Aug 2011 in Japan;
early users are running test and production jobs
21 Copyright 2012 FUJITSU
Fujitsu Technical Computing Cloud
Started in August 2011 with 3 services for technical computing
in manufacturing: Analytical Platform Service, which provides a platform for conducting
analytical simulations;
Analytical Applications Service, which provides analytical applications;
and
Analytical Help Desk, which provides support for setting up and running
analytical simulations.
Use Case: Nikon Corporation, a manufacturer of precision
optical equipment: First, using the Analytical Platform Service to cope with the electricity
supply shortages in Japan in 2011
Then, running analytical simulations for designing and developing optical
equipment such as cameras, photolithography machines, and measuring
instruments.
22 Copyright 2012 FUJITSU
В заключение…
: 35 лет лидерства в HPC
..с K computer, PRIMEHPC FX10, и серверами PRIMERGY
Уровень «petascale HPC» сегодня, готовность к «exascale» завтра
Fujitsu предоставляет HPC-решения для различных масштабов задач и обеспечивает внедрение и успешное применение HPC в науке и промышленности
23 Copyright 2012 FUJITSU