Вебинар компании fujitsu «Новый уровень надежности для...
TRANSCRIPT
PRIMEQUEST -высокаянадежностьсегодня
Надежность уровня мейнфреймадля критически важных вычислений
Платформы Fujitsu корпоративного уровняПлатформы Fujitsu корпоративного уровня
Copyright 2012 FUJITSU
Супер-компьютеры
High-end
Системысреднего уровня
Начальныйуровень
GS series BS series [Solaris]
ESX, OVM, HyperV[Linux/Windows]
Global ServerPRIMEFORCE
SPARC Enterprise PRIMEQUEST
PRIMERGY
Размер системы Мейнфремы UNIX Серверы Linux/WindowsСерверы Систмеы хранения
JX40
DX100/200
DX500/600
DX8000
ETERNUS
1
Мировой лидер в рейтинге ТОР 500
Системы для критически важных приложенийСистемы для критически важных приложений
ОпределениеA
ОпределениеB
Определение Fujitsu
Системы, выход из строя которых в часы работы предприятия приведет к прекращению бизнес-операций
Системы, которые являются неотъемлимой частью для нормального функциониования компании. Если критически важная система выходит из строя, то вся компания может «пойти ко дну»
Системы с супервысоким уровнем надежности, чтобы обеспечить непрерывность бизнес-процессов заказчика. Вычислительные системы, которые изначально проектируются, разрабатываются и производятся с учетом этих требований – высочайший уровень качества, позволяющий избегать сбоев в работе оборудования
Read more: http://www.businessdictionary.com/definition/mission-critical.html#ixzz1r3wQQO4B
Read more: http://bottomlineit.wordpress.com/2011/08/18/the-changing-definition-of-mission-critical/
2
Пример – система FUJITSU FACOM 128B. Год производства – 1959. Находится в полностью исправном и работоспособном состоянии.
FUJITSU – синоним для “Mission Critical”FUJITSU – синоним для “Mission Critical”
3
Самый старый в мире компьютер, который до сих пор работает FACOM 128B, выпущен в1959
1974: первый мейнфрейм – система FACOM M-190 1976: Поставка мейнфрейма AMDAHL 470V/6 в NASA 2002: Выпуск GS21 600, самого быстрого в мире
мейнфрейма 2004: PRIMEPOWER- первый в мире UNIX-сервер,
основанный на 90-нм технологии 2005: PRIMEQUEST, - самый мощный IA-64 сервер для
критически важных вычислений 2007: Выпуск Solaris/SPARC Enterprise servers SES 2012: PRIMEQUEST 1000 Series:
Сервер для критически важных приложений на x86
Copyright 2013 FUJITSU LIMITED
Copyright 2014 FUJITSU LIMITED
Серверы для критически важных вычисленийСерверы для критически важных вычислений
За многие годы успешной работы слова Mission Critical и FUJITSU во всем мире стали синонимами
До недавненго времени только мейнфреймы и UNIX-системы могли рассматриваться как платформа для критически важных вычислений
У Fujitsu сегодня есть ряд уникальнейших технологий, которые долгие годы применялись только в мейнфреймах и суперкомпьютерах
Однако, мир критически важных серверов сильно изменлся за прошедшие несколько лет
4 Copyright 2014 FUJITSU LIMITED
Тектонический сдвиг платформ для критически важных вычисленийТектонический сдвиг платформ для критически важных вычислений
PRIMEQUEST открывает мир критически важных вычислений на x86 уже сегодня
5 Copyright 2014 FUJITSU LIMITED
Позиционирование PRIMEQUEST и UNIXПозиционирование PRIMEQUEST и UNIX PRIMEQUEST – наименьшая цена среди серверов класса
Enterprise при таком же уровне надежности Уровень надежности «обычного х86 сервера» и надежность PRIMEQUEST – совершенно разные вещи
Product-Market Mapping
General PC
server
Cost-efficiency
Reliability
IBM Power System/HP Superdome-2
PQ single server
6 Copyright 2014 FUJITSU LIMITED
Процесс Контроля КачестваПроцесс Контроля Качества
Доскональное тестирование 20 серверов от 3 до 6 месяцев Тестирование функций RAS, администрирования, технического обслуживания, инсталляционных процедур, настроек и нормального функционирования
Тестирование допустимых отклонений Подтверждение допустимых отклонений в расширенном диапазоне уровней напряжения, температуры и тактовых частот
Полное тестирование системы Тестирование с полной загрузкой при работающих приложениях Всестороннее тестирование механизмов RASПутем искуственного привнесения помех и ошибок
Copyright 2014 FUJITSU LIMITED
Привнесение даже незначительных изменений в заводскую компоновку системы (например, изменение крепежных винтов), требует проведение повторной процедуры тестирования и получение одобрения от Отдела
Контроля Качества
7
Токийская фондовая биржаТокийская фондовая биржа
В эксплуатации с 4 Января 2010 PRIMEQUEST и Linux
Особенности проектаМиграция с мейнфреймов FujitsuВысочайшая производительность
• Время отклика менее 2 мс• Больше чем в 1000 раз быстрее предыдущей системы
Высочайшая надежность• Надежность уровня мейнфреймов
Линейная масштабируемость, возможность апгрейда без остановки приложений
• Возможность on-line удвоить производительность при пиковых нагрузках
PRIMEQUEST работает на одной изкрупнейших фондовых бирж мира
Copyright 2013 FUJITSU LIMITED8
Отвечая самым жестким требованиямОтвечая самым жестким требованиям
Высокая надежность→ Устранение простоев благодаря динамическому
реконфигурированию (Динамическое добавлениеCPU, памяти, и/или IO), резервная System Board, избыточность компонентов
PRIMEQUEST – уникальная платформа
Высочайшая пропускная способность / Расширяемость→ Max. 8CPU (120 Cores)→ Max.12TB Memory (192 DIMMs)→ Max. 56 PCIe slots
Новейшие технологии для систем реального времени и малого времени отклика→ PCIe SSD, Infiniband, 10GbE, PCIe Gen3
Изоляция ресурсов→ Физические (Аппаратные) разделы
FUJITSU ServerPRIMEQUEST 2000
9
Новое поколение PRIMEQUESTНовое поколение PRIMEQUESTPRIMEQUEST 1000 Series New PRIMEQUEST 2000 Series
PRIMEQUEST1800E2 (8skt)
PRIMEQUEST2800E (8skt)
PRIMEQUEST2400E (4skt)
PRIMERGY RX Series
PRIMEQUEST2800B (8skt)
RX900S2(8skt)
Семейство PRIMEQUEST теперь состоит из трех моделей
10
11
Fujitsu PRIMEQUEST 2400E и 2800E
Надежность уровня мейнфрейма для Linux и Windows
Критически важные
приложения
Масштабируемые базы данных
Аналитика в реальном времени
Эффективность Эффективность и гибкость архитектуры x86 при надежности уровня мейнфрейма
Экономическая эффективность Низкий уровень энергопотребления
RAS функции Аппаратные и расширенные разделы (партиции) Системная плата горячего резерва Гибкость подсистемы ввода/вывода Практически все компоненты продублированы
Динамическая платформа для современного ЦОДа 8x Intel Xeon процессоров E7-8800 v2 До 12TB памяти и 120 ядер Новый уровень надежности и динамичности –возможность реконфигурирования аппаратной части системы без перезагрузки
Особенности
Сценарии использования
Консолидация серверных мощностей
Copyright 2014 FUJITSU
12
PRIMEQUEST 2800EРесурсы для аппаратных разделов
Copyright 2014 FUJITSU
PRIMEQUEST 2800E• До четырех системных плат, каждая укомплектована
• 2x CPU Intel Xeon E7v2, • 3TB memory max, • 4 HDD slots• Один или два отдельных • дисковых модуля, каждый до
4x HDD / SSD .
• 1-4x IO-Unit -F /-L, 12-16PCIe слотов максимум без учета внешних IO Box
IO-Box#0 to IO-Box#3 2x 6x PCIe G3 PCIe слотов
Опционально до 4 внешних IO-box
13INTERNAL USE ONLYINTERNAL USE ONLY
PRIMEQUEST –лучший выбор для SAP HANA Высокоскоростные in-memory базы данных, системы реального времени и аналитики.
• Производительность увеличивается в десятки и сотни раз.
Возможность масштабирования от S до XXL Продуктив, разработка и аналитика на одном сервере
Высокая надежность – использование системнойплаты горячей замены Динамическое реконфигуриование под управлением RedHat6.5 / SuSE12
Sca
le-u
p
• PRIMEQUEST 2800ET-shirt S to XXL certification
PRIMEQUEST 2x00B/E Сценарий использования для SAP HANA
Mem
ory
CPUCPU
ERR
MirrorMirror
Application
Mem
ory
CPUCPU
Application
ERRERR
removed
ERR
Динамическоедобавление
резервной SB враздел
Динамическоеудаление сломанногомодуля из раздела
Изъятиедефектногомодуля
Зеркалирование памятизащищает приложение от сбоя
1
Обнаруженааппаратнаяошибка 2
3
4
Нормальный режим
spared
MirrorMirror
Application Application
Enable Upgradein One Box
Easy Scale-up Size XXL8 socket
12TB !
Size XL8 socket
6TB
Size S2 socket256 GB
Copyright 2014 FUJITSU
Partition A
Каждый сервер может быть динамически разделен на несколько независимых аппаратных систем
• Различные ОС в различных аппаратных разделах.• Перезагрузка и останов отдельного• раздела• Возможность гибкого подключенияплат IO и системных плат• Системные платы горячего резерва• Максимальное время безостановочнойработы благодаря автоматическому пере-ходу приложений на резервные системныеплаты• Работа нескольких независимых прило-жений без влияния на производительностьдруг друга• Использование программных средств виртуализации «поверх» партиций(Vmware, Hyper-V)
Аппаратные разделыАппаратные разделы
Partition B Partition C
Copyright 2014 FUJITSU LIMITED14
15
Поддерживаемые типы разделов
Физические разделы(PPAR)
Расширенные разделы (extended Partition)
Программные разделы(Гипервизор)
Уровеньизоляции Hardware Hardware/Firmware Hypervisor
Ключевыеотличия
Высокая надежность и производительность
Хороший уровень консолидации и надежности
Высокая степень консолидации
Fault tolerance
Application level: Application errors don’t affect other partitions
Firmware level: F/W errors do not affect others
Гибкость и гранулярность
Элемент системы –системная плата, IOU
Гранулярность до слота PCI , ядра CPU , DIMM, и.т.д.
В процентах от аппаратных ресурсов: 10% от ядра CPU,
и.т.д.
Блок-схема
Hard wareHard wareFirmwareFirmware
OSOS
App
FirmwareFirmwareOSOS
App
HardwareHardwareHypervisorHypervisor
OSOS
App
OSOS
App
HardwareHardwareFirmwareFirmware
OSOS
App
HardwareHardwareFirmwareFirmware
OSOS
App
Уровень приложений: Ошибки работы приложения не влияют на другие разделы
Уровень микрокода: ошибки F/W не затрагивают другие разделы
Аппаратный уровень не затрагивают другие разделыАппаратный уровень: ошибки H/W не затрагивают другие разделы Большинство ошибок H/W изолируются внутри разделов
Copyright 2014 FUJITSU
Copyright 2014 FUJITSU LIMITED
24
64
48
32
0
10
20
30
40
50
60
70
New PQ with 8 socket(3.4GHz/6core)
HP Superdome28sockets
IBM Power 760 IBM Power 750
Сравнение с UNIX-серверами c 4~8 сокетами При одинаковой производительности
Снижение стоимости использования Oracle DB
Number of Oracle license&Support charge
Oracle License & Support ChargeComparison under similar performance
16
История успеха: Meditel, MoroccoИстория успеха: Meditel, Morocco
17
Максимальная непрерывность бизнеса Катастрофоустойчивая избыточная конфигурация высочайшего уровня надежности –
аппаратные разделы, разнесенное резервное копирвание, полностью избыточная конфигурация
Использование открытых стандартов: Intel Xeon, Red Hat Enterprise Linux для критически важных конфигураций существенно снижает показатель цена/производительность
Стоимость сервисного обслуживания в год для новой системы составила менее 1/3 от предыдущей, куда более медленной системы.
»крайне редкая ситуация – проект такого масштаба и уровня сложностиt был выполнен без каких-либо серьезных трудностей и осложнений «Manuel Garcia, CTO Méditel
Конфигурация
•17x PRIMEQUEST 1800E •40x PRIMERGY BX900 server blades on RED Hat Enterprise Linux 5.4 and Oracle Databases•2xETERNUS DX 8700 S2•ETERNUS CS 2000•ETERNUS DX90
ПРЕ
ИМУЩ
ЕСТВ
А
17Copyright 2014 FUJITSU
18 Copyright 2013 FUJITSU LIMITED