Процессоры intel xeon и технологии intel для облачных решений
TRANSCRIPT
Процессоры Intel® Xeon®
и технологии Intel для облачных решений
Сергей Жуковский
Специалист по применению продукции
рост инфраструктурных облачных решений во всём мире
Локальные производителипомогут ускорить и упростить
пользователям переход коблачной инфраструктуре
предлагая готовые решения наоснове конвергентных
вычислительных платформ
Использование компонентов итехнологий Intel для облачной
инфраструктуры помогаетбыстрее внедрять облачные
решения.(Процессоры, чипсеты, сетевые
адаптеры и контроллеры, компоненты для хранения данных)
9
* source: Intel & Bain analysis
Пользователи уже тестируютпереход на облачные решения.
Службам ИТ нужна помощь вмодернизации Информационных
Систем и внедрении облачныхрешений.
CLOUD
До 80% решений и приложений будут использоватьоблачную архитектуру к 2024г.*
Семейства серверных процессоров Intel® - основа решений
Сопроцессоры Intel® Xeon Phi™ работают в серверах совместно с процессорами Intel® Xeon®. SoC-решения оптимизированы для компактных устройств с невысоким энергопотреблением.
+
Intel® Itanium® processor9500 product family
Intel® Xeon Phi™ coprocessor x100 product family
Intel® Xeon® processorE7 family
Intel® Xeon® processorE5 family
Intel® Xeon® processorE3 family
Intel® Xeon® processorD family
Intel® Atom™ processor product family
Решения на одномкристалле (SoC)
Микропроцессоры
Сопроцессоры
4
Процессоры Intel® Xeon®Широкая продуктовая линейка, большой выбор и гибкость
Intel® Xeon® серии E5
Наиболее гибкие и эффективные
E5-2400 v2 E5-4600 v2 и v3
Intel® Xeon® серии E7
Максимальная надежность имасштабируемость
E7-8800/4800/2800 v2 и v3
Intel® Xeon® серии E3
Наиболее доступныеE3-1200 v3, v4 и v5
E5-2600 v2 и v32- сокетные начального
уровня2-сокетные наиболее
массовые4-х сокетные компактные
Экономичные односокетные решения
Максимальные производительность и надёжность
Лидер производительности на сегодня -семейство процессоров Intel ®Xeon® семейства E5-2600 v3
5
Software and workloads used in performance tests may have been optimized for performance only on Intel microprocessors. Performance tests are measured using specific computer systems, components, software, operations and functions. Any change to any of those factors may cause the results to vary. You should consult other information and performance tests to assist you in fully evaluating your contemplated purchases, including the performance of that product when combined with other products. For more information go to http://www.intel.com/performance . Up to 3x performance claim. Source as of September 8, 2014. New configuration: Hewlett-Packard Company HP ProLiant ML350 Gen9 platform with two Intel® Xeon® Processor E5-2699 v3, Oracle Java Standard Edition 8 update 11, 190,674 SPECjbb2013-MultiJVM max-jOPS, 47,139 SPECjbb2013-MultiJVM critical-jOPS. Source. Baseline: Cisco Systems Cisco UCS C240 M3 platform with two Intel® Xeon® Processor E5-2697 v2, Oracle Java Standard Edition 7 update 45, 63,079 SPECjbb2013-MultiJVM max-jOPS , 23,797 SPECjbb2013-MultiJVM critical-jOPS. Source.Up to 1.9x increase in workload claim. Source as of August 2014 TR#3034 on Linpack*. Baseline configuration: Intel® Server Board S2600CP with two Intel® Xeon® Processor E5-2697 v2, Intel® HT Technology disabled, Intel® Turbo Boost Technology enabled, 8x8GB DDR3-1866, RHEL* 6.3, Intel® MKL 11.0.5, score: 528 GFlops. New configuration: Intel® Server System R2208WTTYS with two Intel® Xeon® Processor E5-2699 v3, Intel® HT Technology disabled, Intel® Turbo Boost Technology enabled, 8x16GB DDR4-2133, RHEL* 6.4, Intel® MKL 11.1.1, score: 1,012 GFlops. Up to 6x throughput claim. Comparisons based by Intel on publicly available specification sheet data &/or white papers
До 3x прироста производительности с оптимизацией кода и библиотек
До 1.9x прироста производительности с инструкциями Intel® Advanced Vector
Extensions (AVX) 2.0.
27 Мировых рекордов, самые энергоэффективные серверы
До 6x увеличения пропускной способности с новыми SSD
Доступно 40GbE для виртуализации сетевых функций
Улучшенное управление виртуализацией с Cache Monitoring
Вычисления
Сеть
Хранение
• Node Manager 3.0• Cache Monitoring
6
Основные особенности• Advanced Vector Extensions (AVX) 2.0• Поддержка памяти DDR4• Самый энергоэффективный процессор в мире• Virtual Machine Control Structure (VMCS) Shadowing
• Intel® SSD (твердотельные накопители)• Intel® AES-NI
Вычисления
Сеть
Хранение
• Контроллер 10/40 Gb Ethernet• Разгрузка сетевой виртуализации• Intel® Ethernet Flow Director • Виртуализация сетевых функций (NFV)
• Intel® QuickAssist® Technology
7
Intel® Advanced Vector Extensions (AVX) 2.0
2012 2013 2014
Пр
ои
зво
ди
тел
ьно
сть
\яд
ро
Intel® AVX 1.02X Flops: 256-битные векторы с плавающейзапятой
E5-2600(32 нм «Так»)
Поддержка вычислений сплав. запятой половиннойточности, ГСЧ
Intel®
AVX 2.0
E5-2600 v2(22 нм «Тик»)
E5-2600 v3(22 нм «Так»)
С 2001 года:128-битные векторы
Source as of August 2014 TR#3034 on Linpack*. Baseline configuration: Intel® Server Board S2600CP with two Intel® Xeon® Processor E5-2697 v2, Intel® HT Technology disabled, Intel® Turbo Boost Technology enabled, 8x8GB DDR3-1866, RHEL* 6.3, Intel® MKL 11.0.5, score: 528 GFlops. New configuration: Intel® Server System R2208 ВтTTYSwith two Intel® Xeon® Processor E5-2699 v3, Intel® HT Technology disabled, Intel® Turbo Boost Technology enabled, 8x16GB DDR4-2133, RHEL* 6.4, Intel® MKL 11.1.1, score: 1,012 GFlops Software and workloads used in performance tests may have been optimized for performance only on Intel microprocessors. Performance tests, such as SYSmark and MobileMark, are measured using specific computer systems, components, software, operations and functions. Any change to any of those factors may cause the results to vary. You should consult other information and performance tests to assist you in fully evaluating your contemplated purchases, including the performance of that product when combined with other products. For more information go to http://www.intel.com/performance *Other names and brands may be claimed as the property of others.
new
• Ускорение высокопроизводительных вычислений сплавающей запятой с помощью инструкций Fused Multiply Add (FMA)
• 256-битные целочисленные векторные инструкциипомогают в математических задачах, кодеках, приобработке изображений и сигналов
90%До 90% приростапроизводительности отпоколения кпоколению
8
Преимущества памяти DDR4
Source as of August 2014 TR#3044 on STREAM (triad): Intel® Server Board S2600CP with two Intel® Xeon® Processor E5-2697 v2, 24x16GB DDR3-1866 @1066MHz DR-RDIMM, score: 58.9 GB/sec. New Configuration: Intel® Server System R2208 WTTYS with two Intel® Xeon® Processor E5-2699 v3, 24x16GB DDR4-2133 @ 1600MHz DR-RDIMM, score: 85.2 GB/sec. Software and workloads used in performance tests may have been optimized for performance only on Intel microprocessors. Performance tests, such as SYSmark and MobileMark, are measured using specific computer systems, components, software, operations and functions. Any change to any of those factors may cause the results to vary. You should consult other information and performance tests to assist you in fully evaluating your contemplated purchases, including the performance of that product when combined with other products. For more information go to http://www.intel.com/performance*Other names and brands may be claimed as the property of others.
1000
1400
1800
2200
128 GB 256 GB 384GB 512 GB 768 GB
32GB LRDIMM ON
E5-2600 v3DDR4-
2133
32GB LRDIMM ON
E5-2600 v2DDR3-
1866
Емкость подсистемы памяти 40%До 40% увеличенияпропускнойспособностис 3-мя DIMM на канал
• Развитие технологий памяти с более высокимискоростями и плотностью, и пониженнымнапряжением
• Поддержка более высоких частот памяти прибóльших объёмах
9
Самый энергоэффективный процессор:Поядерные режимы P-States (PCPS) вносят общий вклад в сохранение энергии
Один процессорОдна производи-тельностьМеньшеепотребление
PCPS ВыклPCPS Вкл
Средняя частота/потребление на ядро
2 4 6 8 10 12Ядро
2 4 6 8 10 12Ядро
Comparison based on SPECpower*_ssj2008 results published as of August 26, 2014. Sugon I620-G20 platform with two Intel® Xeon® Processor E5-2699 v3, 10,599 overall ssj_ops/watt. Source. Software and workloads used in performance tests may have been optimized for performance only on Intel microprocessors. Performance tests, such as SYSmark and MobileMark, are measured using specific computer systems, components, software, operations and functions. Any change to any of those factors may cause the results to vary. You should consult other information and performance tests to assist you in fully evaluating your contemplated purchases, including the performance of that product when combined with other products. For more information go to http://www.intel.com/performance *Other names and brands may be claimed as the property of others.
24До 24% сниженияпотребления питанияпо сравнению спредыдущимпоколением
%
10
Поддержкавиртуальныхмашин и сред
Дополнительные инструкции для ускорения работы VMM (VT-x). Спецальные режимы работы подсистемхранения и графики (VT-d), оптимизация сетевого стека под VM (VT-c).
Платформа Tylersburg Romley (v1, v2) Grantley (v3, v?)
u-ARCNehalem Westmere
Sandy Bridge
Ivy Bridge Haswell Broadwell
VT-x
VT-d
VT-c
Extended Page Tables
VPID
Pause Loop Exiting
Interrupt Remapping
Queued Invalidations
Real Mode
VT-x Latency Reductions
Large VT-d pages
VMCS Shadowing
A/D Bits for EPT
VT-x Latency Reduction
Cache Monitoring Technology
SR-IOV
VMDq
ATS and SR-IOV support
DMA Remapping
APIC Virtualization
№1
№2
№3
№4
• Node Manager 3.0• Cache Monitoring
11
• Advanced Vector Extensions (AVX) 2.0• Поддержка памяти DDR4• Самый энергоэффективный процессор в мире• Virtual Machine Control Structure (VMCS) Shadowing
• Intel® SSD (твердотельные накопители)• Intel® AES-NI
Вычисления
Сеть
Хранение
• Контроллер 10/40 Gb Ethernet• Разгрузка сетевой виртуализации• Intel® Ethernet Flow Director • Виртуализация сетевых функций (NFV)
• Intel® QuickAssist® Technology
Основные особенности
Трансформация систем хранения и обработки данных: Строительные блоки Intel
12
Cache Acceleration Software
Enterprise Edition for Lustre
SSD на шине PCIe и SATA
Поддержка экосистемы
Ускорители СХД и SoC
Программное обеспечение
* Other brands and names may be claimed as the property of others.
Storage Acceleration Library (ISA-L)
Intel® Rapid Storage Technology enterprise
Новое слово в технологиях памяти
1947Ram
1956PROM
1961SRAM
1966DRAM
1971EPROM
1989NAND Flash
Memory1984NOR Flash
Memory
20153D XPoint™
Новые технологии Intel® для SSD
Технология 3D XPoint™ - память Intel® Optane™.
Строительный блок для СХДсверхвысокой производительности и
ёмкости
Строительный блок для замещениятрадиционных сегментов HDD
современными SSD>10TB в стандартном 2.5” SSD
M.2 накопители ёмкостью до 3.5TB
3D NAND
14
Что такое память Intel® Optane™?Сетчатая структура
Селекторовобеспечивает плотную
упаковку ииндивидуальныйдоступ к ячейкам
Масштабируемость
Возможно создание3D многослойныхструктур памяти
Прорыв в новыхтехнологиях
Совместимыематериалы ячеек и
управляющихструктур
Высокаяпроизводительность
Архитектура ячеек имассивов со скоростями
переключения в 1000 разбыстрее, чем NAND
Прорыв в технологии
1000Xбыстрее
чем NAND
1000Xнадёжнее
чем NAND
10Xплотнее
чем CONVENTIONAL MEMORY
* Results have been estimated or simulated using internal analysis or architecture simulation or modeling, and provided to you for informational purposes. Any differences in your system hardware, software or configuration may affect your actual performance
• Node Manager 3.0• Cache Monitoring
17
• Advanced Vector Extensions (AVX) 2.0• Поддержка памяти DDR4• Самый энергоэффективный процессор в мире• Virtual Machine Control Structure (VMCS) Shadowing
• Intel® SSD (твердотельные накопители)• Intel® AES-NI
Вычисления
Сеть
Хранение
• Контроллер 10/40 Gb Ethernet• Разгрузка сетевой виртуализации• Intel® Ethernet Flow Director • Виртуализация сетевых функций (NFV)
• Intel® QuickAssist® Technology
Основные особенности
Intel® Ethernet Flow Director
18
Source Intel Arch Lab Aug 2014 1: Test Configuration Memcached v1.4.20, 48 or 64 thr 12 Clients, Mcblaster Record Size = 64 Bytes (TCP) Number of keys = 1,000,000 Threads per client (-t) = 24 Connections per thread (-c) = 1 Nagles Disabled, SUT1 2M RPS – RSS and 5.6M RPS – Flow Director: 2x Xeon E5-2697 v2 (2.7GHz, 24c) 128GB, 8-ch, DDR3, 1600MHz Intel X520, ixgbe 3.21.2 RHEL 7.0 x64, optimized kernel v3.10, SUT2 7.6M RPS – Flow Director: 2x Xeon E5-2699 v3 (2.3GHz, 36c) 128GB, 8-ch, DDR4, 2133MHz Intel Ethernet CNA XL710, i40e 1.0.15 RHEL 7.0 x64, optimized kernel v3.10Performance tests and ratings are measured using specific computer systems and/or components and reflect the approximate performance of Intel products as measured by those tests. Any difference in system hardware or software design or configuration may affect actual performance. Buyers should consult other sources of information to evaluate the performance of systems or components they are considering purchasing. For more information on performance tests and on the performance of Intel products, visit http://www.intel.com/performance/resources/benchmark_limitations.htm.
Non Intel Ethernet Controller Hardware Queues Intel Ethernet Controller XL710 Hardware Queues
AppApp
Linux* OSLinux* OS
Intel® Data Direct I/O (Intel® DDIO)Intel® Data Direct I/O (Intel® DDIO)
App App App App
AppApp App App App
AppApp App App App App
AppApp App App App
Received Side Scaling ONLY Intel® Ethernet Flow Director
Нет привязки потоков к ядрам и приложениям Интеллектуальная привязка к ядрам
Трехкратный прирост memcachedRequest Per Second (RPS)1
~3x RPS
СнижениезадержекБлагодаря отсутствию
необходимостипереключения контекста
Новые контроллеры Intel® Ethernet
Семейство Intel® Xeon® Processor E5 v3: рецепт для победы
19
Intel® Xeon®, Intel® SSD, иерархия и
интеллектуальные функции
Семейство процессоровIntel® Xeon® E5 v3 и
Xeon® Phi
Вычисления СетьСХД
В сердце гибких и эффективных конвергентныхвычислительных платформ