Боресков АВ. ( ВМиК МГУ Харламов А. ( nvidia...
TRANSCRIPT
![Page 1: Боресков АВ. ( ВМиК МГУ Харламов А. ( NVIDIA )nvidia.esyr.org/files/presentations/0829_Architecture.pdfШейдеры (2002) • GPGPU и шейдерные](https://reader035.vdocuments.mx/reader035/viewer/2022081407/604efbf8b3280352a133f01b/html5/thumbnails/1.jpg)
Архитектура
и
программирование массивно-параллельных
вычислительных
систем
•
Лекторы:•
Боресков
А.В. ( ВМиК
МГУ )
•
Харламов А.А. ( NVIDIA )
Лекция
1
![Page 2: Боресков АВ. ( ВМиК МГУ Харламов А. ( NVIDIA )nvidia.esyr.org/files/presentations/0829_Architecture.pdfШейдеры (2002) • GPGPU и шейдерные](https://reader035.vdocuments.mx/reader035/viewer/2022081407/604efbf8b3280352a133f01b/html5/thumbnails/2.jpg)
Существующие
многоядерные
системы
Посмотрим
на
частоты
CPU:•
2004 г. -
Pentium 4, 3.46 GHz
•
2005 г. -
Pentium 4, 3.8 GHz•
2006 г. -
Core Duo T2700, 2.33 GHz
•
2007 г. -
Core 2 Duo E6700, 2.66 GHz•
2007 г.
-
Core 2 Duo E6800, 3 GHz
•
2008 г.
-
Core 2 Duo E8600, 3.33 GHz•
2009 г. -
Core i7 950, 3.06 GHz
![Page 3: Боресков АВ. ( ВМиК МГУ Харламов А. ( NVIDIA )nvidia.esyr.org/files/presentations/0829_Architecture.pdfШейдеры (2002) • GPGPU и шейдерные](https://reader035.vdocuments.mx/reader035/viewer/2022081407/604efbf8b3280352a133f01b/html5/thumbnails/3.jpg)
Легко
видно, что
роста
частоты
практически
нет
•
Энерговыделение
~ второй
степени
частоты•
Ограничения
техпроцесса
Существующие
многоядерные
системы
![Page 4: Боресков АВ. ( ВМиК МГУ Харламов А. ( NVIDIA )nvidia.esyr.org/files/presentations/0829_Architecture.pdfШейдеры (2002) • GPGPU и шейдерные](https://reader035.vdocuments.mx/reader035/viewer/2022081407/604efbf8b3280352a133f01b/html5/thumbnails/4.jpg)
•
Таким
образом, повышение
быстродействия следует
ждать
именно
от
параллельности
•
Уже
давно
CPU используют
параллельную обработку
для
повышения
производительности•
Конвейер
•
Multithreading•
SSE
Существующие
многоядерные
системы
![Page 5: Боресков АВ. ( ВМиК МГУ Харламов А. ( NVIDIA )nvidia.esyr.org/files/presentations/0829_Architecture.pdfШейдеры (2002) • GPGPU и шейдерные](https://reader035.vdocuments.mx/reader035/viewer/2022081407/604efbf8b3280352a133f01b/html5/thumbnails/5.jpg)
Классификация
SingleInstruction
MultipleInstruction
Single Data SISD MISD
Multiple Data SIMD MIMD
![Page 6: Боресков АВ. ( ВМиК МГУ Харламов А. ( NVIDIA )nvidia.esyr.org/files/presentations/0829_Architecture.pdfШейдеры (2002) • GPGPU и шейдерные](https://reader035.vdocuments.mx/reader035/viewer/2022081407/604efbf8b3280352a133f01b/html5/thumbnails/6.jpg)
SISD
![Page 7: Боресков АВ. ( ВМиК МГУ Харламов А. ( NVIDIA )nvidia.esyr.org/files/presentations/0829_Architecture.pdfШейдеры (2002) • GPGPU и шейдерные](https://reader035.vdocuments.mx/reader035/viewer/2022081407/604efbf8b3280352a133f01b/html5/thumbnails/7.jpg)
SIMD
![Page 8: Боресков АВ. ( ВМиК МГУ Харламов А. ( NVIDIA )nvidia.esyr.org/files/presentations/0829_Architecture.pdfШейдеры (2002) • GPGPU и шейдерные](https://reader035.vdocuments.mx/reader035/viewer/2022081407/604efbf8b3280352a133f01b/html5/thumbnails/8.jpg)
MISD
![Page 9: Боресков АВ. ( ВМиК МГУ Харламов А. ( NVIDIA )nvidia.esyr.org/files/presentations/0829_Architecture.pdfШейдеры (2002) • GPGPU и шейдерные](https://reader035.vdocuments.mx/reader035/viewer/2022081407/604efbf8b3280352a133f01b/html5/thumbnails/9.jpg)
MIMD
![Page 10: Боресков АВ. ( ВМиК МГУ Харламов А. ( NVIDIA )nvidia.esyr.org/files/presentations/0829_Architecture.pdfШейдеры (2002) • GPGPU и шейдерные](https://reader035.vdocuments.mx/reader035/viewer/2022081407/604efbf8b3280352a133f01b/html5/thumbnails/10.jpg)
Intel Core 2 Duo
•
32 Кб
L1 кэш
для каждого
ядра
•
2/4 Мб
общий
L2 кэш•
Единый
образ
памяти
для
каждого
ядра
- необходимость
синхронизации
кэшей
Memory Bus Controller
L2 cache
L1-I L1-D L1-I L1-D
P0 P1
Front Side Bus
![Page 11: Боресков АВ. ( ВМиК МГУ Харламов А. ( NVIDIA )nvidia.esyr.org/files/presentations/0829_Architecture.pdfШейдеры (2002) • GPGPU и шейдерные](https://reader035.vdocuments.mx/reader035/viewer/2022081407/604efbf8b3280352a133f01b/html5/thumbnails/11.jpg)
Intel Core 2 Quad
![Page 12: Боресков АВ. ( ВМиК МГУ Харламов А. ( NVIDIA )nvidia.esyr.org/files/presentations/0829_Architecture.pdfШейдеры (2002) • GPGPU и шейдерные](https://reader035.vdocuments.mx/reader035/viewer/2022081407/604efbf8b3280352a133f01b/html5/thumbnails/12.jpg)
Intel Core i7
![Page 13: Боресков АВ. ( ВМиК МГУ Харламов А. ( NVIDIA )nvidia.esyr.org/files/presentations/0829_Architecture.pdfШейдеры (2002) • GPGPU и шейдерные](https://reader035.vdocuments.mx/reader035/viewer/2022081407/604efbf8b3280352a133f01b/html5/thumbnails/13.jpg)
Symmetric Multiprocessor Architecture (SMP)
Cache Control
L2 cache
L1-I L1-D
P0
Bus
Cache Control
L2 cache
L1-I L1-D
P1
Cache Control
L2 cache
L1-I L1-D
P2
![Page 14: Боресков АВ. ( ВМиК МГУ Харламов А. ( NVIDIA )nvidia.esyr.org/files/presentations/0829_Architecture.pdfШейдеры (2002) • GPGPU и шейдерные](https://reader035.vdocuments.mx/reader035/viewer/2022081407/604efbf8b3280352a133f01b/html5/thumbnails/14.jpg)
•
Каждый
процессор•
Имеет
свои
L1 и
L2 кэши
•
Подсоединен
к
общей
шине•
Отслеживает
доступ
других
процессоров
к памяти для
обеспечения
единого
образа памяти
(например, один
процессор
хочет
изменить
данные, кэшированные
другим процессором)
Symmetric Multiprocessor Architecture (SMP)
![Page 15: Боресков АВ. ( ВМиК МГУ Харламов А. ( NVIDIA )nvidia.esyr.org/files/presentations/0829_Architecture.pdfШейдеры (2002) • GPGPU и шейдерные](https://reader035.vdocuments.mx/reader035/viewer/2022081407/604efbf8b3280352a133f01b/html5/thumbnails/15.jpg)
Cell
SPE0
PowerPC
SPE4
ElementInterconnect
Bus(EIB)
SPE1
SPE2
SPE3
SPE5
SPE6
SPE7
I/Ocontroller
I/Ocontroller
Memorycontroller
Memorycontroller
RAM
RAM
![Page 16: Боресков АВ. ( ВМиК МГУ Харламов А. ( NVIDIA )nvidia.esyr.org/files/presentations/0829_Architecture.pdfШейдеры (2002) • GPGPU и шейдерные](https://reader035.vdocuments.mx/reader035/viewer/2022081407/604efbf8b3280352a133f01b/html5/thumbnails/16.jpg)
•
Dual-threaded 64-bit PowerPC•
8 Synergistic Processing Elements (SPE)
•
256 Kb on-chip
на
каждый
SPE
Cell
![Page 17: Боресков АВ. ( ВМиК МГУ Харламов А. ( NVIDIA )nvidia.esyr.org/files/presentations/0829_Architecture.pdfШейдеры (2002) • GPGPU и шейдерные](https://reader035.vdocuments.mx/reader035/viewer/2022081407/604efbf8b3280352a133f01b/html5/thumbnails/17.jpg)
BlueGene/L
PowerPC
DoubleHummer
FPU
L1-I L1-D
L2 prefetchbuffer
PowerPC
DoubleHummer
FPU
L1-I L1-D
L2 prefetchbuffer
snoop
Shared L3 cache/memory
Torusinterconnect
Collectiveinterconnect
Global barrierinterrupt
![Page 18: Боресков АВ. ( ВМиК МГУ Харламов А. ( NVIDIA )nvidia.esyr.org/files/presentations/0829_Architecture.pdfШейдеры (2002) • GPGPU и шейдерные](https://reader035.vdocuments.mx/reader035/viewer/2022081407/604efbf8b3280352a133f01b/html5/thumbnails/18.jpg)
•
65536 dual-core nodes•
node•
770 Mhz
PowerPC
•
Double
Hammer
FPU (4 Flop/cycle)•
4 Mb
on-chip L3 кэш
•
512 Mb
off-chip
RAM•
6 двухсторонних
портов
для
3D-тора
•
3 двухсторонних
порта
для
collective network•
4 двухсторонних
порта
для
barrier/interrupt
BlueGene/L
![Page 19: Боресков АВ. ( ВМиК МГУ Харламов А. ( NVIDIA )nvidia.esyr.org/files/presentations/0829_Architecture.pdfШейдеры (2002) • GPGPU и шейдерные](https://reader035.vdocuments.mx/reader035/viewer/2022081407/604efbf8b3280352a133f01b/html5/thumbnails/19.jpg)
2D
и 3D тор
![Page 20: Боресков АВ. ( ВМиК МГУ Харламов А. ( NVIDIA )nvidia.esyr.org/files/presentations/0829_Architecture.pdfШейдеры (2002) • GPGPU и шейдерные](https://reader035.vdocuments.mx/reader035/viewer/2022081407/604efbf8b3280352a133f01b/html5/thumbnails/20.jpg)
Кластеры
•
+ Произвольная
топология•
+ Полноценные
узлы
(HW/SW)
•
-
Энергопотребление•
-
Плотность
вычислительной
мощности
![Page 21: Боресков АВ. ( ВМиК МГУ Харламов А. ( NVIDIA )nvidia.esyr.org/files/presentations/0829_Architecture.pdfШейдеры (2002) • GPGPU и шейдерные](https://reader035.vdocuments.mx/reader035/viewer/2022081407/604efbf8b3280352a133f01b/html5/thumbnails/21.jpg)
GPU: другой
подход
•
Ранние
3D-ускорители
(1996-2002)•
Шейдеры
(2002)
•
GPGPU и
шейдерные
языки
(2004)•
CUDA (2006)
•
NVIDIA Fermi
(2010)•
NVIDIA Kepler
(2011-2012)
•
NVIDIA Maxwell
(2013)
![Page 22: Боресков АВ. ( ВМиК МГУ Харламов А. ( NVIDIA )nvidia.esyr.org/files/presentations/0829_Architecture.pdfШейдеры (2002) • GPGPU и шейдерные](https://reader035.vdocuments.mx/reader035/viewer/2022081407/604efbf8b3280352a133f01b/html5/thumbnails/22.jpg)
Эволюция
GPU
•
Voodoo
-
растеризация
треугольников, наложение
текстуры
и
буфер
глубины
•
Очень
легко
распараллеливается•
На
своих
задачах
легко
обходил
CPU
![Page 23: Боресков АВ. ( ВМиК МГУ Харламов А. ( NVIDIA )nvidia.esyr.org/files/presentations/0829_Architecture.pdfШейдеры (2002) • GPGPU и шейдерные](https://reader035.vdocuments.mx/reader035/viewer/2022081407/604efbf8b3280352a133f01b/html5/thumbnails/23.jpg)
•
Быстрый
рост
производительности•
Добавление
новых
возможностей
•
Мультитекстурирование
(RivaTNT2)•
T&C&L
•
Вершинные
программы
(шейдеры)•
Фрагментные
программы
(GeForceFX)
•
Текстуры
с
floating point-значениями
Эволюция
GPU
![Page 24: Боресков АВ. ( ВМиК МГУ Харламов А. ( NVIDIA )nvidia.esyr.org/files/presentations/0829_Architecture.pdfШейдеры (2002) • GPGPU и шейдерные](https://reader035.vdocuments.mx/reader035/viewer/2022081407/604efbf8b3280352a133f01b/html5/thumbnails/24.jpg)
Работают
с
4D
float-векторамиСпециальный
ассемблер
Компилируется
драйвером
устройстваОтсутствие
переходов
и
ветвления
Вводились
как
vendor-расширения
Эволюция
GPU: шейдеры
![Page 25: Боресков АВ. ( ВМиК МГУ Харламов А. ( NVIDIA )nvidia.esyr.org/files/presentations/0829_Architecture.pdfШейдеры (2002) • GPGPU и шейдерные](https://reader035.vdocuments.mx/reader035/viewer/2022081407/604efbf8b3280352a133f01b/html5/thumbnails/25.jpg)
Эволюция
GPU: шейдеры
•
Появление
шейдерных
языков
высокого уровня
(Cg, GLSL, HLSL)
•
Поддержка
ветвлений
и
циклов
(GeForce 6xxx)
•
Появление
GPU, превосходящие
CPU в
10 и более
раз
по
Flop’ам
![Page 26: Боресков АВ. ( ВМиК МГУ Харламов А. ( NVIDIA )nvidia.esyr.org/files/presentations/0829_Architecture.pdfШейдеры (2002) • GPGPU и шейдерные](https://reader035.vdocuments.mx/reader035/viewer/2022081407/604efbf8b3280352a133f01b/html5/thumbnails/26.jpg)
Отличия
CPU от
GPU
•
Очень
высокая
степень
параллелизма•
Основная
часть
чипа
занята
логикой, а не
кэшем•
Ограничения
по
функциональности
![Page 27: Боресков АВ. ( ВМиК МГУ Харламов А. ( NVIDIA )nvidia.esyr.org/files/presentations/0829_Architecture.pdfШейдеры (2002) • GPGPU и шейдерные](https://reader035.vdocuments.mx/reader035/viewer/2022081407/604efbf8b3280352a133f01b/html5/thumbnails/27.jpg)
GPGPU
•
Использование
GPU для
решения
не графических
задач
•
Вся
работа
с
GPU идет
через
графический API (OpenGL, D3D)
•
Программы
используют
сразу
два
языка
– один
традиционный
(С++) и один
шейдерный•
Ограничения, присущие
графическим
API
![Page 28: Боресков АВ. ( ВМиК МГУ Харламов А. ( NVIDIA )nvidia.esyr.org/files/presentations/0829_Architecture.pdfШейдеры (2002) • GPGPU и шейдерные](https://reader035.vdocuments.mx/reader035/viewer/2022081407/604efbf8b3280352a133f01b/html5/thumbnails/28.jpg)
Вклад
NVIDIA
•
GeForce•
Quadro
•
Tesla•
Fermi
![Page 29: Боресков АВ. ( ВМиК МГУ Харламов А. ( NVIDIA )nvidia.esyr.org/files/presentations/0829_Architecture.pdfШейдеры (2002) • GPGPU и шейдерные](https://reader035.vdocuments.mx/reader035/viewer/2022081407/604efbf8b3280352a133f01b/html5/thumbnails/29.jpg)
Архитектура
Tesla 10
TPC TPC TPCTPCTPCTPCTPCTPCTPC TPC
Interconnection Network
ROP L2 ROP L2 ROP L2 ROP L2 ROP L2 ROP L2 ROP L2 ROP L2
DRAM DRAM DRAM DRAM DRAM DRAM DRAM DRAM
CPU Bridge Host Memory
Work Distribution
![Page 30: Боресков АВ. ( ВМиК МГУ Харламов А. ( NVIDIA )nvidia.esyr.org/files/presentations/0829_Architecture.pdfШейдеры (2002) • GPGPU и шейдерные](https://reader035.vdocuments.mx/reader035/viewer/2022081407/604efbf8b3280352a133f01b/html5/thumbnails/30.jpg)
Архитектура
Tesla 8
TEX
SM
SM
Texture Processing Cluster
Streaming Multiprocessor
Instruction $ Constant $
Instruction Fetch
Shared Memory
SFU
SPSPSPSP
SFU
SPSPSPSP
Register File
![Page 31: Боресков АВ. ( ВМиК МГУ Харламов А. ( NVIDIA )nvidia.esyr.org/files/presentations/0829_Architecture.pdfШейдеры (2002) • GPGPU и шейдерные](https://reader035.vdocuments.mx/reader035/viewer/2022081407/604efbf8b3280352a133f01b/html5/thumbnails/31.jpg)
TEX
SM
SM
Texture Processing Cluster
SM
Архитектура
Tesla 10
Streaming Multiprocessor
Instruction $ Constant $
Instruction Fetch
Shared Memory
SFU
SPSPSPSP
SFU
SPSPSPSP
Double Precision
Register File
![Page 32: Боресков АВ. ( ВМиК МГУ Харламов А. ( NVIDIA )nvidia.esyr.org/files/presentations/0829_Architecture.pdfШейдеры (2002) • GPGPU и шейдерные](https://reader035.vdocuments.mx/reader035/viewer/2022081407/604efbf8b3280352a133f01b/html5/thumbnails/32.jpg)
Архитектура
FermiInstruction Cache Uniform Cache
Warp Scheduler
64 Kb Shared Memory/ L1 Cache
SFUCore
Interconnection network
Register File (32768 32-bit words )
Dispatch Unit
Warp Scheduler
Dispatch Unit
Core
Core Core
Core Core
Core Core
Core Core
Core Core
Core Core
Core Core
Core Core
Core Core
Core Core
Core Core
Core Core
Core Core
Core Core
Core Core
SFU
SFU
SFU
Uniform Cache
LD/ST LD/ST
LD/ST LD/ST
LD/ST LD/ST
LD/ST LD/ST
LD/ST LD/ST
LD/ST LD/ST
LD/ST LD/ST
LD/ST LD/ST
![Page 33: Боресков АВ. ( ВМиК МГУ Харламов А. ( NVIDIA )nvidia.esyr.org/files/presentations/0829_Architecture.pdfШейдеры (2002) • GPGPU и шейдерные](https://reader035.vdocuments.mx/reader035/viewer/2022081407/604efbf8b3280352a133f01b/html5/thumbnails/33.jpg)
Архитектура
Fermi
•
Unified L2 cache (768 Kb)•
Up to 1 Tb of memory (64 bit addressing)
•
Unified address space•
ECC protection (DRAM, registers, shared, cache)
•
Simultaneous CPU->GPU, GPU->CPU, kernel execution
•
10x faster context switching, concurrent kernel execution (up to 16 kernels)
![Page 34: Боресков АВ. ( ВМиК МГУ Харламов А. ( NVIDIA )nvidia.esyr.org/files/presentations/0829_Architecture.pdfШейдеры (2002) • GPGPU и шейдерные](https://reader035.vdocuments.mx/reader035/viewer/2022081407/604efbf8b3280352a133f01b/html5/thumbnails/34.jpg)
Архитектура
Fermi
•
32 cores per SM•
Dual Thread schedule –
simultaneous execution
of 2 warps•
48 Kb shared + 16 Kb cache
или 16 Kb shared +
48 Kb cache•
Cheap atomics
![Page 35: Боресков АВ. ( ВМиК МГУ Харламов А. ( NVIDIA )nvidia.esyr.org/files/presentations/0829_Architecture.pdfШейдеры (2002) • GPGPU и шейдерные](https://reader035.vdocuments.mx/reader035/viewer/2022081407/604efbf8b3280352a133f01b/html5/thumbnails/35.jpg)
Архитектура
•
Маштабируемость:•
[+][-] SM внутри
TPC
•
[+][-] TPC•
[+][-] DRAM партиции
•
Схожие
архитектуры:•
Tesla 8: 8800 GTX
•
Tesla 10: GTX 280•
Tesla 20: GTX 460
![Page 36: Боресков АВ. ( ВМиК МГУ Харламов А. ( NVIDIA )nvidia.esyr.org/files/presentations/0829_Architecture.pdfШейдеры (2002) • GPGPU и шейдерные](https://reader035.vdocuments.mx/reader035/viewer/2022081407/604efbf8b3280352a133f01b/html5/thumbnails/36.jpg)
Технические
детали
•
RTM CUDA Programming Guide•
Run CUDAHelloWorld•
Печатает
аппаратно
зависимые
параметры
•
Размер
shared памяти•
Кол-во
SM
•
Размер
warp’а•
Кол-во
регистров
на
SM
•
т.д.
![Page 37: Боресков АВ. ( ВМиК МГУ Харламов А. ( NVIDIA )nvidia.esyr.org/files/presentations/0829_Architecture.pdfШейдеры (2002) • GPGPU и шейдерные](https://reader035.vdocuments.mx/reader035/viewer/2022081407/604efbf8b3280352a133f01b/html5/thumbnails/37.jpg)
CPU
•
Параллельное
программирование
CPU требует специальных
API
•
MPI, OpenMP
•
Программирование
ресурсов
CPU
ограничено•
Multithreading
•
SSE•
Ограничивает
пропускная
способность
памяти
![Page 38: Боресков АВ. ( ВМиК МГУ Харламов А. ( NVIDIA )nvidia.esyr.org/files/presentations/0829_Architecture.pdfШейдеры (2002) • GPGPU и шейдерные](https://reader035.vdocuments.mx/reader035/viewer/2022081407/604efbf8b3280352a133f01b/html5/thumbnails/38.jpg)
•
Так
как
каждый
элемент
может
быть
обработан независимо
от
других, то
их
можно
обрабатывать
параллельно•
Можно
соединять
между
собой
отдельные
ядра
для
получения
более
сложной
схемы
обработки
SIMD
![Page 39: Боресков АВ. ( ВМиК МГУ Харламов А. ( NVIDIA )nvidia.esyr.org/files/presentations/0829_Architecture.pdfШейдеры (2002) • GPGPU и шейдерные](https://reader035.vdocuments.mx/reader035/viewer/2022081407/604efbf8b3280352a133f01b/html5/thumbnails/39.jpg)
SIMT (Single
Instruction, Multiple
Threads)
•
Параллельно
на
каждом
SM
выполняется большое
число
отдельных
нитей
(threads)
•
Нити
подряд
разбиваются
на
warp’ы
(по
32 нити) и
SM
управляет
выполнением
warp’ов
•
Нити
в
пределах
одного
warp’а выполняются
физически
параллельно
•
Большое
число
warp’ов
покрывает латентность
![Page 40: Боресков АВ. ( ВМиК МГУ Харламов А. ( NVIDIA )nvidia.esyr.org/files/presentations/0829_Architecture.pdfШейдеры (2002) • GPGPU и шейдерные](https://reader035.vdocuments.mx/reader035/viewer/2022081407/604efbf8b3280352a133f01b/html5/thumbnails/40.jpg)
NVIDIA Tesla
•
PCI-Express
или
rackmount•
448/512
CUDA-ядер
•
3/6 GB RAM•
500 GFLOPS double
precision
•
1 TFLOP single
precision•
ECC memory
error
protection
![Page 41: Боресков АВ. ( ВМиК МГУ Харламов А. ( NVIDIA )nvidia.esyr.org/files/presentations/0829_Architecture.pdfШейдеры (2002) • GPGPU и шейдерные](https://reader035.vdocuments.mx/reader035/viewer/2022081407/604efbf8b3280352a133f01b/html5/thumbnails/41.jpg)
NVIDIA Tesla
![Page 42: Боресков АВ. ( ВМиК МГУ Харламов А. ( NVIDIA )nvidia.esyr.org/files/presentations/0829_Architecture.pdfШейдеры (2002) • GPGPU и шейдерные](https://reader035.vdocuments.mx/reader035/viewer/2022081407/604efbf8b3280352a133f01b/html5/thumbnails/42.jpg)
Перспективы
•
NVIDIA Kepler•
2011-2012 г.
•
Техпроцесс
28 нм•
FLOPS/Ватт: 3x Fermi
•
NVIDIA Maxwell•
2013 г.
•
Техпроцесс
22 нм
![Page 43: Боресков АВ. ( ВМиК МГУ Харламов А. ( NVIDIA )nvidia.esyr.org/files/presentations/0829_Architecture.pdfШейдеры (2002) • GPGPU и шейдерные](https://reader035.vdocuments.mx/reader035/viewer/2022081407/604efbf8b3280352a133f01b/html5/thumbnails/43.jpg)
Перспективы