NEC SX-Aurora TSUBASA
NEC SX-Aurora TSUBASA — векторный процессор семейства NEC SX[1][2]. В отличие от предыдущих суперкомпьютеров этого семейства, SX-Aurora TSUBASA поставляется в виде карты PCIe, называемой NEC «Vector Engine» (VE). Восемь карт Vector Engine можно вставить в векторный хост (VH), который обычно представляет собой сервер x86-64 под управлением операционной системы Linux.
О продукте было объявлено в пресс-релизе 25 октября 2017 года, а начало продаж состоялось в феврале 2018 года.
Модель NEC SX-Aurora TSUBASA пришла на смену SX-ACE.
Оборудование
SX-Aurora TSUBASA является преемником серий NEC SX и SUPER-UX, векторных компьютерных систем, на которых основан суперкомпьютер Earth Simulator.
Его аппаратное обеспечение состоит из хостов Linux x86 с векторными движками (VE), подключенными через соединение PCI Express (PCIe).
Высокая пропускная способность памяти (0,75–1,2 ТБ/с) обеспечивается за счет восьми ядер и шести модулей памяти HBM2, объединённых на кремниевом интерпозере, оформленном в форм-факторе карты PCIe полной длины, полной высоты и двойной ширины. Функциональность операционной системы для VE переносится на VH и обрабатывается в основном демонами пользовательского пространства, на которых работает VEOS.
В зависимости от тактовой частоты (1,4 или 1,6 ГГц) каждый процессор VE имеет восемь ядер и пиковую производительность 2,15 или 2,45 терафлопс при вычислениях с двойной точностью. Процессор впервые в мире оснащен шестью модулями HBM2 на кремниевом интерпозере с общим объемом памяти 24 или 48 ГБ с высокой пропускной способностью.
На сервере, поставляемом NEC может размещаться до восьми VE, кластеры VH могут масштабироваться до произвольного количества узлов.
По состоянию на 2023 год были разработаны и выпущены на рынок следующие версии TSUBASA:
Version 1 Vector Engine
Версия 1.0 Vector Engine была произведена по 16-нм техпроцессу FinFET (от TSMC) и выпущена в трех основных версиях продукта (в доработанных версиях добавляется буква E в конце):
SKU | 10A | 10B | 10C | 10AE | 10BE | 10CE |
---|---|---|---|---|---|---|
Частота процессора Ггц | 1.6 | 1.4 | 1.4 | 1.584 | 1.408 | 1.400 |
Число векторных ядер в процессоре | 8 | 8 | 8 | 8 | 8 | 8 |
Пиковая производительность ядра
(double precision GFLOPS) |
307.2 | 268.8 | 268.8 | 304 | 270 | 268 |
Пиковая производительность ядра
(single precision GFLOPS) |
537 | 608 | 540 | 537 | ||
Пиковая производительность процессора
(double precision TFLOPS) |
2.45 | 2.15 | 2.15 | 2.43 | 2.16 | 2.15 |
Пиковая производительность процессора
(single precision TFLOPS) |
4.9 | 4.3 | 4.3 | 4.86 | 4.32 | 4.30 |
Пропускная способность памяти (ТБ/с) | 1.2 | 1.2 | 0.75 | 1.35 | 1.35 | 1.00 |
Ёмкость памяти (Гб) | 48 | 48 | 24 | 48 | 48 | 24 |
Version 2 Vector Engine
Была выпущена в двух вариантах
SKU | 20A | 20B |
---|---|---|
Частота процессора Ггц | 1.6 | 1.6 |
Число векторных ядер в процессоре | 10 | 8 |
Пиковая производительность ядра
(double precision GFLOPS) |
307 | 307 |
Пиковая производительность ядра
(single precision GFLOPS) |
614 | 614 |
Пиковая производительность процессора
(double precision TFLOPS) |
3.07 | 2.45 |
Пиковая производительность процессора
(single precision TFLOPS) |
6.14 | 4.91 |
Пропускная способность памяти (ТБ/с) | 1.53 | 1.53 |
Ёмкость памяти (Гб) | 48 | 48 |
Version 3 Vector Engine