NEC SX-Aurora TSUBASA — векторный процессор семейства NEC SX[1][2]. В отличие от предыдущих суперкомпьютеров этого семейства, SX-Aurora TSUBASA поставляется в виде карты PCIe, называемой NEC «Vector Engine» (VE). Восемь карт Vector Engine можно вставить в векторный хост (VH), который обычно представляет собой сервер x86-64 под управлением операционной системы Linux.

О продукте было объявлено в пресс-релизе 25 октября 2017 года, а начало продаж состоялось в феврале 2018 года.

Модель NEC SX-Aurora TSUBASA пришла на смену SX-ACE.

Оборудование

SX-Aurora TSUBASA является преемником серий NEC SX и SUPER-UX, векторных компьютерных систем, на которых основан суперкомпьютер Earth Simulator.

Его аппаратное обеспечение состоит из хостов Linux x86 с векторными движками (VE), подключенными через соединение PCI Express (PCIe).

Высокая пропускная способность памяти (0,75–1,2 ТБ/с) обеспечивается за счет восьми ядер и шести модулей памяти HBM2, объединённых на кремниевом интерпозере, оформленном в форм-факторе карты PCIe полной длины, полной высоты и двойной ширины. Функциональность операционной системы для VE переносится на VH и обрабатывается в основном демонами пользовательского пространства, на которых работает VEOS.

В зависимости от тактовой частоты (1,4 или 1,6 ГГц) каждый процессор VE имеет восемь ядер и пиковую производительность 2,15 или 2,45 терафлопс при вычислениях с двойной точностью. Процессор впервые в мире оснащен шестью модулями HBM2 на кремниевом интерпозере с общим объемом памяти 24 или 48 ГБ с высокой пропускной способностью.

На сервере, поставляемом NEC может размещаться до восьми VE, кластеры VH могут масштабироваться до произвольного количества узлов.

По состоянию на 2023 год были разработаны и выпущены на рынок следующие версии TSUBASA:

Version 1 Vector Engine

Версия 1.0 Vector Engine была произведена по 16-нм техпроцессу FinFET (от TSMC) и выпущена в трех основных версиях продукта (в доработанных версиях добавляется буква E в конце):

SKU 10A 10B 10C 10AE 10BE 10CE
Частота процессора Ггц 1.6 1.4 1.4 1.584 1.408 1.400
Число векторных ядер в процессоре 8 8 8 8 8 8
Пиковая производительность ядра

(double precision GFLOPS)

307.2 268.8 268.8 304 270 268
Пиковая производительность ядра

(single precision GFLOPS)

537 608 540 537
Пиковая производительность процессора

(double precision TFLOPS)

2.45 2.15 2.15 2.43 2.16 2.15
Пиковая производительность процессора

(single precision TFLOPS)

4.9 4.3 4.3 4.86 4.32 4.30
Пропускная способность памяти (ТБ/с) 1.2 1.2 0.75 1.35 1.35 1.00
Ёмкость памяти (Гб) 48 48 24 48 48 24

Version 2 Vector Engine

Была выпущена в двух вариантах

SKU 20A 20B
Частота процессора Ггц 1.6 1.6
Число векторных ядер в процессоре 10 8
Пиковая производительность ядра

(double precision GFLOPS)

307 307
Пиковая производительность ядра

(single precision GFLOPS)

614 614
Пиковая производительность процессора

(double precision TFLOPS)

3.07 2.45
Пиковая производительность процессора

(single precision TFLOPS)

6.14 4.91
Пропускная способность памяти (ТБ/с) 1.53 1.53
Ёмкость памяти (Гб) 48 48

Version 3 Vector Engine

Примечания

  1. Ошибка цитирования Неверный тег <ref>; для сносок nec-product-page не указан текст
  2. Ошибка цитирования Неверный тег <ref>; для сносок 2017-next-platform не указан текст