AMD MI1000 Instinct Accelerator 7nm GPU voor HPC officieel gelanceerd met 11,5 teraflops piekprestaties met dubbele precisie drijvende-komma

AMD's allereerste GPU op basis van de CDNA-architectuur, de MI100 is officieel. De MI100 Instinct Accelerator GPU wordt geclaimd als "de snelste HPC GPU ter wereld" met 11,5 teraflops aan piekprestaties met dubbele precisie drijvende-komma. De GPU beweert twee keer zoveel rekeneenheden te hebben als de vorige generatie, terwijl hij binnen dezelfde vermogenslimiet van 300 watt blijft.

AMD heeft vandaag de nieuwe aangekondigd MI100 Instinct-versneller. De GPU is gebaseerd op de CDNA-engine die enigszins verschilt van de RDNA-architectuur die de nieuwste AMD Radeon RX 6000-serie grafische kaarten aandrijft. De MI100 Instinct Accelerator is de opvolger van de MI50 en MI60 Instinct accelerators die twee jaar geleden werden gelanceerd. Ondanks de relatief korte periode tussen generaties, zorgen de nieuwe GPU-architectuur en Compute Engine ervoor dat de AMD GPU de verwachtingen overtreft.

AMD MI1000 Instinct Accelerator 7nm GPU voor HPC Industry Specificaties en functies:

De MI100 GPU is de eerste die AMD's Compute DNA (CDNA)-architectuur bevat. De GPU heeft 210 rekeneenheden die in vier arrays zijn gerangschikt. De CDNA-architectuur is een belangrijke evolutionaire sprong voorwaarts in vergelijking met de GCN-architectuur en bevat nieuwe matrixkernengines die de computationele doorvoer voor verschillende numerieke formaten verhogen.

AMD beweert dat de nieuwe AMD-matrixkerntechnologie de MI100 7x hogere halfprecisie drijvende-komma-prestaties biedt in vergelijking met de MI50. Het bedrijf beweert dat de MI100 Instinct Accelerator 46,1 teraflops piek enkele precisie matrix (FP32), 23,1 teraflops piek enkele precisie (FP32), 184,6 teraflops piek halfprecisie (FP16) floating-point prestatie en 92,3 piek teraflops van bfloat16 prestatie biedt .

De MI100 krijgt ook AMD's Infinity Fabric-technologie waarvan wordt beweerd dat het ongeveer 2x de peer-to-peer piek I / O-bandbreedte biedt ten opzichte van PCIe 4.0 met tot 340 GB / s totale bandbreedte per kaart. In real-life implementaties kunnen de MI100 GPU's worden geconfigureerd met maximaal twee geïntegreerde quad GPU-hives, die elk tot 552 Gbps peer-to-peer I/O-bandbreedte bieden.

Evenzo bieden vier stapels van 8 GB HBM2-geheugen een totaal van 32 GB HBM2-geheugen op elke MI100 GPU. Met een kloksnelheid van 1,2 GHz biedt het geheugen 1,23 Tbps geheugenbandbreedte. De ondersteuning van de MI100 voor PCIe Gen 4.0-technologie maakt 64 Gbps theoretische piektransportgegevensbandbreedte tussen CPU en GPU mogelijk.

Is AMD MI100 Accelerator GPU beter dan NVIDIA A100 GPU?

Strikt op papier lijkt de MI100 GPU van de AMD beter dan de NVIDIA A100 GPU, die een theoretische piekprestatie van 9,7 teraflops heeft. In werkelijkheid biedt de NIVIDIA A100 echter krachtigere FP64 Linpack-runs.

De CDNA- en RDNA-architectuur van AMD zijn in wezen hetzelfde, met als belangrijkste verschil de scenario's voor de eindgebruiker. Er zijn echter een paar fundamentele verschillen waardoor de CDNA-architectuur niet kan worden gebruikt voor gaming of het weergeven van visuele inhoud.

Overigens bereidt AMD ROCm voor, de open-source toolset van het bedrijf, bestaande uit compilers, programmeer-API's en bibliotheken. Deze toolset zal dienen als basis voor exascale computing-workloads. De nieuwste ROCm 4.0 heeft de compiler geüpgraded naar open source en verenigd om zowel OpenMP 5.0 als HIP te ondersteunen. Simpel gezegd, de concurrentie tussen AMD en NVIDIA in het HPC-segment gaat verder dan eenvoudige mogelijkheden en brute verwerkingskracht.