NVIDIA Ampere A100 250W TDP GPU op PCIe 4.0 gemaakt voor AI, datawetenschap en supercomputing gelanceerd met beloofde 90 procent prestaties van 400W-model
NVIDIA heeft officieel de A100 gelanceerd, een PCIe 4.0-compatibele GPU op basis van de volgende generatie Ampere-architectuur. Hoewel het een lager TDP-profiel van 250 W heeft, belooft NVIDIA dat de PCIe 4.0 Ampere A100 GPU tot 90 procent van de prestaties van de volledige 400 W A100 HGX GPU zal kunnen bieden. De derde variant van de groeiende Ampere A100 GPU-familie, de A100 PCIe, is bedoeld voor servers met Artificial Intelligence (AI), Data Science en Supercomputing-clusters.
NVIDIA onthulde een PCI-Express 4.0-variant van de A100 GPU. De GPU is gebaseerd op de 7nm Ampere-microarchitectuur. Daarnaast kondigde het bedrijf ook verschillende A100-aangedreven systemen aan van toonaangevende serverfabrikanten, waaronder Asus, Dell, Cisco, Lenovo en meer. De 250W A100 PCIe 4.0 GPU-accelerator lijkt veel op de volledige 400W TDP-variant, en NVIDIA belooft ook vrijwel identieke prestaties ondanks de aanzienlijke daling van het TDP-profiel.
NVIDIA A100 Ampere GPU in PCIe 4.0-vormfactor met dezelfde 400W A100 HGX GPU-configuratie maar met 250W:
NVIDIA heeft zijn PCIe 4.0 A100 PCIe GPU-accelerator aangekondigd. De Ampere GPU is beschikbaar voor uiteenlopende industriële toepassingen met systemen variërend van een enkele A100 PCIe GPU tot servers die twee kaarten tegelijk gebruiken via de 12 NVLINK-kanalen die in totaal 600 GB / s aan verbindingsbandbreedte leveren. De 250 W TDP A100 PCIe GPU-versneller verandert niet veel in termen van kernconfiguratie in vergelijking met de 400 W A100 HGX GPU.
https://twitter.com/storagereview/status/1275132949709688833
De GA100 GPU heeft de specificaties van de 400W A100 HGX-variant met 6912 CUDA-cores gerangschikt in 108 SM-units, 432 Tensor Cores en 40 GB HBM2-geheugen die dezelfde geheugenbandbreedte levert van 1,55 TB / s (afgerond op 1,6 TB / s). en). Als u het GPU-pakket echter implementeert op het PCIe 4.0-standaard had zijn eigen nadeel van het aanzienlijk verminderen van TDP. Dit betekent naar verluidt een prestatiestraf van 10 tot 50 procent op basis van de werkdruk. Bovendien is de 250W TDP-variant van de A100 GPU meer geschikt voor korte bursts dan voor langdurige belastingen.
NVIDIA A100 Ampere GPU in PCIe 4.0 vormfactorprestaties:
Vanwege de aanzienlijke vermindering van het TDP-profiel zou kunnen worden aangenomen dat de kaart lagere kloksnelheden zou hebben om de minder TDP-invoer te compenseren. De prestatiestatistieken die NVIDIA heeft vrijgegeven, zijn echter echt verrassend, aangezien ze vrij dicht in de buurt komen van de 400W TDP-variant. De FP64-prestaties worden nog steeds beoordeeld op 9,7 / 19,5 TFLOP's, FP32-prestaties worden beoordeeld op 19,5 / 156/312 TFLOP's (Sparsity), FP16-prestaties worden beoordeeld op 312/624 TFLOP's (Sparsity) en INT8 wordt beoordeeld op 624/1248 TOP's ( Schaarsheid).
Eenvoudige wiskunde geeft aan, en NVIDIA verzekert dat de Ampere-gebaseerde PCIe 4.0 250W A100 GPU 90 procent van de prestaties van de A100 HGX-kaart (400W) kan leveren in de beste servertoepassingen. Dit is gerechtvaardigd omdat het voor de nieuwe variant minder tijd kost om bovengenoemde taken te voltooien. De nummers mogen echter alleen geldig zijn voor korte intervallen. In complexe situaties waarin aanhoudende GPU-mogelijkheden vereist zijn, kan de 250 W PCIe 4.0 GPU overal van 90 tot 50 procent de prestaties leveren van de 400 W A100 HGX GPU.
De Ampere-microarchitectuur zal de nieuwe A100 zeker ten goede komen. NVIDIA belooft een prestatieverbetering van ten minste 20x ten opzichte van de op Volta gebaseerde voorganger. De PCIe 4.0 A100 GPU is voorzien van multi-instance GPU-technologie. Dit betekent dat een enkele A100 kan worden gepartitioneerd in maar liefst zeven afzonderlijke GPU's om verschillende computertaken uit te voeren. Hoewel dit de segmentatie bevordert, is er de 3e generatie NVLink, waarmee verschillende GPU's kunnen worden samengevoegd tot één gigantische GPU.