Intel Nervana neuraal netwerk AI-processor geannuleerd ten gunste van Habana Labs-oplossingen?
In een nogal raadselachtige gang van zaken heeft Intel besloten zijn plannen om zijn veelbelovende Nervana Neural Network Processor verder te ontwikkelen voor de trainingslijn, te schrappen. De beslissing komt slechts twee maanden nadat de ernstig vertraagde Nervana NNP-familie officieel werd gelanceerd. Hoewel niet bevestigd, is de verwarrende zet hoogstwaarschijnlijk het resultaat van Intels recente overname van Habana Labs.
Slechts twee maanden later Intel heeft Habana Labs gekocht voor $ 2 miljardheeft de eerste zijn eigen Nervana Neural Network Processor-project afgeschaft, bedoeld voor de trainingslijn voor kunstmatige intelligentie. Het is overigens niet verwonderlijk dat Intel hetzelfde heeft geschrapt. Dit komt omdat het nogal overbodig en contraproductief was om te blijven investeren in twee concurrerende AI-georiënteerde producten. Het was niet meer dan logisch dat een van de twee chips, die architectonisch heel verschillend zijn maar bedoeld voor dezelfde markten, uit verdere ontwikkeling zou vallen.
Intel schrapt de Nervana NNP-familie ten gunste van het Habana Labs-product, maar zal de toezeggingen van de klant nakomen:
Intel lijkt te hebben besloten de ontwikkeling van zijn eigen Nervana NNP-familie van AI-processors stop te zetten. De Intel NNP-I zal echter nog wat langer meegaan vanwege de toezeggingen van klanten. Toch zal Intel uiteindelijk alle ontwikkeling stopzetten ten gunste van de Habana-chips. Interessant is dat Intel ook Movidius VPU's van de 3e generatie heeft aangekondigd, codenaam Keem Bay. Het bedrijf heeft bevestigd dat de Movidius-roadmap voor beeldverwerking ongewijzigd blijft.
Hoewel de overname van Habana Labs door Intel heel logisch is, is de stopzetting van het eigen in-house ontwerp voor het alternatief van de eerste niet logisch. Overigens is geen van de AI-chips van een van de bedrijven onafhankelijk getest en hun gedetailleerde specificaties en benchmarks openlijk gepubliceerd. Toch bieden de officieel vrijgegeven specificaties, functies en prestatiekenmerken van de Nervana NNP-familie van AI-processors en die ontwikkeld door Habana Labs veel om ze te vergelijken.
De Intel Nervana-producten worden verkocht onder deNNP-merk terwijl Habana vroeger onder deHL-reeks. Zowel Nervana als Habana bieden een gestandaardiseerde PCIe-kaart en een OAM mezzanine-module. Simpel gezegd, fysiek lijken beide producten op elkaar. Verder beschikken deze chips over 32 GB HBM2-geheugen. De Nervana-chips van Intel hebben iets hogere TDP's en een hoger geklokt geheugen, maar interessant genoeg verbruiken ze tijdens de daadwerkelijke werking minder stroom.
De Intel-chips zijn gebaseerd op de Spring Crest-microarchitectuur, terwijl de chips van Habana Labs zijn gebaseerd op de Gaudi-microarchitectuur, en hier worden de verschillen duidelijk. Er ontbreken verschillende essentiële stukjes informatie, waardoor gedetailleerde vergelijking niet mogelijk is. Het is echter vrij duidelijk dat het ontwerp van Intel's Nervana veel complexer is. Spring Crest implementeert een uniform 2D-netwerk van 24 Tensor Processor Clusters (TPC's), waarbij elke cluster bestaat uit een On-Chip Router (OCR), de besturing, de MAC Processing Units (MPU) en het geheugensubsysteem. Er zijn ongeveer twee MPU's per cluster.
Het Nervana-systeem zorgt ervoor dat gegevens gelokaliseerd blijven, waardoor gegevensverplaatsing wordt verminderd en hergebruik wordt verbeterd. Bovendien werkte Intel naar verluidt ook aan een ICL-switch om meer flexibiliteit mogelijk te maken, naast het parallellisme dat al direct in de architectuur was ingebakken. Er zijn geen officiële schaalbenchmarks van Habana, maar preproductiechips van Nervana vertoonden naar verluidt een goed schaalgebruik over honderden knooppunten met zeer lage latenties, zelfs bij aanzienlijke overdrachtsgroottes.
Waarom schrapte Intel zijn eigen efficiënte, superieure en zeer schaalbare Nervana-chips voor Habana Labs?
Hoewel exacte details een beetje moeilijk te verkrijgen zijn, lijkt de Nervana-familie technologisch superieur te zijn in vergelijking met de alternatieven die door Habana Labs worden gepresenteerd. Intel beweert dat de uniforme architectuur van Habana een "strategisch voordeel" is. De beslissing van Intel heeft mogelijk te maken met de marktdynamiek rond de beschikbaarheid van HBM-geheugen, aangezien de producten van Habana Labs ook kunnen werken met standaard DDR4-interfaces.
Deskundigen beweren echter dat de beslissing om de Nervana te verlaten mogelijk te maken heeft met het niveau van softwareontwikkeling. De eerste generatie Nervana NNP's (Lake Crest) had eerder softwaregerelateerde problemen ondervonden door het gebruik van het Flexpoint-gegevenstype, waardoor Intel moest kiezen voor bfloat16. Wat de reden ook is, de overname van Habana Labs zal Intel in staat stellen marktaandeel te winnen in de groeiende AI ASIC-markt, en daarom kan de beslissing ook door de economie zijn geïnspireerd.