Ifølge analytikere fra HSBC, kan Nvidia's Blackwell GPU'er til AI-applikationer blive dyrere end selskabets Hopper-baserede processorer. Ifølge @firstadopter, en senior skribent fra Barron's, kan en enkelt GB200 superchip (CPU+GPUs) koste op til $70.000. Dog kan Nvidia være mere tilbøjelig til at sælge servere baseret på Blackwell GPU'erne i stedet for at sælge chips separat, især når det forventes at B200 NVL72 serverne vil koste op til $3 millioner hver.
HSBC estimerer, at Nvidia's 'entry' B100 GPU vil have en gennemsnitlig salgspris mellem $30.000 og $35.000, hvilket er inden for prisklassen for Nvidia's H100. Den mere kraftfulde GB200, der kombinerer en enkelt Grace CPU med to B200 GPUs, forventes at koste mellem $60.000 og $70.000. Det kan faktisk ende med at koste lidt mere end det, da det kun er analytiker-estimater.
Servere baseret på Nvidia's design vil være meget dyrere. Nvidia GB200 NVL36 med 36 GB200 Superchips kan blive solgt til i gennemsnit $1,8 millioner, mens Nvidia GB200 NVL72 med 72 GB200 Superchips kan have en pris på omkring $3 millioner ifølge de påståede HSBC tal. Da Nvidia's CEO Jensen præsenterede Blackwell data center chipsene på årets GTC 2024, var det tydeligt, at hensigten er at flytte hele racks af servere. Jensen udtalte gentagne gange, at når han tænker på en GPU, forestiller han sig nu NVL72-racket.
Hele setuppet integreres via høj båndbredde-forbindelser for at fungere som en massiv GPU, der leverer 13.824 GB VRAM i alt - en afgørende faktor i træningen af stadig større LLMs. Ved at sælge hele systemer i stedet for separat GPU/Superchips, kan Nvidia absorbere noget af præmien, som systemintegratorer tjener, hvilket vil øge selskabets indtægter og rentabilitet. Baseret på, at Nvidia's konkurrenter AMD og Intel langsomt vinder fodfæste med deres AI-processorer, kan Nvidia helt sikkert sælge sine AI-processorer til en stor præmie.
Derfor er de prisestimater, der angiveligt er udarbejdet af HSBC, ikke særlig overraskende. Det er også vigtigt at fremhæve forskellene mellem H200 og GB200. H200 har allerede en pris på op til $40.000 for individuelle GPU'er. GB200 vil effektivt firedoble antallet af GPU'er (fire silicon dies, to pr. B200), samt tilføje CPU'en og det store PCB for den såkaldte Superchip. Rå beregning for en enkelt GB200 Superchip er 5 petaflops FP16 (10 petaflops med sparsity), sammenlignet med 1/2 petaflops (dense/sparse) på H200.
Det er cirka fem gange mere beregning, uden engang at tage andre arkitektoniske opgraderinger i betragtning. Det skal huskes, at de faktiske priser for datacenter-grade hardware altid afhænger af de individuelle kontrakter, baseret på mængden af hardware, der bestilles, og andre forhandlinger. Derfor skal man tage disse estimerede tal med lidt salt. Større købere som Amazon og Microsoft får sandsynligvis store rabatter, mens mindre kunder kan ende med at betale endnu højere priser end dem, HSBC rapporterer.