Kina bliver ved med at købe hinsidede Nvidia-kort for at træne sine AI-modeller

USA handlede aggressivt sidste år for at begrænse Kinas evne til at udvikle kunstig intelligens til militære formål, hvilket blokerede salget dér af de mest avancerede amerikanske chips, der bruges til at træne AI-systemer.

Store fremskridt inden for de chips, der bruges til at udvikle generativ kunstig intelligens, har betydet, at den seneste amerikanske teknologi, der er til salg i Kina, er mere kraftfuld end noget tidligere tilgængeligt. Det er på trods af, at chipsene bevidst er blevet hævet for det kinesiske marked for at begrænse deres muligheder, hvilket gør dem mindre effektive end produkter, der er tilgængelige andre steder i verden.

Resultatet har været skyhøje kinesiske ordrer på de seneste avancerede amerikanske processorer. Kinas førende internetvirksomheder har afgivet ordrer for 5 milliarder dollars chips fra Nvidia, hvis grafiske behandlingsenheder er blevet arbejdshesten til træning af store AI-modeller.

Virkningen af den stigende globale efterspørgsel efter Nvidias produkter vil sandsynligvis understøtte chipproducentens finansielle resultater for andet kvartal, der skal offentliggøres på onsdag.

Udover at afspejle efterspørgslen efter forbedrede chips til at træne internetvirksomhedernes seneste store sprogmodeller, er hastværket også foranlediget af bekymringer om, at USA kan stramme eksportkontrollen yderligere, hvilket gør selv disse begrænsede produkter utilgængelige i fremtiden.

Bill Dally, Nvidias chefforsker, foreslog imidlertid, at den amerikanske eksportkontrol ville have større indflydelse i fremtiden.

“Efterhånden som træningskravene [til de mest avancerede AI-systemer] fortsætter med at fordobles hver sjette til 12. måned,” vil kløften mellem chips, der sælges i Kina og dem, der er tilgængelige i resten af verden, “stige hurtigt,” sagde han.

Afdækning af behandlingshastigheder

Sidste års amerikanske eksportkontrol af chips var en del af en pakke, der omfattede at forhindre kinesiske kunder i at købe det nødvendige udstyr til at lave avancerede chips.

Washington satte et loft over den maksimale behandlingshastighed for chips, der kunne sælges i Kina, såvel som den hastighed, hvormed chipsene kan overføre data – en kritisk faktor, når det kommer til træning af store AI-modeller, et data-intensivt job, der kræver forbinder et stort antal chips sammen.

Nvidia reagerede ved at reducere dataoverførselshastigheden på sine A100-processorer, på det tidspunkt dets top-of-the-line GPU’er, og skabte et nyt produkt til Kina kaldet A800, der opfyldte eksportkontrollen.

I år er det fulgt med dataoverførselsgrænser på sin H100, en ny og langt mere kraftfuld processor, der var specielt designet til at træne store sprogmodeller, og skabte en version kaldet H800 til det kinesiske marked.

Chipproducenten har ikke afsløret de tekniske muligheder for de fremstillede til Kina-processorer, men computerproducenter har været åbne omkring detaljerne. Lenovo annoncerer for eksempel servere, der indeholder H800-chips, som den siger er identiske på alle måder med H100’er, der sælges andre steder i verden, bortset fra at de kun har en overførselshastighed på 400 gigabyte i sekundet.

Det er under den grænse på 600 GB/s, USA har sat for chipeksport til Kina. Til sammenligning har Nvidia sagt, at dens H100, som den begyndte at sende til kunder tidligere i år, har en overførselshastighed på 900 GB/s.

Den lavere overførselshastighed i Kina betyder, at brugere af chipsene dér står over for længere træningstider for deres AI-systemer end Nvidias kunder andre steder i verden – en vigtig begrænsning, da modellerne er vokset i størrelse.

De længere træningstider øger omkostningerne, da chips bliver nødt til at forbruge mere strøm, en af de største udgifter med store modeller.

Men selv med disse grænser er H800-chippene, der er til salg i Kina, mere kraftfulde end noget andet tilgængeligt andre steder før i år, hvilket fører til den enorme efterspørgsel.

H800-chippene er fem gange hurtigere end A100-chippene, der havde været Nvidias mest kraftfulde GPU’er, ifølge Patrick Moorhead, en amerikansk chipanalytiker hos Moor Insights & Strategy.

Det betyder, at kinesiske internetvirksomheder, der trænede deres AI-modeller ved hjælp af top-of-the-line-chips købt før den amerikanske eksportkontrol, stadig kan forvente store forbedringer ved at købe de nyeste halvledere, sagde han.

“Det ser ud til, at den amerikanske regering ikke ønsker at lukke Kinas AI-indsats, men gøre det sværere,” sagde Moorhead.

Cost-benefit

Mange kinesiske teknologivirksomheder er stadig på stadiet med at fortræne store sprogmodeller, hvilket brænder en masse ydeevne fra individuelle GPU-chips og kræver en høj grad af dataoverførselskapacitet.

Kun Nvidias chips kan give den nødvendige effektivitet til fortræning, siger kinesiske AI-ingeniører. Den individuelle chip-ydeevne i 800-serien er på trods af de svækkede overførselshastigheder stadig foran andre på markedet.

“Nvidias GPU’er kan virke dyre, men er faktisk den mest omkostningseffektive mulighed,” sagde en AI-ingeniør hos en førende kinesisk internetvirksomhed.

Andre GPU-leverandører citerede lavere priser med mere rettidig service, sagde ingeniøren, men virksomheden vurderede, at uddannelses- og udviklingsomkostningerne ville stige, og at det ville have den ekstra byrde af usikkerhed.

Nvidias tilbud inkluderer softwareøkosystemet med dets computerplatform Compute Unified Device Architecture eller Cuda, som det oprettede i 2006, og som er blevet en del af AI-infrastrukturen.

Brancheanalytikere mener, at kinesiske virksomheder snart kan stå over for begrænsninger i hastigheden af sammenkoblinger mellem 800-seriens chips. Dette kan hæmme deres evne til at håndtere den stigende mængde data, der kræves til AI-træning, og de vil blive hæmmet, når de dykker dybere ned i forskning og udvikling af store sprogmodeller.

Charlie Chai, en Shanghai-baseret analytiker hos 86Research, sammenlignede situationen med at bygge mange fabrikker med overbelastede motorveje imellem sig. Selv virksomheder, der kan rumme de svækkede chips, kan få problemer inden for de næste to eller tre år, tilføjede han.

Posted on august 21, 2023

News

admin

Kina bliver ved med at købe hinsidede Nvidia-kort for at træne sine AI-modeller

Afdækning af behandlingshastigheder

Cost-benefit

Skriv et svar Annuller svar

Sådan bruger du håndbevægelser til at tilføje effekter til FaceTime-opkald

iOS 17 genvej: Tryk og hold + knappen i Beskeder for at uploade billeder