Čína stále nakupuje ochucené karty Nvidia, aby trénovala své modely AI

USA loni agresivně omezily schopnost Číny vyvíjet umělou inteligenci pro vojenské účely a zablokovaly tam prodej nejpokročilejších amerických čipů používaných k výcviku systémů umělé inteligence.
Velký pokrok v čipech používaných k vývoji generativní umělé inteligence znamenal, že nejnovější americká technologie prodávaná v Číně je výkonnější než cokoli, co bylo dříve dostupné. A to navzdory skutečnosti, že čipy byly záměrně okopány pro čínský trh, aby omezily jejich schopnosti, čímž byly méně účinné než produkty dostupné jinde ve světě.
Výsledkem byly prudce rostoucí čínské objednávky na nejnovější pokročilé americké procesory. Přední čínské internetové společnosti zadaly objednávky na čipy v hodnotě 5 miliard dolarů od společnosti Nvidia, jejíž grafické procesorové jednotky se staly tahounem pro trénink velkých modelů umělé inteligence.
Finanční výsledky výrobce čipů za druhé čtvrtletí, které mají být oznámeny ve středu, pravděpodobně podpoří dopad prudce rostoucí celosvětové poptávky po produktech Nvidie.
Kromě toho, že se odráží poptávka po vylepšených čipech pro trénování nejnovějších velkých jazykových modelů internetových společností, spěch byl také vyvolán obavami, že by USA mohly ještě více zpřísnit kontroly vývozu, takže i tyto omezené produkty budou v budoucnu nedostupné.
Bill Dally, hlavní vědec Nvidie, však naznačil, že kontroly vývozu v USA budou mít v budoucnu větší dopad.
„Vzhledem k tomu, že se požadavky na školení [pro nejpokročilejší systémy umělé inteligence] každých šest až 12 měsíců zdvojnásobují, propast mezi čipy prodávanými v Číně a těmi dostupnými ve zbytku světa se „rychle zvětší,“ řekl.
Omezení rychlosti zpracování
Loňské kontroly exportu čipů v USA byly součástí balíčku, který zahrnoval zabránění čínským zákazníkům v nákupu zařízení potřebného k výrobě pokročilých čipů.
Washington stanovil limit na maximální rychlost zpracování čipů, které by se mohly prodávat v Číně, a také na rychlost, jakou mohou čipy přenášet data – kritický faktor, pokud jde o trénování velkých modelů umělé inteligence, což je práce náročná na data, která vyžaduje spojování velkého množství čipů dohromady.
Nvidia zareagovala snížením rychlosti přenosu dat na svých procesorech A100, v té době svých špičkových GPU, a vytvořila nový produkt pro Čínu s názvem A800, který splňoval exportní kontroly.
V letošním roce následovaly limity přenosu dat na svém H100, novém a mnohem výkonnějším procesoru, který byl speciálně navržen pro trénování velkých jazykových modelů, a vytvořil verzi s názvem H800 pro čínský trh.
Výrobce čipů nezveřejnil technické možnosti procesorů vyrobených pro Čínu, ale výrobci počítačů byli otevření ohledně podrobností. Lenovo například inzeruje servery obsahující čipy H800, které jsou podle ní ve všech směrech totožné s H100 prodávanými jinde ve světě, kromě toho, že mají přenosovou rychlost pouze 400 gigabajtů za sekundu.
To je pod limitem 600 GB/s, který USA stanovily pro export čipů do Číny. Pro srovnání, Nvidia uvedla, že její H100, kterou začala zákazníkům dodávat začátkem tohoto roku, má přenosovou rychlost 900 GB/s.
Nižší přenosová rychlost v Číně znamená, že tamní uživatelé čipů čelí delší době školení pro své systémy AI než zákazníci Nvidie jinde ve světě – důležité omezení, protože modely rostou.
Delší doba školení zvyšuje náklady, protože čipy budou muset spotřebovávat více energie, což je jeden z největších výdajů u velkých modelů.
Nicméně i s těmito limity jsou čipy H800 prodávané v Číně výkonnější než cokoliv jiného dostupného kdekoli jinde před tímto rokem, což vede k obrovské poptávce.
Čipy H800 jsou pětkrát rychlejší než čipy A100, které byly nejvýkonnějšími GPU Nvidie, podle Patricka Moorheada, amerického analytika čipů z Moor Insights & Strategy.
To znamená, že čínské internetové společnosti, které trénovaly své modely AI pomocí špičkových čipů zakoupených před americkými exportními kontrolami, mohou stále očekávat velká zlepšení nákupem nejnovějších polovodičů, řekl.
„Zdá se, že americká vláda nechce čínské úsilí o umělou inteligenci ukončit, ale ztížit,“ řekl Moorhead.
Náklady a přínosy
Mnoho čínských technologických společností je stále ve fázi předtrénování velkých jazykových modelů, které spotřebovávají spoustu výkonu z jednotlivých čipů GPU a vyžadují vysoký stupeň schopnosti přenosu dat.
Pouze čipy Nvidie mohou poskytnout efektivitu potřebnou pro předtrénink, říkají čínští inženýři AI. Výkon jednotlivých čipů řady 800 je i přes oslabené přenosové rychlosti stále na trhu před ostatními.
„GPU od Nvidie se mohou zdát drahé, ale ve skutečnosti jsou cenově nejefektivnější možností,“ řekl jeden inženýr AI z přední čínské internetové společnosti.
Jiní prodejci GPU uváděli nižší ceny s včasnějším servisem, řekl inženýr, ale společnost usoudila, že náklady na školení a vývoj se zvýší a že bude mít další břemeno nejistoty.
Nabídka společnosti Nvidia zahrnuje softwarový ekosystém s její výpočetní platformou Compute Unified Device Architecture neboli Cuda, kterou zřídila v roce 2006 a která se stala součástí infrastruktury AI.
Průmysloví analytici se domnívají, že čínské společnosti mohou brzy čelit omezením v rychlosti propojení mezi čipy řady 800. To by mohlo bránit jejich schopnosti vypořádat se s rostoucím množstvím dat potřebných pro školení AI a budou omezováni, když se budou hlouběji ponořit do výzkumu a vývoje velkých jazykových modelů.
Charlie Chai, analytik 86Research sídlící v Šanghaji, porovnal situaci s výstavbou mnoha továren s přetíženými dálnicemi mezi nimi. Dokonce i společnosti, které dokážou oslabené čipy pojmout, mohou během příštích dvou nebo tří let čelit problémům, dodal.
© 2023 The Financial Times Ltd. Všechna práva vyhrazena. Nekopírujte a nevkládejte články FT a dále je nedistribuujte e-mailem nebo zveřejňováním na webu.
Napsat komentář