Kiina ostaa jatkuvasti Nvidia-kortteja kouluttaakseen tekoälymallejaan
Yhdysvallat toimi aggressiivisesti viime vuonna rajoittaakseen Kiinan kykyä kehittää tekoälyä sotilaallisiin tarkoituksiin, estäen AI-järjestelmien kouluttamiseen käytettyjen edistyneimpien amerikkalaisten sirujen myynnin siellä.
Generatiivisen tekoälyn kehittämiseen käytettyjen sirujen suuret edistysaskeleet ovat merkinneet sitä, että uusin yhdysvaltalainen Kiinassa myynnissä oleva teknologia on tehokkaampaa kuin mikään aiemmin saatavilla oleva teknologia. Näin siitä huolimatta, että siruja on tarkoituksella kierretty Kiinan markkinoille niiden kykyjen rajoittamiseksi, mikä tekee niistä vähemmän tehokkaita kuin muualla maailmassa saatavilla olevat tuotteet.
Tuloksena on ollut huimasti Kiinan uusimpien edistyneiden yhdysvaltalaisten prosessorien tilaukset. Kiinan johtavat Internet-yritykset ovat tehneet tilauksia 5 miljardin dollarin arvosta siruja Nvidialta, jonka graafisista prosessointiyksiköistä on tullut suurten tekoälymallien koulutuksen työhevonen.
Nvidian tuotteiden huiman maailmanlaajuisen kysynnän vaikutus tukee todennäköisesti siruvalmistajan keskiviikkona julkistettavaa toisen vuosineljänneksen taloudellista tulosta.
Sen lisäksi, että se heijastelee parannettujen sirujen kysyntää Internet-yritysten uusimpien suurten kielimallien kouluttamiseen, kiireen on aiheuttanut myös huoli siitä, että Yhdysvallat voisi kiristää vientivalvontaansa entisestään, jolloin edes nämä rajoitetut tuotteet eivät ole saatavilla tulevaisuudessa.
Nvidian johtava tutkija Bill Dally kuitenkin ehdotti, että Yhdysvaltojen vientivalvonnalla olisi suurempi vaikutus tulevaisuudessa.
”Koska koulutusvaatimukset [kehittyneimmille tekoälyjärjestelmille] kaksinkertaistuvat edelleen 6-12 kuukauden välein”, ero Kiinassa myytävien sirujen ja muualla maailmassa saatavien sirujen välillä ”kasvaa nopeasti”, hän sanoi.
Käsittelynopeuksien rajoittaminen
USA:n viimevuotinen lastujen viennin valvonta oli osa pakettia, joka sisälsi kiinalaisten asiakkaiden estämisen ostamasta kehittyneiden sirujen valmistukseen tarvittavia laitteita.
Washington asetti rajan Kiinassa myytävien sirujen enimmäiskäsittelynopeudelle sekä nopeudelle, jolla sirut voivat siirtää dataa – kriittinen tekijä suurten tekoälymallien koulutuksessa, joka vaatii paljon dataa. yhdistää suuria määriä siruja.
Nvidia vastasi vähentämällä tiedonsiirtonopeutta A100-prosessoreissaan, tuolloin huippuluokan grafiikkasuorittimissaan, ja loi Kiinalle uuden tuotteen nimeltä A800, joka täytti vientirajoitukset.
Tänä vuonna se on seurannut tiedonsiirtorajoituksia H100-prosessorilleen, joka on uusi ja paljon tehokkaampi prosessori, joka on suunniteltu erityisesti suurten kielimallien kouluttamiseen, ja se on luonut version nimeltä H800 Kiinan markkinoille.
Siruvalmistaja ei ole paljastanut Kiinalle valmistettujen prosessorien teknisiä ominaisuuksia, mutta tietokonevalmistajat ovat olleet avoimia yksityiskohdista. Lenovo esimerkiksi mainostaa H800-siruja sisältäviä palvelimia, jotka sen mukaan ovat kaikilta osin identtisiä muualla maailmassa myytävien H100-palvelimien kanssa, paitsi että niiden siirtonopeus on vain 400 gigatavua sekunnissa.
Se on alle 600 Gt/s rajan, jonka Yhdysvallat on asettanut sirujen viennille Kiinaan. Vertailun vuoksi, Nvidia on sanonut, että sen H100, jonka se aloitti toimituksen asiakkaille aiemmin tänä vuonna, on 900 Gt/s siirtonopeus.
Kiinan alhaisempi siirtonopeus tarkoittaa, että sirujen käyttäjät kohtaavat siellä pitempiä harjoitteluaikoja tekoälyjärjestelmilleen kuin Nvidian asiakkaat muualla maailmassa – tämä on tärkeä rajoitus mallien koon kasvaessa.
Pidemmät harjoitusajat nostavat kustannuksia, koska sirujen on kulutettava enemmän tehoa, mikä on yksi suurimmista kustannuksista suurissa malleissa.
Kuitenkin näilläkin rajoituksilla Kiinassa myynnissä olevat H800-sirut ovat tehokkaampia kuin mikään muualla ennen tätä vuotta saatavilla oleva, mikä johtaa valtavaan kysyntään.
Moor Insights & Strategyn yhdysvaltalaisen siruanalyytikon Patrick Moorheadin mukaan H800-sirut ovat viisi kertaa nopeampia kuin A100-sirut, jotka olivat olleet Nvidian tehokkaimpia GPU:ita.
Tämä tarkoittaa, että kiinalaiset Internet-yritykset, jotka kouluttivat tekoälymallejaan käyttämällä huippuluokan siruja, jotka ostettiin ennen Yhdysvaltojen vientivalvontaa, voivat silti odottaa suuria parannuksia ostamalla uusimpia puolijohteita, hän sanoi.
”Näyttää siltä, että Yhdysvaltojen hallitus ei halua sulkea Kiinan tekoälyä, vaan vaikeuttaa sitä”, Moorhead sanoi.
Kustannus-hyöty
Monet kiinalaiset teknologiayritykset ovat vielä esikouluttamassa suuria kielimalleja, mikä polttaa paljon suorituskykyä yksittäisistä GPU-siruista ja vaatii korkeatasoista tiedonsiirtokykyä.
Ainoastaan Nvidian sirut voivat tarjota esikoulutuksessa tarvittavan tehokkuuden, sanovat kiinalaiset tekoälyinsinöörit. 800-sarjan yksittäisten sirujen suorituskyky on heikentyneestä siirtonopeuksista huolimatta edelleen markkinoiden muita edellä.
”Nvidian grafiikkasuorittimet saattavat vaikuttaa kalliilta, mutta itse asiassa ne ovat kustannustehokkain vaihtoehto”, sanoi eräs tekoälyinsinööri johtavasta kiinalaisyhtiöstä.
Muut GPU-toimittajat tarjosivat halvempia hintoja oikea-aikaisemmalla huollolla, insinööri sanoi, mutta yritys katsoi, että koulutus- ja kehityskustannukset nousevat ja että sillä olisi ylimääräinen epävarmuustaakka.
Nvidian tarjontaan kuuluu ohjelmistoekosysteemi sekä sen vuonna 2006 perustama Compute Unified Device Architecture eli Cuda, josta on tullut osa tekoälyinfrastruktuuria.
Teollisuusanalyytikot uskovat, että kiinalaiset yritykset saattavat pian kohdata rajoituksia 800-sarjan sirujen välisten yhteyksien nopeuksissa. Tämä saattaa haitata heidän kykyään käsitellä tekoälykoulutukseen vaadittavaa kasvavaa datamäärää, ja heidän toimintansa vaikeutuu, kun he syventyvät tutkimaan ja kehittämään suuria kielimalleja.
86Researchin shanghailainen analyytikko Charlie Chai vertasi tilannetta monien tehtaiden rakentamiseen, joiden välillä on ruuhkaisia moottoriteitä. Jopa yritykset, jotka pystyvät vastaanottamaan heikentyneet sirut, voivat kohdata ongelmia seuraavien kahden tai kolmen vuoden aikana, hän lisäsi.
© 2023 The Financial Times Ltd. Kaikki oikeudet pidätetään. Älä kopioi ja liitä FT-artikkeleita ja jaa niitä edelleen sähköpostitse tai verkkoon.
Vastaa