Chiny wciąż kupują utykające karty Nvidii, aby trenować swoje modele AI

Stany Zjednoczone działały agresywnie w zeszłym roku, aby ograniczyć zdolność Chin do rozwijania sztucznej inteligencji do celów wojskowych, blokując tam sprzedaż najbardziej zaawansowanych amerykańskich chipów używanych do szkolenia systemów AI.

Duże postępy w chipach wykorzystywanych do opracowywania generatywnej sztucznej inteligencji sprawiły, że najnowsza amerykańska technologia sprzedawana w Chinach jest potężniejsza niż wszystko, co było dostępne wcześniej. Dzieje się tak pomimo faktu, że chipy zostały celowo spętane na rynek chiński, aby ograniczyć ich możliwości, czyniąc je mniej skutecznymi niż produkty dostępne w innych częściach świata.

Rezultatem był gwałtowny wzrost chińskich zamówień na najnowsze zaawansowane procesory amerykańskie. Wiodące chińskie firmy internetowe złożyły zamówienia na czipy o wartości 5 miliardów dolarów od Nvidii, której jednostki przetwarzania graficznego stały się siłą napędową do szkolenia dużych modeli AI.

Wpływ gwałtownie rosnącego globalnego popytu na produkty Nvidii prawdopodobnie wpłynie na wyniki finansowe producenta chipów za drugi kwartał, które zostaną ogłoszone w środę.

Oprócz odzwierciedlenia zapotrzebowania na ulepszone chipy do uczenia najnowszych dużych modeli językowych firm internetowych, pośpiech był również spowodowany obawami, że Stany Zjednoczone mogą jeszcze bardziej zaostrzyć kontrolę eksportu, co sprawi, że nawet te ograniczone produkty będą niedostępne w przyszłości.

Jednak Bill Dally, główny naukowiec Nvidii, zasugerował, że kontrola eksportu w USA będzie miała większy wpływ w przyszłości.

„Ponieważ wymagania szkoleniowe [dla najbardziej zaawansowanych systemów sztucznej inteligencji] podwajają się co sześć do 12 miesięcy”, różnica między chipami sprzedawanymi w Chinach a tymi dostępnymi w pozostałej części świata „będzie szybko rosnąć” – powiedział.

Ograniczanie prędkości przetwarzania

Zeszłoroczna kontrola eksportu chipów w USA była częścią pakietu, który obejmował uniemożliwienie chińskim klientom kupowania sprzętu potrzebnego do produkcji zaawansowanych chipów.

Waszyngton ustalił limit maksymalnej szybkości przetwarzania chipów, które mogą być sprzedawane w Chinach, a także szybkości, z jaką chipy mogą przesyłać dane – krytyczny czynnik, jeśli chodzi o szkolenie dużych modeli AI, zadanie wymagające dużej ilości danych, które wymaga łączenie ze sobą dużej liczby układów scalonych.

Nvidia odpowiedziała, zmniejszając szybkość przesyłania danych na swoich procesorach A100, wówczas swoich najlepszych procesorach graficznych, tworząc nowy produkt dla Chin o nazwie A800, który spełnił wymogi kontroli eksportu.

W tym roku podążyła za ograniczeniami transferu danych w swoim H100, nowym i znacznie potężniejszym procesorze, który został specjalnie zaprojektowany do uczenia dużych modeli językowych, tworząc wersję o nazwie H800 na rynek chiński.

Producent chipów nie ujawnił technicznych możliwości procesorów wyprodukowanych dla Chin, ale producenci komputerów byli otwarci na szczegóły. Na przykład Lenovo reklamuje serwery zawierające chipy H800, które według niego są pod każdym względem identyczne z H100 sprzedawanymi w innych częściach świata, z wyjątkiem tego, że mają szybkość transferu wynoszącą zaledwie 400 gigabajtów na sekundę.

To poniżej limitu 600 GB/s, który Stany Zjednoczone ustaliły dla eksportu chipów do Chin. Dla porównania, Nvidia powiedziała, że jej H100, który zaczął dostarczać klientom na początku tego roku, ma szybkość transferu 900 GB/s.

Niższa szybkość transferu w Chinach oznacza, że użytkownicy tamtejszych układów stykają się z dłuższym czasem szkolenia dla swoich systemów AI niż klienci Nvidii w innych częściach świata – ważne ograniczenie, ponieważ modele rozrosły się.

Dłuższy czas szkolenia zwiększa koszty, ponieważ chipy będą musiały zużywać więcej energii, co jest jednym z największych wydatków w przypadku dużych modeli.

Jednak nawet przy tych ograniczeniach chipy H800 sprzedawane w Chinach są potężniejsze niż cokolwiek dostępnego gdziekolwiek indziej przed tym rokiem, co prowadzi do ogromnego popytu.

Chipy H800 są pięć razy szybsze niż chipy A100, które były najpotężniejszymi procesorami graficznymi Nvidii, według Patricka Moorheada, amerykańskiego analityka chipów w Moor Insights & Strategy.

Oznacza to, że chińskie firmy internetowe, które wyszkoliły swoje modele sztucznej inteligencji przy użyciu najlepszych chipów zakupionych przed kontrolą eksportu w USA, nadal mogą spodziewać się dużych ulepszeń, kupując najnowsze półprzewodniki, powiedział.

„Wygląda na to, że rząd Stanów Zjednoczonych nie chce powstrzymać wysiłków Chin w zakresie sztucznej inteligencji, ale je utrudnić” – powiedział Moorhead.

Koszty i korzyści

Wiele chińskich firm technologicznych wciąż znajduje się na etapie wstępnego szkolenia dużych modeli językowych, co powoduje znaczne zużycie wydajności poszczególnych układów GPU i wymaga wysokiego stopnia możliwości przesyłania danych.

Chińscy inżynierowie AI twierdzą, że tylko chipy Nvidii mogą zapewnić wydajność potrzebną do wstępnego treningu. Indywidualna wydajność chipów z serii 800, pomimo osłabienia prędkości transferu, wciąż wyprzedza inne na rynku.

„Procesory graficzne Nvidii mogą wydawać się drogie, ale w rzeczywistości są najbardziej opłacalną opcją” — powiedział jeden z inżynierów AI w wiodącej chińskiej firmie internetowej.

Inni dostawcy procesorów graficznych oferowali niższe ceny za bardziej terminową obsługę, powiedział inżynier, ale firma oceniła, że koszty szkolenia i rozwoju wzrosną i że będzie miała dodatkowy ciężar niepewności.

Oferta Nvidii obejmuje ekosystem oprogramowania wraz z platformą obliczeniową Compute Unified Device Architecture lub Cuda, którą stworzyła w 2006 roku i która stała się częścią infrastruktury sztucznej inteligencji.

Analitycy branżowi uważają, że chińskie firmy mogą wkrótce napotkać ograniczenia w szybkości połączeń między chipami z serii 800. Może to utrudnić im radzenie sobie z rosnącą ilością danych wymaganych do szkolenia AI, a będą one utrudnione, gdy zagłębią się w badanie i rozwój dużych modeli językowych.

Charlie Chai, analityk 86Research z Szanghaju, porównał sytuację z budową wielu fabryk, między którymi znajdują się zatłoczone autostrady. Dodał, że nawet firmy, które mogą pomieścić osłabione chipy, mogą napotkać problemy w ciągu najbliższych dwóch lub trzech lat.

Posted on 21 sierpnia, 2023

News

admin

Chiny wciąż kupują utykające karty Nvidii, aby trenować swoje modele AI

Ograniczanie prędkości przetwarzania

Koszty i korzyści

Dodaj komentarz Anuluj pisanie odpowiedzi

Jak używać gestów dłoni, aby dodawać efekty do rozmowy FaceTime

Skrót do systemu iOS 17: naciśnij i przytrzymaj przycisk + w Wiadomościach, aby przesłać obrazy