В прошлом году США действовали агрессивно, чтобы ограничить возможности Китая по разработке искусственного интеллекта для военных целей, заблокировав продажу там самых передовых американских чипов, используемых для обучения систем ИИ.
Большой прогресс в области чипов, используемых для разработки генеративного ИИ, означает, что новейшая американская технология, продаваемая в Китае, является более мощной, чем все, что было доступно ранее. И это несмотря на то, что чипы были специально предназначены для китайского рынка, чтобы ограничить их возможности, что сделало их менее эффективными, чем продукты, доступные в других странах мира.
Результатом стал стремительный рост китайских заказов на новейшие передовые процессоры США. Ведущие интернет-компании Китая разместили заказы на чипы на сумму 5 миллиардов долларов у Nvidia, чьи графические процессоры стали рабочей лошадкой для обучения больших моделей ИИ.
Воздействие растущего мирового спроса на продукты Nvidia, вероятно, будет лежать в основе финансовых результатов производителя чипов за второй квартал, которые должны быть объявлены в среду.
Помимо спроса на улучшенные чипы для обучения новейших крупных языковых моделей интернет-компаний, спешка также была вызвана опасениями, что США могут еще больше ужесточить свой экспортный контроль, что сделает даже эти ограниченные продукты недоступными в будущем.
Однако Билл Далли, главный научный сотрудник Nvidia, предположил, что экспортный контроль США будет иметь большее влияние в будущем.
«Поскольку требования к обучению [для самых передовых систем искусственного интеллекта] продолжают удваиваться каждые шесть-двенадцать месяцев», разрыв между чипами, продаваемыми в Китае, и чипами, доступными в остальном мире, «будет быстро расти», — сказал он.
Ограничение скорости обработки
В прошлом году введенный в США экспортный контроль над чипами был частью пакета мер, включавшего запрет на покупку китайскими клиентами оборудования, необходимого для производства усовершенствованных чипов.
Вашингтон установил ограничение на максимальную скорость обработки чипов, которые могут быть проданы в Китае, а также на скорость, с которой чипы могут передавать данные — критический фактор, когда речь идет об обучении больших моделей ИИ, работе с интенсивным использованием данных, требующей соединение большого количества чипов вместе.
В ответ Nvidia снизила скорость передачи данных на своих процессорах A100, которые в то время были топовыми графическими процессорами, и создала новый продукт для Китая под названием A800, который удовлетворял требованиям экспортного контроля.
В этом году компания ввела ограничения на передачу данных для своего H100, нового и гораздо более мощного процессора, специально разработанного для обучения больших языковых моделей, и создала версию под названием H800 для китайского рынка.
Производитель чипов не раскрыл технические возможности процессоров, сделанных для Китая, но производители компьютеров не скрывали подробностей. Lenovo, например, рекламирует серверы с чипами H800, которые, по ее словам, во всех отношениях идентичны процессорам H100, продаваемым в других странах мира, за исключением того, что скорость их передачи составляет всего 400 гигабайт в секунду.
Это ниже предела в 600 ГБ/с, установленного США для экспорта чипов в Китай. Для сравнения, Nvidia заявила, что ее H100, который она начала поставлять клиентам в начале этого года, имеет скорость передачи 900 ГБ/с.
Более низкая скорость передачи данных в Китае означает, что пользователи чипов там сталкиваются с более длительным временем обучения своих систем искусственного интеллекта, чем клиенты Nvidia в других странах мира — важное ограничение, поскольку модели выросли в размерах.
Более длительное время обучения увеличивает затраты, поскольку чипы должны будут потреблять больше энергии, что является одной из самых больших статей расходов для больших моделей.
Однако даже с учетом этих ограничений чипы H800, продаваемые в Китае, являются более мощными, чем все, что было доступно где-либо еще до этого года, что приводит к огромному спросу.
Чипы H800 в пять раз быстрее, чем чипы A100, которые были самыми мощными графическими процессорами Nvidia, по словам Патрика Мурхеда, американского аналитика чипов Moor Insights & Strategy.
Это означает, что китайские интернет-компании, обучавшие свои модели искусственного интеллекта с использованием первоклассных чипов, купленных до введения экспортного контроля США, все еще могут ожидать больших улучшений, покупая новейшие полупроводники, сказал он.
«Похоже, что правительство США хочет не свернуть усилия Китая по искусственному интеллекту, а усложнить его», — сказал Мурхед.
Затрат и выгод
Многие китайские технологические компании все еще находятся на стадии предварительного обучения больших языковых моделей, что требует большой производительности от отдельных чипов графического процессора и требует высокой степени способности передачи данных.
По словам китайских инженеров по искусственному интеллекту, только чипы Nvidia могут обеспечить эффективность, необходимую для предварительного обучения. Производительность отдельных чипов 800-й серии, несмотря на ослабление скорости передачи, по-прежнему опережает другие на рынке.
«Графические процессоры Nvidia могут показаться дорогими, но на самом деле они являются наиболее рентабельным вариантом», — сказал один инженер по искусственному интеллекту в ведущей китайской интернет-компании.
По словам инженера, другие поставщики графических процессоров предлагали более низкие цены при более своевременном обслуживании, но компания посчитала, что затраты на обучение и разработку возрастут, а также возникнет дополнительное бремя неопределенности.
Предложение Nvidia включает в себя программную экосистему с вычислительной платформой Compute Unified Device Architecture или Cuda, созданную в 2006 году и ставшую частью инфраструктуры ИИ.
Отраслевые аналитики считают, что вскоре китайские компании могут столкнуться с ограничениями скорости межсоединений между чипами 800-й серии. Это может помешать их способности справляться с растущим объемом данных, необходимых для обучения ИИ, и им будет мешать их более глубокое погружение в исследование и разработку больших языковых моделей.
Чарли Чай, аналитик 86Research из Шанхая, сравнил ситуацию со строительством множества заводов с перегруженными автомагистралями между ними. Он добавил, что даже компании, способные использовать ослабленные чипы, могут столкнуться с проблемами в ближайшие два-три года.
© 2023 The Financial Times Ltd. Все права защищены. Пожалуйста, не копируйте и не вставляйте статьи FT и не распространяйте их по электронной почте или в Интернете.