Nvidia는 데이터 센터 GPU를 SSD에 연결하여 데이터 전송 속도를 높이고 싶어합니다.
이번 주에 Microsoft는 Windows PC용 DirectStorage를 출시했습니다. API는 더 빠른 로딩 시간과 더 자세한 그래픽을 보장하므로 게임 개발자는 SSD에서 GPU로 직접 그래픽 데이터를 로드하는 애플리케이션을 만들 수 있습니다. 이제 Nvidia와 IBM은 유사한 SSD/GPU 기술을 만들었지만 데이터 센터에서 대규모 데이터 세트를 처리하는 것을 목표로 합니다.
BaM(Big Accelerator Memory)은 DirectStorage와 같은 콘솔이나 PC 게임에 집중하는 대신 머신 러닝 교육, 분석 및 고성능 컴퓨팅과 같은 GPU 집약적인 애플리케이션에서 데이터 센터가 방대한 양의 데이터에 빠르게 액세스할 수 있도록 설계되었습니다. 이번 주 The Register 에서 발견한 연구 논문에 . Nvidia, IBM 및 여러 미국 대학의 연구원 들이 “BaM: The case for provide fine-grained, high-bandwidth, GPU-driven storage access”( PDF )라는 제목의 논문은 차세대 응용 프로그램을 실행하는 보다 효율적인 방법을 제공합니다. 방대한 처리 능력과 메모리 대역폭을 갖춘 데이터 센터.
또한 BaM은 시스템 설계자가 오픈 소스로 만들 계획이라는 점에서 DirectStorage와 다릅니다.
이 백서에서는 CPU 기반 스토리지 데이터 액세스가 “미리 정의되고 규칙적이며 밀도가 높은” 데이터 액세스 패턴이 있는 밀도가 높은 신경망 훈련과 같은 “전통적인” GPU 애플리케이션에 적합하지만 너무 많은 “오버헤드”가 발생한다고 설명합니다. CPU-GPU 동기화 및/또는 I/O 트래픽 증폭.” 이로 인해 그래프 및 데이터 분석, 추천 시스템, 그래프 신경망 및 기타 “세밀한 데이터 종속 액세스 패턴”을 사용하는 차세대 응용 프로그램에는 적합하지 않습니다.
DirectStorage와 마찬가지로 BaM은 NVMe SSD와 함께 작동합니다. 문서에 따르면 BaM은 “GPU 스레드가 필요에 따라 소량의 컴퓨터 결정 데이터를 읽거나 쓸 수 있도록 하여 I/O 트래픽 증폭을 줄입니다.”
특히 BaM은 소프트웨어 제어 캐시인 GPU의 온보드 메모리와 GPU의 소프트웨어 스레드 라이브러리를 사용합니다. 스레드는 SSD에서 데이터를 수신하고 사용자 지정 Linux 커널 드라이버를 사용하여 데이터를 이동합니다. 연구원들은 40GB Nvidia A100 PCIe GPU, 각각 64개의 코어가 있는 2개의 AMD EPYC 7702 프로세서, 1TB의 DDR4-3200 메모리로 프로토타입 시스템을 테스트했습니다. 시스템에서 Ubuntu 20.04 LTS를 실행 중입니다.
저자는 “소비자용” SSD도 “훨씬 더 비싼 DRAM 전용 솔루션과 경쟁”하는 애플리케이션 성능으로 BaM을 지원할 수 있다고 언급했습니다.
답글 남기기