Nvidia vill påskynda dataöverföringar genom att ansluta datacenter GPU:er till SSD:er
Den här veckan introducerade Microsoft DirectStorage för Windows-datorer. API lovar snabbare laddningstider och mer detaljerad grafik, vilket gör att spelutvecklare kan skapa applikationer som laddar grafikdata från en SSD direkt till GPU:n. Nu har Nvidia och IBM skapat en liknande SSD/GPU-teknik, men de syftar till att hantera massiva datamängder i datacenter.
Istället för att fokusera på konsol- eller PC-spel som DirectStorage, är Big Accelerator Memory (BaM) designat för att ge datacenter snabb åtkomst till enorma mängder data i GPU-intensiva applikationer som maskininlärningsträning, analys och högpresterande beräkningar. till en forskningsartikel som upptäcktes av The Register den här veckan. Artikel med titeln ”BaM: The case for providing finkornig, high-bandwidth, GPU-driven storage access”( PDF ), forskare vid Nvidia, IBM och flera amerikanska universitet, erbjuder ett effektivare sätt att köra nästa generations applikationer i datacenter med enorm processorkraft och minnesbandbredd.
BaM skiljer sig också från DirectStorage genom att systemarkitekterna planerar att göra det till öppen källkod.
Tidningen anger att även om CPU-driven lagringsdataåtkomst är lämplig för ”klassiska” GPU-applikationer som täta neurala nätverksträning med ”fördefinierade, regelbundna, täta” dataåtkomstmönster, medför det för mycket ”overhead”. till CPU-GPU-synkronisering och/eller förstärkning av I/O-trafik.” Detta gör den mindre lämplig för nästa generations applikationer som använder graf- och dataanalys, rekommendationssystem, grafiska neurala nätverk och andra ”finkorniga databeroende åtkomstmönster”, skriver författarna.
Precis som DirectStorage fungerar BaM tillsammans med en NVMe SSD. Enligt dokumentet minskar BaM ”I/O-trafikförstärkning genom att tillåta GPU-trådar att läsa eller skriva små mängder datorbestämd data på begäran.”
Specifikt använder BaM GPU:s inbyggda minne, som är en mjukvarustyrd cache, såväl som GPU:ns mjukvarubibliotek. Trådar tar emot data från SSD:n och flyttar runt den med en anpassad Linux-kärndrivrutin. Forskarna testade ett prototypsystem med en 40GB Nvidia A100 PCIe GPU, två AMD EPYC 7702-processorer med 64 kärnor vardera och 1TB DDR4-3200-minne. Systemet kör Ubuntu 20.04 LTS.
Författarna noterade att även en ”konsumentklassad” SSD kan stödja BaM med applikationsprestanda som är ”konkurrenskraftig med en mycket dyrare DRAM-enbart lösning.”
Lämna ett svar