Nvidia 希望通過將數據中心 GPU 連接到 SSD 來加速數據傳輸 

Nvidia 希望通過將數據中心 GPU 連接到 SSD 來加速數據傳輸 

本週,微軟推出了適用於 Windows PC 的 DirectStorage。該 API 承諾更快的加載時間和更詳細的圖形,允許遊戲開發人員創建將圖形數據從 SSD 直接加載到 GPU 的應用程序。現在Nvidia和IBM已經創建了類似的SSD/GPU技術,但他們的目標是處理數據中心的海量數據集。

大加速器內存 (BaM) 並非專注於 DirectStorage 等遊戲機或 PC 遊戲,而是旨在讓數據中心快速訪問機器學習訓練、分析和高性能計算等 GPU 密集型應用中的大量數據。本週The Register發現的一篇研究論文 。Nvidia、IBM 和幾所美國大學的研究人員發表了題為“BaM:提供細粒度、高帶寬、GPU 驅動的存儲訪問的案例”( PDF )的論文,提供了一種更有效的方式來運行下一代應用程序具有強大處理能力和內存帶寬的數據中心。

BaM 與 DirectStorage 的不同之處還在於,系統架構師計劃將其開源。

該論文指出,雖然 CPU 驅動的存儲數據訪問適合“經典”GPU 應用,例如具有“預定義、常規、密集”數據訪問模式的密集神經網絡訓練,但它會產生太多“開銷”。CPU-GPU 同步和/或 I/O 流量放大。” 作者寫道,這使得它不太適合使用圖形和數據分析、推薦系統、圖形神經網絡和其他“細粒度數據依賴訪問模式”的下一代應用程序。

與 DirectStorage 一樣,BaM 與 NVMe SSD 一起工作。根據該文件,BaM“通過允許 GPU 線程按需讀取或寫入少量計算機確定的數據來減少 I/O 流量放大。”

具體來說,BaM 使用 GPU 的板載內存(軟件控制的緩存)以及 GPU 的軟件線程庫。線程從 SSD 接收數據並使用自定義 Linux 內核驅動程序移動數據。研究人員測試了一個原型系統,該系統配備 40GB Nvidia A100 PCIe GPU、兩個 AMD EPYC 7702 處理器(每個處理器有 64 個內核)以及 1TB DDR4-3200 內存。系統運行的是 Ubuntu 20.04 LTS。

作者指出,即使是“消費級”SSD 也可以支持 BaM,其應用程序性能“可與昂貴得多的純 DRAM 解決方案相媲美”。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *