公共AI的顶级嘉会GTC于3月17日到3月21日在好意思国硅谷雄伟举行。在GTC大会时分,华瑞指数云ExponTechCTO曹羽中受邀进入了专注于AIStorage的工夫研讨会并发扮演讲。在演讲中,曹羽中先容了ExponTech与和洽伙伴ScaleFlux,AIC基于英伟达的BlueField3DPU以及英伟达最新发布的Spectrum-X集会打造的新式AIStorage决议,展示了该决议的实质测试数据🦄九游下载中心_九游游戏中心官网,并与和洽伙伴,AIStorage行业众人以及一些大型客户进行了深远商榷。与会的众人均暗意该决议的实测性能数据以及空洞上风透露远超预期,具备很高的营业价值,veryimpressive!
新式AI存储决议遴选的软硬件决议:
硬件:
F2026 AI管事器,是一台2U闪存JBOF,配备2个或4个NVIDIA BlueField-3数据处理单位(DPU)和24块高性能ScaleFlux CSD5000 NVMe SSD(CSD5000是ScaleFlux公司最新推出的一款内置硬件压缩与解压缩才气的高性能NVMe SSD介质);
NVIDIA Spectrum-X集会交换机;
软件:
华瑞指数云ExponTech下一代散播式存储软件平台WADP (WiDE AI Data Platform);
(本决议遴选的2U存储节点及ScaleFluxCSD5000 NVMe SSD)
基于此决议的AI检会和推理环境的实测部署架构如下图:
1台2U AIC JBOF动作存储管事器, 配备4块NVIDIA BlueField3 DPU, 提供1600Gbps集会带宽,24块ScaleFlux CSD5000 NVMe SSD,ExponTech WADP存储软件的后端开动于BlueField3 DPU内;
1 台圭臬2U管事器动作野心管事器,配备4块NVIDIA BlueField3 DPU,提供800Gbps集会带宽,在DPU里面开动ExponTech WADP存储软件的存储网关和契约;
野心管事器上不错建树GPU,用于检会或推理,存储软件和集会流量开动于DPU内,存储IO不会豪侈野心管事器的CPU和内存资源,野心管事器不错领有更充沛的资源用于野心处理;
测试环境特等遴选了4台NVIDIA Spectrum-X交换机组成两层集会,主若是为了模拟与考据在大鸿沟组网的情况下,RoCE集会是否依然不错很好的处理拥塞,存储软件不错依然保执自如的存储性能和低时延;
存储管事器(JBOF)和野心管事器均不错按需孤独彭胀,按需加入更多的存储管事器(JBOF)或者野心管事器,组成大鸿沟的,存算辞别的,按需彭胀的AI检会和推理集群。
基础存储性能考据:
基于上一节所述的实测部署环境,进行了存储系统的基础性能考据,其考据景观是从野心节点上开动FIO,测试存储系统的基础性能方针。
单个野心节点不错达到近90GB/s的存储带宽,接近野心节点网卡的物理带宽上限;
单个野心节点不错达到310万IOPS,当建树更多的野心节点时,不错同步得回更多的IOPS。接头到通盘存储系统的后端以及契约端都是跑在DPU内,DPU内的CPU处感性能远远不如管事器建树的CPU,单个野心节点+单个存储节点即达到310万IOPS照旧充分展现了本决议绝顶惊东谈主的IO处理成果;
存储系统的IOPS与存储节点上部署的数据处理单位(DPU)数目呈线性比例彭胀,系统的IOPS随DPU部署数目线性彭胀,标明其具备极佳的横向彭胀才气。本决议遴选的存储节点最多不错建树8张DPU(刻下测试环境建树4张),还不错已毕IOPS性能翻倍以及集会带宽翻倍;
存储系统在使用小IO size时,并发大压力时延低至266us, 在使用大IO size时,打满野心节点的集会物理带宽,时延还能弥远保执在1毫秒以下。
MLPerfStorage v1.0测试终局:
MLPerf™是影响力最广的海外AI性能基准评测,MLPerf™Storage是针对AIStorage的基准性能测试,不错较为全面的评估测试AI应用治安的存储需求。MLPerf™Storage基准测试通过开动一个散播式检会测试治安,模拟GPU野心经由,在此经由中真正的实践AI管事器对存储系统的读写访谒,以此来测试存储系统巧合补助的最大GPU数目和带宽透露。
MLPerfStoragev1.0于2024年8月推出,国表里一共有十三家从事高性能存储研发的厂家参与了测试并提交持重测试终局,其中包括DDN(Lustre),华为,WekaIO,Hammerspace等闻名的散播式文献系统厂家。
本次咱们遴选了ResNet50模子(主要用于图像分类和图像识别场景),在上述1存储节点(JBOF)+1野心节点的测试环境上进行了MLPerfStorage v1.0基准测试,测试的终局如下:
测试终局标明:
ExponTech的新式AI存储决议具备公共最初的性能,单客户端巧合支执的GPU卡的数目跨越了悉数参与了MLPerf Storage v1.0持重测试的厂商,位居公共第一;单客户端巧合已毕的存储带宽达到近30GB/s, 位居公共第二;
本次测试环境惟有一个客户端节点(野心节点),CPU和内存建树较低,在开动MLPerf Storage v1.0的测试中照旧达到了客户端节点的野心才气的瓶颈,然则还远远莫得达到存储节点的存储才气的瓶颈。如果换用处理才气更强的野心节点来作念测试,不错测试出更高的性能数据,即支执更多的GPU卡,已毕更高的存储带宽。
回来
基于本次在真正的环境上的全面测试,回来一下ExponTech与和洽伙伴ScaleFlux,AIC基于英伟达的BlueField3DPU以及英伟达最新发布的Spectrum-X集会打造的新式AIStorage决议的关键特质和上风:
寰宇顶级性能,SPC-1 评测杰出悉数高端全闪存储阵列,突破寰宇记录,MLPerf Storage v1.0测试数据大幅度杰出WekaIO, DDN等有名并行文献系统;
寰宇顶级容量密度,刻下每2U Storage Node可已毕跨越1.6PB存储裸容量,来岁可彭胀至每2U跨越6.6PB,最大化数据中心空间的AI数据价值;
建树的ScaleFlux CSD5000 NVMe SSD具有盘内透明压缩解压缩才气,巧合在不豪侈颠倒系统资源,不影响性能的情况下已毕有储裸容量的数倍放大,存储容量成果得回惊东谈主的进步;
磨灭平台上同期支执高性能散播式块存储和文献存储等多种契约,除了支执AI的检会和推理场景,还不错澌灭数据采集,数据准备,RAG等AI Pipeline全场景,不必为AI Pipeline建树不同的存储决议以及反复进行数据拷贝移动,不错已毕AI算力和存力的透顶存算辞别和孤独彭胀,具备更好的可贬责性和成果;
遒劲的并行彭胀性,存储节点及野心节点均不错孤独的水平彭胀,同期已毕有储性能和容量的等比例彭胀;
可靠性高,可珍重性高,存储节点遴选比拟圭臬管事器更为精简的JBOF,硬件故障率更低,同期JBOF里面遴选冗余的硬件联想来保险可靠性,进步可珍重性;
支执基于RoCE的超大鸿沟组网,遴选RoCE动态路由和细粒度的负载平衡已毕更好的拥塞终局,基于圭臬以太网在大鸿沟RDMA组网中已毕高效带宽, 低抖动和超低时延;
优化的总体领有本钱(TCO),高密度的存储节点+透明盘内压缩+新式软件界说存储软件的组合简化了硬件本钱,大幅度进步了存储空间讹诈成果和读写性能,简化了贬责,AI客户将因此大幅度优化其AI Storage的总体领有本钱(TCO);
基于此决议的KV Cache大鸿沟执久化决议也行将推出🦄九游下载中心_九游游戏中心官网,已毕AI推理集群内的K,V向量的全局分享,巧合以低本钱高性能的大鸿沟存储才气替代AI推理经由中K,V向量的大都肖似运算,已毕AI推理算力本钱的大幅缩小。
声明:新浪网独家稿件,未经授权阻截转载。 -->Powered by 九游下载中心_九游游戏中心官网 @2013-2022 RSS地图 HTML地图