GPUDirect RDMA
通过DPU加速卡上GPUDirect RDMA技术实现不同节点上GPU芯片间高效的数据通信能力,避免经过系统内存进而减少了GPU通信的数据复制次数,通信延迟进一步降低,进而有效提升大型并行计算任务的计算效率。
GPUDirect Storage
通过DPU加速卡上GPUDirect Storage(GDS)技术实现GPU芯片与远端存储通过NVMe-oF来实现直接通信能力,避免经过系统内存进而减少GPU与远端存储通信的数据复制次数,通信延迟进一步降低,吞吐能力更高,可有效提升数据密集型计算任务的计算效率。
RoCEv2无损网络
通过与国内主流交换机厂商联合打造的端到端无损网络网络解决方案,实现对RoCEv2网络通信的高可靠能力,高效可靠的拥塞控制能力,为RoCEv2的稳定通信保驾护航。
高效可靠的网络通信能力
• 基于RoCEv2无损网络高效可靠的数据通信能力
• GPUDirect RDMA加速跨节点GPU间的通信能力,助力算力提升
• GPUDirect Storage加速GPU与远端存储的通信能力,实现高吞吐低时延的数据读写
丰富的业务生态伙伴
• 同国内外多个GPU和AI芯片厂家建立合作关系和解决方案共建,适用于多种高性能计算应用场景
• 同国内主流交换机厂家在无损网络方面构建联合解决方案,提供灵活的无损网络解决方案
开放生态和二次开发能力
• 完整的开放生态平台HADOS™,提供充分稳定的软件生态资源
• 详细的开发接口,让开发集成更简单
• 丰富的生态伙伴资源,更多合作与创新
灵活的系统兼容能力
• 适配国内外多个主流CPU平台,提供良好的硬件兼容能力
• 适配国内外多个主流操作系统,提供良好的软件兼容能力
随着高性能计算的发展,大数据、机器学习和AI运算等新兴计算技术对数据同步传输能力的依赖性越来越明显,本方案可以提供与国内外先进厂商相比拟的产品解决方案能力,高效可靠的数据通信基础设施,同时提供更适合国内高性能计算行业的定制化开发灵活性,打造国内高性能计算生态联合解决方案样板。