DPU算网融合解决方案

DPU算网融合解决方案
方案背景
算网融合是以通信网络与异构计算融合发展为基石,将数据、计算与网络等多种资源进行统一编排管控,实现网络融合、算力融合和数据融合的一种新趋势和新业态。要实现网络和计算的深度融合,需要网络能够感知计算、融合计算,从业务依托网络向网络服务业务转变。作为算网融合枢纽节点的算网网关和作为算力节点入口的 DPU,在网络演进中扮演着重要角色。中科驭数的算网融合解决方案,能够基于 DPU 构建算网网关和算力网络在计算节点中的高效代理,实现算力灵活编排与调度。
行业痛点
传统网关设备算力感知能力滞后
要实现算力网络算网信息的有效分发和路由调度,核心问题是如何让网络获取并通告算力信息。传统网关设备对新的算力网络核心协议支持滞后,难以满足算力感知和路由的需求。
传统网关缺乏多功能网元融合的灵活可组合能力
算网网关的设计需要重点关注并充分考虑多功能网元融合的灵活可组合能力以及异构平台的统一编程能力。传统网关设备编程灵活性不足,在多功能网元融合方面捉襟见肘。
NFV在特定任务处理上的性能不足
NFV采用通用X86 CPU来保证通用性,但是X86 CPU并不擅长处理特定任务,比如处理编解码转换、报文转发、加解密等并行任务处理。
普通网卡缺少数据加速和算网管理能力
普通网卡不具备数据加速和算网管理能力,无法满足算力网络场景下的状态遥测、链路保障、流量工程等增强功能的要求。
解决方案描述
中科驭数算网融合解决方案采用了自研的全功能 DPU 产品,结合高性能 CPU 构建高效算网网关,为应用提供一个异构、高效、可扩展的数据面。通过 P4 可编程能力,不仅可以简化加速应用开发,还可以对异构流水线进行定制。另外,DPU可以在算力网络末端算力节点上实现高效代理,兼顾数据加速和算网管理能力,实现状态遥测、链路保障、流量工程等算力网络场景下的增强功能。
方案特点
高效算网网关架构
CPU+DPU架构保证良好的通用性、扩展性和灵活性,提供更高的性能和服务质量。 基于RoCEv2和无损网络提供高效可靠的数据通信能力。 NFV网络功能硬件加速,提高吞吐降低功耗。 支持Multi-Host技术,可连接多路CPU。
基于P4的灵活软件架构
基于P4的异构平台统一编程能力,面向网元业务统一接口适配,实现和多功能网元相融合的灵活可组合能力。 通过P4编程进行异构流水线定制化,支持在CPU、DPU以及可编程交换芯片上构建高效数据面流水线。
计算节点性能提升
提供OVS虚拟网络硬件加速,释放主机CPU算力,降低网络时延。 高性能存储协议NVMe-oF/Ceph/iSCSI硬件卸载,提供高性能存储服务。 提供“内联式”安全处理流程,实现更高级别安全,释放了CPU资源。
易运维,低TCO成本
搭载自研的DeepInsight™硬件日志监控技术,实时监测硬件系统问题。 低功耗设计,软硬件协同优化,充分降低整体功耗和TCO。
相关产品
方案价值
作为国家战略、行业发展、技术演进的必然趋势,算网融合已经成为行业关注焦点。本方案可以提供和业界头部厂商相媲美的方案能力,通过算网网关和 DPU 实现算力灵活调度编排,大幅提升性能并降低能耗,推进网络与计算的深度融合。