Pluribus利用NVIDIADPU来提升分布式计算

皇甫盛杰
导读 自计算诞生以来,网络与计算架构一起发展。从大型机到客户端服务器再到分支机构计算,网络必须通过自身的演进过程跟上步伐。今天,计算已经

自计算诞生以来,网络与计算架构一起发展。从大型机到客户端服务器再到分支机构计算,网络必须通过自身的演进过程跟上步伐。今天,计算已经变得高度分布式,这正在推动另一个重大转变:为了保持有效,网络现在必须是分布式的。

分布式云需要分布式网络

在过去十年中,集中式云一直是常态,部署为公共云或私有云。边缘创新催生了分布式云计算,其中计算结构将跨越公共、私有和边缘位置。这使企业可以将数据和工作负载移近用户,从而改善客户和员工体验。

既然云中的计算已经迈出了进化的一步,网络基础设施正在积极过渡到分布式模型,使其能够高度敏捷并以云的速度移动。此外,零信任等现代安全技术需要转向以网络为中心的模型,以保护分布式数据、工作负载和计算资源。

Pluribus 将其 Fabric 扩展到 NVIDIA DPU

尽管网络不断发展,今天的组织仍然面临着许多与分散网络、专有解决方案和高运营成本相关的网络挑战。Pluribus Networks相信它通过开发专为分布式云设计的解决方案找到了应对这些挑战的解决方案。该供应商最近将其交换结构扩展到NVIDIA 的 BlueField 数据处理单元 (DPU),以减少跨分布式基础架构的中央处理单元 (CPU) 的工作负载。

根据Pluribus 的2021 年数据中心网络状况报告中的数据,到 2023 年,大约 25% 的工作负载将在公共云中,而大部分(75%)工作负载将留在私有(非超大规模)环境中。报告发现,云网络面临的两大挑战是网络架构复杂性和网络运营复杂性,这两者都源于碎片化、不完整的解决方案。

NVIDIA 和更多公司拥有共同愿景

过去一年,Pluribus 一直与 NVIDIA 合作,以实现其“统一云网络”的愿景。也就是说,跨分布式云提供统一、简化、安全的网络。基础是 Pluribus 的统一云结构,这是其自适应云结构的下一阶段,它提供具有内置可见性和软件定义网络 (SDN) 自动化的统一底层和覆盖网络。

Unified Cloud Fabric 由 Pluribus 基于 Linux 的网络操作系统 Netvisor ONE 提供支持。Pluribus 已将 Netvisor ONE 移植到 BlueField,提供跨交换机和 DPU 的通用操作系统。因此,存储、网络、安全和管理工作负载从传统服务器中卸载。

DPU 减轻服务器负载

“DPU 就像一个迷你服务器和交换机,”Pluribus 的首席营销官 Mike Capuano 在一次采访中告诉 ZK Research。

“它所做的事情总是在架顶式交换机上完成,但现在以紧凑的形式存在于服务器中,并且具有比您更强大的处理能力和硬件加速来卸载网络和安全功能会在大多数开关中找到。现在这个小包裹里有这么多的力量。我们可以以高度分布式的方式完成所有这些复杂的事情。”

拥有跨交换机和 DPU 的通用操作系统可从网络中的任何节点提供单点管理。例如,如果一个组织决定部署一项新服务,如虚拟局域网 ( VLAN ),它可以从交换机的任何位置执行此操作。该服务在整个网络中传播,并且独立于在服务器上执行的管理。

在服务器中的 DPU 中启用网络后,除了每个服务器中运行的 DPU 之外,不需要交换机或任何其他网络硬件。它可以存在于组织部署服务器的任何环境中。因此,如果一个组织部署了数百个 DPU,它可以减少服务交付时间,而不是手动逐个配置。

通过这种方法,Pluribus 希望将网络功能驱动到服务器中的 DPU,以创建一个真正的零信任环境,其中在单个应用程序级别进行分段,但不牺牲性能和用户体验。使安全性更接近应用程序的现有虚拟防火墙既昂贵又影响CPU性能。Capuano 说,DPU 方法是实现分布式安全和网络的更好方法。

“有许多解决方案可以防止黑客入侵,他们可以进入外围安全。目前,有基于设备的模型和纯软件模型,它们都需要权衡取舍。我们认为我们可以做得更好,”Capuano 补充道。

DPU 提供更好的成本效率

采用 DPU 模型的组织可以避免软件许可和硬件设备激增的成本,因为这些功能已从 CPU 中卸载。NVIDIA 和亚马逊等行业领导者估计 DPU 可将 CPU 的负载降低 25% 到 30%。它们还为任何工作负载或虚拟化环境提供一致的网络。

但是,大多数组织不会在未来几年或可能永远不会在任何地方部署 DPU。这就是 Pluribus 的统一网络概念发挥作用的地方,它通过 DPU 在交换机和服务器之间提供通用网络结构和操作模型。

Capuano 说,一些客户已经承诺使用该解决方案。在一个客户用例中,一家为电信公司提供集成解决方案的供应商开发了自己的虚拟化应用程序堆栈,以将数据从卫星地面站传输出去。提供商能够将基于虚拟软件的网络功能卸载到 DPU 上以获得更好的性能。

Pluribus 将于 4 月下旬开始其统一云网络的早期现场试验。最终目标是通过跨多个维度(交换机和服务器)统一网络来解决分散的环境,同时提供分布式安全性和可见性。

标签:

版权声明:本文由用户上传,如有侵权请联系删除!