第四代英特尔至强“神器”深入解析:轻松提升数倍性能 更节电节成本

虽然在日常生活中,大多数普通用户无法接触到服务器和数据中心平台,但一方面,我们使用的许多软件和互联网服务都是由数据中心默默支持的,另一方面,大量先进的计算技术首先应用于数据中心并惠及消费者平台。

所以,数据中心看似遥远,其实就在我们身边。

今年1月11日,英特尔正式发布了第四代至强可扩展处理器(以下简称第四代至强),集成HBM高带宽内存的至强Max系列,以及代号为Ponte Vecchio的数据中心GPU Max系列。

虽然乍一看,第四代至强有些规格不如竞品,但实际上,英特尔现在追求的不再是单一的产品参数,而是更强大、更灵活、面向未来的综合计算平台。

第四代英特尔至强“神器”深入解析:轻松提升数倍性能 更节电节成本

英特尔营销集团副总裁、中国区数据中心销售总经理、中国区运营商销售总经理庄指出,虽然英特尔传统上被认为是一家CPU处理器公司,但在多元化的数字和数据时代,英特尔提出了全新的XPU战略,通过提供CPU、GPU、FPGA、IPU等多种异构产品,为不同的业务和应用场景提供定制化的计算解决方案。

除了硬件,英特尔的软实力也不容小觑。它拥有大规模的软件团队和研究所。毕竟强大的软件是充分释放硬件潜力的关键。

尤其是在开源方面,英特尔一直很大方,为开源生态系统和社区贡献了很多软件架构,这也有利于推动英特尔产品的应用和生态系统的扩大。

第四代英特尔至强“神器”深入解析:轻松提升数倍性能 更节电节成本

第四代至强不仅拥有Intel 7的先进技术和全新架构,以及业界领先的DDR5、PCIe 5.0和CXL 1.1,还引领加速器新潮流。

第四代至强发布时,英特尔强调它有七大神器,包括高级矩阵扩展(AMX)、动态负载平衡器(DLB)、数据流加速器(DSA)、内存分析加速器(IAA)、数据保护和压缩加速技术(QAT)、安全引擎(。

这些加速器不会改变现有的算法,但仍然会加速算法的计算,从而提高效率,节省时间,并允许客户进一步设计新的算法。

官方数据显示,第四代至强通过内置的丰富加速器使目标工作负载的平均能效(性能功耗比)比上一代产品提高了多达2.9倍,在优化功耗模式下,每颗处理器最多可节省70瓦,性能影响极低,总拥有成本也降低了52-66%。

具体应用实例,如腾讯利用AMX提高搜索和视频服务效率;比如JD.COM用IAA和DSA提升舒天服务器性能1.7倍以上;比如阿里云第八代ESC实例整体计算能力提升60%,数据库读写性能提升15%,加解密和压缩解压性能提升4倍,AI推理性能提升4倍;比如火山引擎第三代弹性计算实例,提升了整体计算能力、单项计算能力、网络转发、IOPS存储、加密解密、AI推理加速等等。

英特尔技术专家还分享了第四代至强加速器在几个具体应用场景中的体现:

-阿里的地址标准化服务(如淘宝收货地址定位),采用AMX INT8加速和软件优化,单位时间查询性能提升2.48倍。

-淘宝APP首页定制推荐服务,使用AMX BF16,软件优化,AVX-512调优,性能提升3倍。

-部署在腾讯云上的太极机器学习平台支持的搜索和广告服务,使用AMX BF16/INT8,高精度实例性能提升3倍,低精度实例性能提升2倍,云服务实例所需CPU数量大幅减少。

-稳定的扩散注意机制,使用AMX BF16加速矩阵计算,使用AVX-512加速指数计算,配合PyTorch插件,吞吐性能提升3.82倍。

-亚信电信营业厅OCR方案,AMX软硬件优化,性能提升3.94倍。

-用友ERP OCR服务通过AMX BF16/INT8加速,性能提升2.83倍。

-clickhouse大数据分析数据库,使用IAA,Q4.1压缩解压缩性能提升40%。

详细说明:MongoDB数据库,使用IAA,性能提升47%。

-DML、DPDK、SPDK等软件库都集成了DSA,可提升性能2.25倍,节省CPU资源66%。

-微软SQL Server,有了QAT加速,备份时间可以缩短2/3,性能可以提升1.34倍。

-Gbase8A并行数据库,使用IAA,ZSTD压缩算法性能提升1.84倍,RapidZ压缩算法性能提升1.66倍。

第四代英特尔至强“神器”深入解析:轻松提升数倍性能 更节电节成本

第四代至强发布后, Intel加入了vRAN Boost,全面集成了物理层的加速功能,不再需要单独的加速卡,成为第四代至强的新神器。”

使用该加速器,运营商可以在通用虚拟化平台上集成所有基站层,从而用一个通用处理器实现基站功能。

与上一代产品相比,vRAN Boost加速器可以在不增加功耗的情况下提供两倍的容量,同时节省高达20%的能耗,满足关键的性能、扩展和能效要求。

英特尔技术专家指出,过去CPU处理器的发展趋势是简单地提高频率和核心数量。然而,对于互联网客户,有越来越多的特殊要求,如压缩和解压缩,加密和解密等。更多的核心和更高的频率可能不会带来足够的效率提升,但提供一个专用的加速器会有奇效,比异构计算更接近内存。

同时,随着客户和行业越来越重视能效,加速器也是提高能效比的有效途径。

当然,集成加速器会增加处理器设计的难度,影响验证上市的时间,也会增加生态适配的难度,这体现了英特尔强大的行业影响力和号召力,可以促进生态支持,保证产品推出时可以支持大量的软件服务。

值得一提的是,并不是每个客户都需要这么多加速器,所以英特尔还提供了一种全新的按需服务。客户可以根据实际需求灵活选择不同的加速器,也可以根据使用情况进行切换和付费。

第四代英特尔至强“神器”深入解析:轻松提升数倍性能 更节电节成本

庄还指出,随着“双碳”、新基础设施和“东西向计算”的推进,未来数据中心的能耗需求越来越严格,绿色计算成为可持续发展的关键驱动力。

第四代至强集成的许多加速器可以以更高的效率和更低的能耗处理这种越来越苛刻和复杂的工作负载,换句话说,可以用更少的能耗完成更多的工作,并且还辅助了一系列新的电源管理方案,以进一步提高能效。

在制造过程中,英特尔90%以上的用电都是可再生能源,第三代和第四代至强提供浸没式液冷方案一年保修服务,这在业界是唯一的。

所有这些使得第四代至强处理器成为最具可持续性的数据中心处理器。

第四代英特尔至强“神器”深入解析:轻松提升数倍性能 更节电节成本

英特尔至强可扩展处理器诞生于2017年,迄今已交付超过8500万台,其中近两年第三代出货1500万台。

最新的第四代产品已经完成了400多种不同的设计方案,目前已经出货200多种。十大云服务提供商今年将部署基于新至强处理器的云实例。

面向未来,随着计算市场需求的提升和应用的拓展,英特尔也在有针对性地开发新产品,目前进展顺利。

比如2023年将推出下一代翡翠激流,2024年将迎来新变化。基于性能核心的Granite Rapids和基于能效核心的Sierra Forest将升级到Intel 3制造工艺,集成更多核心,非常适合微服务和容器化场景。

总的来说,英特尔至强可扩展平台已经跳出了传统的单纯拼参数的窠臼,进入了一个全新的加速器时代。通过针对特定负载和应用需求进行加速,可以以更灵活的方式实现更高的效率和更低的能效,更适合多元化的新计算时代。

这样,新的至强不仅为客户实现了更高的经济效益,也顺应了全球节能减排和绿色可持续发展的趋势,也让我们对未来至强可扩展平台的发展有了更高的期待。

本文内容及图片均整理自互联网,不代表本站立场,版权归原作者所有,如有侵权请联系admin#jikehao.com删除。
(0)
极客号的头像极客号
上一篇 2023年 4月 1日
下一篇 2023年 4月 1日

相关推荐

合作联系:1152QQ041010