AI时代,亲民、易用的CPU如何能实现相比GPU更具性价比的加速方案?英特尔® 至强® 可扩展处理器给出答案:内置AI加速引擎,更好地承载人工智能应用工作负载。 千呼万唤始出来,第五代英特尔®️ 至强®️ 可扩展处理器,它来了! 若是用一句话来概括它的特点,那就是——AI味道越发得浓厚。 以训练、推理大模型为例: ●与第四代相比,训练性能提升多达29%,推理性能提升高达42%; ●与第三代相比,AI训练和推理性能提升高达14倍。 什么概念? 现在若是将不超过200亿参数的模型“投喂”给第五代至强®️ 可扩展处理器,那么时延将低到不超过100毫秒! 也就是说,现在在CPU上跑大模型,着实是更香了。 而这也仅是英特尔在此次发布中的一隅,还包括打破自家“祖制”、被称为四十年来最重大架构转变的酷睿™️ Ultra。 此举亦是将AI的power注入到消费级PC中,用于加速本地的AI推理。 除此之外,具体到英特尔长期在各行各业扎根的AI实战应用,包括数据库、科学计算、生成式AI、机器学习、云服务等等,也随着第五代至强®️ 可扩展处理器的到来,在其内置的如英特尔®️ AMX、英特尔®️ SGX/TDX等其他内置加速器的帮助下,得到了更大的降本增效。 总而言之,纵观英特尔此次整场的发布,AI可谓贯穿始终。 最新英特尔处理器,AI更Power了 我们先来继续深入了解一下第五代至强®️ 可扩展处理器披露的更多细节。 例如在性能优化方面,英特尔将各种参数做了以下提升: ●CPU核心数量增加到64个,单核性能更高,每个内核都具备AI加速功能 ●采用全新I/O技术(CXL、PCIe5),UPI速度提升 ●内存带宽从4800 MT/s提高至5600 MT/s 我们再来纵向,与英特尔前两代产品做个比较,那么性能提升的结果是这样的: ●与上一代产品相比,相同热设计功耗下平均性能提升21%;与第三代产品比,平均性能提升87%。 ●与上一代产品相比,内存带宽提升高达16%,三级缓存容量提升至近3倍之多。 不难看出,第五代至强®️ 可扩展处理器与“前任们”相比,在规格与性能上着实是有了不小的提升。 但英特尔可不仅仅是披露,而是已经将第五代至强®️ 可扩展处理器用起来,并把实打实的使用效果展示了出来。 例如在大模型的推理方面,京东云便在现场展示了搭载第五代至强®️ 可扩展处理器的新一代自研服务器所呈现的能力—— 全部以超过20%的性能提升“姿势”亮相! 具体而言,京东云与上一代自研服务器有了如下的性能提升: ●整机性能提升达123%; ●AI计算机视觉推理性能提升至138%; ●Llama 2推理性能提升至151%。 这也再一次证明了在五代至强®️ 上搞大模型,是越发得吃香了。 而除了大模型之外,像涉及AI的各种细分领域,如整机算力、内存宽带、视频处理等等,也有同样的实测结果。 这份结果则是来自采用了第五代英特尔® 至强® 可扩展处理器的火山引擎—— 其全新升级的第三代弹性计算实例,整机算力提升39%;应用性能最高提升43%。 而且在性能提升的基础上,据火山引擎透露,通过其独有的潮汐资源并池能力,构建了百万核弹性资源池,能够用近似包月的成本提供按量使用体验,上云成本更低了! 这是由于使用内置于第五代至强®️ 可扩展处理器中的加速器时,可将每瓦性能平均提升10倍;在能耗低至105W的同时,也有已针对工作负载优化的高能效SKU。 可以说是实打实的降本增效了。 在云计算和安全性方面,亮出实测体验的同样是来自国内的大厂——阿里云。 在搭载第五代英特尔® 至强® 可扩展处理器及其内置的英特尔® AMX、英特尔® TDX加速引擎后,阿里云打造了“生成式AI模型及数据保护“的创新实践,使第8代ECS实例在安全性和AI性能上都获得了显著提升,且保持实例价格不变,普惠客户。 包括推理性能提高25%、QAT加解密性能提升20%、数据库性能提升25%,以及音视频性能提升15%。 |