ARM的年度TechDay活动中,ARM宣布了Cortex-A77 CPU内核。在发布Cortex-A77的同时,还发布了ARM Mali-G77 GPU,这是第一款具有全新“ Valhall” GPU架构的GPU。这两款产品一起共同替代了去年的Cortex-A76 CPU和Mali-G76 GPU。

英国的ARM公司于2016年被日本的软银收购,是技术行业最重要的公司之一。世界上每个智能手机都由ARM的指令集提供支持。高通公司使用半定制的“ Made for Cortex”许可,该许可允许该公司在其产品中纳入ARM CPU IP的定制变体(例如,Kryo 485 Gold是Cortex-A76的半定制变体)。华为的海思集团是 ARM CPU IP的另一个重要授权商,使用ARM CPU核心版本的现有版本,而Samsung Systems LSI和Apple在ARM指令集之上使用完全自定义的内核。三星和海思半导体还为其内部SoC许可了ARM的Mali GPU,而高通和苹果则选择使用其自定义GPU解决方案(例如,高通使用自己的Adreno GPU)。

这就是为什么当ARM发布新公告时,它将对智能手机行业产生重大影响的原因。好消息是,ARM在制造新的CPU微体系结构方面已经走了一段时间。Cortex-A72,Cortex-A73和Cortex-A75都是受人尊敬的设计,弥补了Cortex-A57的错误。但是,去年的Cortex-A76在性能方面迈出了一步,因为它承诺“笔记本电脑级性能”,与已经具备功能的Cortex-A75相比,性能提高了35%。因此,高通承诺通过Snapdragon 855将性能提高45%,这是有史以来Snapdragon SoC的最大性能提升。

在IPC,PPA和效率领域,Cortex-A76表现出色。它具有业内最佳的PPA,且模具面积较小。它的确受益于台积电出色的7nm FinFET工艺,但它带来的IPC改进也赢得了成功。尽管解码宽度较窄(4宽vs. 6宽),但它在Exynos 9810中仍胜过三星的Exynos M3自定义核心。即使今年在Exynos 9820中发布的Exynos M4内核仍不足以夺取ARM的性能优势(尽管确实弥补了差距),因为Cortex-A76 仍享有性能和效率优势通过Exynos M4。(Exynos的劣质制造工艺也使它失望:8nm LPP与7nm FinFET)。特别是,Cortex-A76的能源效率令人难以置信。使用Cortex-A76的SoC包括旗舰SoC,例如HiSilicon Kirin 980和Qualcomm Snapdragon 855,但我们也已经开始以Qualcomm Snapdragon 675和Snapdragon 730 / 730G的形式在中端SoC中看到它。对性能的影响是有效的。

在移动领域,就每时钟指令(IPC)而言,Cortex-A76仍不如Apple A11和Apple A12上的Apple定制内核。但是,ARM尚未显示出提高速度的迹象。8月,该公司公布了其CPU核心路线图,其中包括基于Cortex-A76的2019年“ Deimos”内核和2020年的“ Hercules”内核。令人印象深刻的是,该公司承诺Austin核心系列中的每个新芯片组每年的性能复合年增长率将提高20-25%。ARM正在前进。

Cortex-A77是“ Deimos” CPU内核,它将在2019年末和2020年初推出旗舰SoC。它是Cortex-A76的演变,是Austin核心系列的第二次迭代。CPU是A76的直接微体系结构的后继产品,其大多数核心功能相同。供应商将可以轻松地升级SoC IP。在体系结构方面,它仍然是ARM v8.2 CPU内核,可以与Cortex-A55“小”内核配对,而不是与DynamIQ共享单元(DSU)集群配对。

Cortex-A77的缓存大小为:64KB L1指令和数据缓存,256和512KB L2缓存以及多达4MB共享L3缓存。性能的提高必须来自微体系结构的改进,因为内核的频率不会改变(ARM仍然像A76一样瞄准3GHz,但与A76一样,我们很可能会看到厂商出货的时钟频率更低的设计)。下一代SoC的工艺改进预计不会像2018年那样重要。(TSMC今年已转向7nm EUV工艺,这很可能将成为下一代Kirin和Snapdragon芯片组的基础。)

因此,Cortex-A77具有改进的微体系结构,可将性能提高20%-35%。A76在架构上与其前代产品有所不同,它旨在作为Austin核心系列的下两个设计的基准:2019年的Cortex-A77和2020年的“大力神”。

ARM的主要目标是增加架构的IPC,并继续专注于提供业界最佳的PPA(功率,性能和面积)。A76的面积大小和能效优势仍将是A77的优势。

在微体系结构方面,ARM发生了很大变化。在前端,核心具有更高的获取带宽,并且品牌预测器功能增加了一倍,新的宏OP缓存结构充当L0指令缓存,新的整数ALU流水线,并修改了加载/存储队列和发布功能。拖曳中还包含动态代码优化,有关详细信息,请参见ARM的博客文章。解码宽度保持为4宽。

核心的后端也包含改进,我建议用户阅读 AnandTech的报道以获取更多详细信息。ARM添加了附加的整数ALU。数据预取器也得到了改进,根据AnandTech的说法,考虑到A76已经具有出色的预取器,这是一个好消息 。添加了新的其他预取引擎,以提高预取精度。所有这些都与核心的内存子系统有关,这是一个基本方面。CPU的内存子系统包括内存等待时间和内存带宽。

ARM承诺将Cortex-A77的性能提高20-35%

据ARM称,Cortex-A77的IPC单线程性能比其前身Geekbench 4高20%,SPECint2006高23%,SPECfp2006高35%,SPECint2017高20%,SPECfp2017高25%。所有这些均以7nm工艺和3GHz频率进行投影。如果这些改进得以实现,则下一代SoC可以为未来的智能手机带来惊人的性能和电池寿命体验。FP的改进尤其是重大的世代改进。当然,A77不会没有竞争,因为三星将在2020年推出Exynos M5,在此之前,苹果的A13肯定会成为新iPhone的一部分。

ARM还指出,A77的能效将保持与A76 SoC相同。这意味着最高性能,CPU内核将使用相同量的能量(以焦耳为单位)来完成任务。但是,功率和能量是两个不同的概念。A77的功耗将随性能的提高而线性增加。这可能会导致电话中的TDP限制问题。为了应对这种情况,我们已经看到主要供应商采用大+中+小非常规的核心配置(在HiSilicon的情况下为2 + 2 + 4,在高通的情况下为1 + 3 + 4)。A77也将比A76大17%,这意味着它仍有望拥有一流的PPA。

我一直是A76实施的忠实拥护者,因为它即使在Snapdragon 675等中端SoC中也能很好地工作。Snapdragon 855和Kirin 980都是高性能的旗舰SoC,我迫不及待想要了解下一代SoC中A77实施带来的改进水平。ARM表示,其主要客户仍将重点放在拥有最佳PPA上,并且很容易看出该公司在这方面提供了最佳解决方案。

我们何时才能在SoC中看到A77?在最近与华为发生动荡的事件之前,我曾说过,HiSilicon Kirin 985肯定会在2019年配备A77和Mali-G77 GPU,以实现真正的下一代SoC。但是,ARM决定与双方保持联系与华为合作,我怀疑这是否有可能,除非与华为的可燃情况在未来几周内得到解决。高通公司的下一个旗舰级骁龙SoC可能要到2020年第一季度才能交付给消费者,因此希望使用ARM最新CPU内核的消费者可能需要等待一段时间。