big.LITTLE大小核心双架构已经逐渐普及开来,从三星Exynos 5410到高通骁龙810莫不如此,而它们之所以能做到不同架构核心共存、协同,最关键的地方就是缓存一致性互连架构CCI-400。
ARM还有个更高级的缓存一致性网络CCN-5xx,但仅限于服务器级应用,手机和平板里看不到。
今天,在宣布新的高端CPU Cortex-A72、GPU Mali-T880的同时,ARM还推出了大刀阔斧改造过的新一代缓存一致性互连架构“CoreLink CCI-500”,引入了一系列新功能。
在很大程度上,它的诞生要远比A72、T880有意义得多。
CCI-500最大的变化就是增加了一个“探听过滤器”(Snoop Filter),从而使探听控制不再局限于单个簇内部的CPU之间,可以扩展到整个处理器的所有核心,也就是A72/A57、A53全部覆盖。
这样一来,处理器需要执行的缓存查询工作量就会大大减少,效率自然随之增加,最终的好处就是互连过载降低、CPU核心空闲时间更多。
互连所需的内存带宽也会因此大幅度减少,ARM宣称CPU一端的内存性能可提升30%。
ACE(AXI一致性扩展)端口的数量也翻了一番,系统带宽因此增加一倍,可轻松搞定4K显示输出。
最多支持的CPU簇也从2个增加到4个。理论上讲,你可以在一颗处理器内塞进两组八个A72、两组八个53,从而构成16核心处理器!
当然了,受手机和平板空间、功耗、发热限制,短期内我们不太可能看到这种怪物,但至少有了这个可能性,说不定哪天就会冒出来。
四通道128-bit内存位宽也不再是问题。骁龙805是第一个支持四通道内存的移动处理器,但用的是高通自己设计的非一致性互连架构。以后,谁想做都可以。