【Cortex-M7架构解析】
虽然很小很小,M7的首要使命却是高性能,号称达到了前所未有的水平,同时还要维持该系列一贯的超小面积、超低功耗。
之所以努力提升性能,ARM一是希望和传统的8/16位产品进一步拉开档次(M7 32位的),二就是满足可能的下一个爆发点:物联网(IoT)、可穿戴设备,特别是增强了DSP处理能力后,M7比以往更适合作为音频和视觉传感中心。
当然,对于传统的工控、汽车等应用领域,它也是如鱼得水。
架构上,M7具备六级、顺序、双发射超标量流水线,拥有单精度、双精度浮点单元、指令和数据缓存、分支预测、SIMD支持、紧耦合内存(TCM)。
指令和数据缓存、分支预测、TCM都是以往M系列上没有的。MCU经常不考虑缓存,有时候甚至将闪存作为唯一的内存接口。通过加入高性能的指令和数据缓存(最大均为64KB),M7开始向典型的高性能处理器设计靠拢。
TCM之前也只在A、R系列上存在,可以用来扩展M7的有效缓存,最大容量16MB,是MCU物理内存映射的一部分。
它可以拥有真正缓存的性能,但其内容是直接由开发者控制的,可以放置一些关键的代码和数据供,通过中断服务请求等途径来访问,而且性能很高。
分支预测的加入则可以让M7用于独立的DSP服务。代码运行在始终开启的MCU上时,几乎总是会不停循环。如果没有分支预测器,代码必须不断评估循环状况,但其中99.9%的时候结果都是同一路径。当然了,分支预测器会消耗一些核心面积,但对于DSP应用来说是值得的。
由于ARM Cortex处理器都是只卖授权,具体产品得看合作伙伴的实现情况,因此现在没办法确切地讨论面积、功耗、性能等指标,也没办法估算。
ARM唯一提到的就是能耗比和以前是同样的水平,那么鉴于理论性能增加了50-70%,功耗也会付出这么大的代价。