ARM体系结构变化

合集下载

第二章 ARM9体系结构ppt课件

ARM7TDMI,ARM710T,ARM720T ARM740T Strong ARM，ARM8，ARM810 ARM9TDMI，ARM920T，ARM940T
ARM9E-S ARM10TDMI，ARM1020E ARM11，ARM1156T2-S，ARM1156T2F-S， ARM1176JZ-S，ARM11JZF-S
.
2.1.1 ARM公司简介
ARM公司是知识产权IP （ Intellectual Property ）公司，本身不生产芯片，只转让设计许可，由合作伙伴公司来生产各具特色的芯片。
目前，全世界有几十家著名的半导体公司都使用 ARM公司的授权，其中包括Intel、IBM、 MOTOROLA、SONY、NEC、LG 、 ATMEL 等，从而保证了大量的开发工具和丰富的第三方资源，它们共同保证了基于ARM处理器核的设计可以很快投入市场。
灵活方便的协处理器接口
ARM体系结构具有协处理器接口，允许接16 个协处理器。既可以使基本的ARM处理器内核尽可能小，方便地扩充ARM指令集，也可以通过未定义指令来支持协处理器的软件仿真。
低电压功耗的设计
考虑到ARM处理器主要用于手持式嵌入式系统中，在设计中. 就十分注意功耗的设计。
2.1.3 ARM指令系统版本
难以优化编译成高效目标代码
能优化编译成高效目标代码
.
2.1.2 ARM体系结构的特点
多种处理器模式 ARM体系结构定义了7种处理器模式：用户、快中断、中断、管理、终止、未定义和系统模式，大大提高了ARM处理器的效率。
两种处理器工作状态 ARM状态(32位指令)和Thumb状态(16位指
令) 。虽然ARM处理器本身是32位设计，但考虑到

ARM技术概述

异常类型向量地址优先级含义 * 复位（Reset） 0x00000000 1
0x00000004 未定义的指令（Undefined Instruction）软件中断（SWI） 0x00000008
6
6
指令预取中止（Prefetch Abort）数据访问中止（Data Abort）外部中断请求（IRQ）
Thumb的技术概述
由从标准32位ARM指令集抽出来的36条指令格式，重新编成16位的操作码，带来很高的代码密度。支持Thumb的处理器状态可方便地切换、运行到Thumb状态。
Thumb的技术特点
与ARM指令集相比，Thumb指令集具有以下局限
完成相同的操作，Thumb指令通常需要更多的指令，因此在对系统运行时间要求苛刻的应用场合，ARM指令集更为适合 Thumb指令集没有包含进行异常处理时需要的一些指令，因此在异常中断时，还是需要使用ARM指令，这种限制决定了Thumb指令需要与ARM指令配合使用
ARM体系结构的演变
通常将具有某些特殊功能的ARM体系称为它的某种变种，目前为止ARM定义了 T变种 M变种 E变种 J变种 SIMD变种
Thumb指令集（T变种）
把32位ARM指令集的一个子集重新编码后形成的一个特殊的16位指令集。 ARMV4T为版本1，ARMV5T为版本2 版本1和版本2的演化：
ARM寄存器组成概述
31个通用寄存器：R0-R15,R13R14(svc,abt,und,irq)，R8-R14(frq) 6个状态寄存器：CPSR， SPSR(svc,abt,und,irq,frq) 共37个寄存器
ARM状态的寄存器简介
当ARM处理器工作在ARM状态下时，在寄存器的物理分配上，寄存器被安排成重叠的组。在不同工作模式下特有的寄存器称为影子寄存器

Cortex系列ARM核心及体系结构简介.

众所周知，英国的ARM公司是嵌入式微处理器世界当中的佼佼者。

ARM一直以来都是自己研发微处理器内核架构，然后将这些架构的知识产权授权给各个芯片厂商，精简的CPU架构，高效的处理能力以及成功的商业模式让ARM公司获得了巨大的成功，使他迅速占据了32位嵌入式微处理器的大部分市场份额，甚至现在，ARM芯片在上网本市场的也大有与INTEL的ATOM处理器一较高低的实力。

目前，随着对嵌入式系统的要求越来越高，作为其核心的嵌入式微处理器的综合性能也受到日益严峻的考验，最典型的例子就是伴随3G网络的推广，对手机的本地处理能力要求很高，现在一个高端的智能手机的处理能力几乎可以和几年前的笔记本电脑相当。

为了迎合市场的需求，ARM公司也在加紧研发他们最新的ARM架构，Cortex系列就是这样的产品。

在Cortex之前，ARM核都是以ARM 为前缀命名的，从ARM1一直到ARM11，之后就是 Cortex系列了。

Cortex在英语中有大脑皮层的意思，而大脑皮层正是人脑最核心的部分，估计ARM公司如此命名正有此含义吧。

一．ARMv7架构特点下表列出了ARM微处理器核心以及体系结构的发展历史：表一: ARM微处理器核心以及体系结构的发展历史我们可以看到，Cortex系列属于ARMv7架构，这是ARM公司最新的指令集架构，而我们比较熟悉的三星的S3C2410芯片是ARMv4架构，ATMEL公司的AT91SAM9261芯片则是ARMv5架构。

ARMv7架构是在ARMv6架构的基础上诞生的。

该架构采用了Thumb-2技术，Thumb-2技术是在ARM的Thumb代码压缩技术的基础上发展起来的，并且保持了对现存ARM解决方案的完整的代码兼容性。

Thumb-2技术比纯32位代码少使用 31％的内存，减小了系统开销。

同时能够提供比已有的基于Thumb技术的解决方案高出38％的性能。

ARMv7架构还采用了NEON技术，将DSP和媒体处理能力提高了近4倍，并支持改良的浮点运算，满足下一代3D图形、游戏物理应用以及传统嵌入式控制应用的需求。

arm指令集发展史

ARM指令集是一种用于处理器架构的指令集体系结构。

它最初由英国公司ARM Holdings开发，并广泛应用于各种嵌入式系统、移动设备和低功耗应用中。

以下是ARM指令集的发展史：1. ARM1：ARM指令集最早出现在1985年的ARM1处理器上。

ARM1是一款32位处理器，采用精简指令集(RISC)设计理念，具有较低的能耗和成本。

2. ARM2：ARM2处理器于1987年发布，增加了对乘法指令的支持，并引入了缓存技术来提高性能。

3. ARMv3：ARMv3指令集体系结构于1992年推出，支持更多的指令和功能，如虚拟内存管理单元(VMMU)和协处理器。

4. ARMv4：ARMv4指令集体系结构于1995年发布，引入了Thumb指令集，可以以压缩的形式执行16位指令，提高了代码密度和节能效果。

5. ARMv5：ARMv5指令集体系结构于1997年推出，引入了Jazelle技术，使处理器能够直接执行Java字节码。

6. ARMv6：ARMv6指令集体系结构于2002年发布，引入了Thumb-2技术，将16位Thumb指令和32位ARM指令混合使用，提高了代码密度和性能。

7. ARMv7：ARMv7指令集体系结构于2004年发布，引入了NEON SIMD(单指令多数据)扩展指令集，提供更高的并行计算能力。

8. ARMv8：ARMv8指令集体系结构于2011年推出，是一个重要的里程碑，引入了64位处理器架构(AArch64)，并保持了与之前32位指令集的向后兼容性。

9. ARMv9：目前(2024年)尚未发布，但ARM Holdings已经透露正在研发ARMv9指令集体系结构。

ARMv9预计将进一步提升性能、安全性和AI加速能力。

上述是ARM指令集的主要发展历程，每个版本都带来了新的功能和改进，使ARM成为全球最受欢迎的处理器架构之一，并广泛应用于各个领域。

ARM体系架构解析ppt课件

1）程序存储器与数据存储器分开.
2）提供了较大的存储器带宽，各自有自己的
总线。
3）适合于数字信号处理.
4）大多数DSP都是哈佛结构.
5）ARM9是哈佛结构
6）取指和取数在同一周期进行，提高速度，
改进哈佛体系结构分成三个存储区：程序、数据、
程序和数据共用。
经营者提供商品或者服务有欺诈行为的，应当按照消费者的要求增加赔偿其受到的损失，增加赔偿的金额为消费者购买商品的价款或接受服务的费用
6）将结果回写到寄存器组（res）
经营者提供商品或者服务有欺诈行为的，应当按照消费者的要求增加赔偿其受到的损失，增加赔偿的金额为消费者购买商品的价款或接受服务的费用
流水线技术
❖
三级流水线技术
经营者提供商品或者服务有欺诈行为的，应当按照消费者的要求增加赔偿其受到的损失，增加赔偿的金额为消费者购买商品的价款或接受服务的费用
因此，把它称为流水线工作方式。
处理器按照一系列步骤来执行每一条指令。典
型的步骤为：
1）从存储器读取指令（fetch）
2）译码以鉴别它是哪一类指令（dec）
3）从寄存器组取得所需的操作数（reg）
4）将操作数进行组合以得到结果或存储器地址（exe）
5）如果需要，则访问存储器存取数据（mem）
冯·诺依曼体系的特点
1）数据与指令都存储在同一存储区中，取指
令与取数据利用同一数据总线。
❖ 2）被早期大多数计算机所采用
❖ 3）ARM7——冯诺依曼体系
❖
结构简单,但速度较慢。取指不能同时取数据
经营者提供商品或者服务有欺诈行为的，应当按照消费者的要求增加赔偿其受到的损失，增加赔偿的金额为消费者购买商品的价款或接受服务的费用

ARM体系结构详解精

ARM嵌入式系统第2章ARM体系结构ARM微处理器的编程模型♦ARM徴处理器的工作状态♦ARM体系结构的存储器格式♦ARM体系结构的指令长度及数据宽度♦ARM微处理器的处理器模式♦ARM体系结构的寄存器组织♦ARM微处理器的异常状态字、半字、字节字（Word）在ARM体系结构中，字的长度为32位半字（Half-Word）在ARM体系结构中，半字的长度为16位字节（Byg）在ARM体系结构中，字节的长度为8位。

ARM微处理器的工作状态（1）字对齐：四字节对齐半字对齐：两字节对齐两种状态:♦ARM状态：处理器执行32位的字对齐的令♦Thumb状态：处理器执行16位的、半字对齐的Thumb指令处理器工作状态的转变并不影响处理器的工作模式和相应寄存器中的内容。

I ARM微处理器的工作状态(2 )状态切换：BX {<cond>} <Rm><cond>指令的条件码。

忽略时无条件执行。

<Rm>子存器中为跳转的目标地址，当<Rm><存器的bit[O]为0时, 目标地址处的指令为ARM指令；当<Rm>^存器的bit[O]为1时，目标地址处的指令为Thumb 指令。

伪代码：if ConditionPassed(cond) thenT Flag=Rm[O]PC=Rm AND OxFFFFFFFEARM微处理器在复位或上电时处于ARM状态，发生异常时处于ARM状态。

右ARM体系结构的存储器格式(1)ARM体系结构所支持的最大寻址空间为4GB (2^字节)♦大端格式(Big Endian)字数据的高字节存储在低地址中，而字数据的低字节则存放在高地址中。

♦小端格式(Little Endian)低地址中存放的是字数据的低字节，高地址存放的是字数据的高字节。

字地址字地址右ARM 体系结构的存储器格式(2)(0H)=0123H (4H)=4567H (8H)=89ABHBig Endian(0H)=3210H (4H)=7654H (8H)=BA98HLittle Endian右ARM 体系结构的存储器格式(3)8 9 AB4 5 6 7 0123一 “A ・■ • rO= 0x11223344 I 11 I 22 33 ： 44 ILittle endian Big endianR2 =异FI*右 ARM 体系结构的指令长度及数据宽度♦指令长度：32位（在ARM 状态下） 16位（在Thumb 状态下）♦数据宽度：字节（8位）半字（16位）字（32位）三种数据宽度对存储器及外部设备的访问。

ARM体系结构

2015/9/288源自ARM920T系统结构分析
ARM9TDMI处理器一个显著的特点是采用指令和数据分离访问的方式，即采用了指令缓存（I-Cache）和数据缓存（D-Cache）。这样可以把指令访问和数据访问单独安排1级流水线。
2015/9/28
9
ARM9处理能力的提高是通过增加时钟频率和减少指令执行周期实现的。（1）时钟频率的提高 ARM9采用了五级流水线，而ARM7采用的是三级流水线，ARM9增加的流水线设计提高了时钟频率和并行处理能力。五级流水线能够将各条指令处理分配到5个时钟周期内，在每个时钟周期内同时有5条指令在执行。在同样的加工工艺下，ARM9 TDMI处理器的时钟频率是ARM7 TDMI的2倍左右。（2）指令周期的改进指令周期的改进有助于处理器性能的提高。性能提高的幅度依赖于代码执行时指令的重叠。 ① load指令和store指令指令周期数改进最明显的是load指令和store指令。 ② 互锁(interlock)技术当指令需要的数据因为以前的指令没有执行完，将产生管道互锁。管
操作系统的保护模式指令或数据预取操作中止时的模式，该模式下实现虚拟存储器或存储器保护当执行未定义的指令时进入该模式响应普通中断时的处理模式
未定义模式 IRQ模式
Und Irq
FIQ模式
Fiq
响应快速中断时的处理模式
2015/9/28
21
处理器工作模式
ARM微处理器的运行模式可以通过软件改变，也可以通过外部中断或异常处理改变。大多数的应用程序运行在用户模式下，当处理器运行在用户模式下时，某些被保护的系统资源是不能被访问的。除用户模式以外，其余的6种模式称为非用户模式或特权模式；除去用户模式和系统模式以外的5种又称为异常模式，常用于处理中断或异常，以及访问受保护的系统资源等情况。

ARM简介

6.移动互联网领域

ARM技术打造世界级的Web2.0产品

目前大多数智能手机采用ARM11处理器基于Cortex-A处理器的Web2.0手机 ARMv7架构的设计为Web2.0做了专门设计

矢量浮点运算单元 Thumb-2和Thumb-2 EE指令用于解释器和JITs NEON SIMD技术
美国加州大学伯克利分校的Patterson教授领导的研究生团队设计和实现了“伯克利RISC I”处理器，他们在此基础之上又发展了后来SUN公司的 SPARC系列RISC处理器，并使得采用该处理器的 SUN工作站名振一时。与此同时，斯坦福大学也在RISC研究领域取得了重大进展，开发并产业化了MIPS（ Million Instructions Per Second ）系列RISC处理器。

ARM是什么？ ARM为什么存在？ ARM有什么优势？ ARM体系结构的发展历程？ ARM可以应用在哪些方面？
二、ARM为什么存在

RISC体系结构 ARM的诞生
1.RISC体系结构
传统的CISC（Complex Instruction Set Computer,复杂指令集计算机）体系由于指令集庞大，指令长度不固定，指令执行周期有长有短，使指令译码和流水线的实现在硬件上非常复杂，给芯片的设计开发和成本的降低带来了极大困难。随着计算机技术的发展需要不断引入新的复杂的指令集, 为支持这些新增的指令,计算机的体系结构会越来越复杂。然而,在CISC指令集的各种指令中,其使用频率却相差悬殊,大约有 20％的指令会被反复使用,占整个程序代码的80％。而余下的80％的指令却不经常使用,在程序设计中只占20％,显然, 这种结构是不太合理的。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

处理器的体系结构定义了指令集（ISA）和基于这一体系结构下处理器的程序员模型。

尽管每个处理器性能不同，所面向的应用不同，每个处理器的实现都要遵循这一体系结构。

ARM 体系结构为嵌入系统发展商提供很高的系统性能，同时保持优异的功耗和面积效率。

ARM体系结构的发展ARM体系结构为满足ARM合作者以及设计领域的一般需求正稳步发展。

每一次ARM体系结构的重大修改，都会添加极为关键的技术。

在体系结构作重大修改的期间，会添加新的性能作为体系结构的变体。

下面的名字表明了系统结构上的提升，后面附加的关键字表明了体系结构的变体。

V3结构 32位地址。

T ? Thumb状态：16位指令。

M ? 长乘法支持（32*32=>64或者32*32+64=>64）。

这一性质已经变成V4结构的标准配置。

V4结构加入了半字存储操作。

D ? 对调试的支持（Debug）I ? 嵌入的ICE（In Circuit Emulation）属于V4体系结构的处理器（核）有ARM7，ARM7100（ARM7核的处理器），ARM7500(ARM7核的处理器)。

属于V4T（支持Thumb指令）体系结构的处理器（核）有 ARM7TDMI，ARM7TDMI-S （ARM7TDMI可综合版本），ARM710T（ARM7TDMI核的处理器），ARM720T（ARM7TDMI 核的处理器），ARM740T（ARM7TDMI核的处理器），ARM9TDMI，ARM910T（ARM9TDMI 核的处理器），ARM920T（ARM9TDMI核的处理器），ARM940T（ARM9TDMI核的处理器），StrongARM（Intel公司的产品）。

V5结构提升了ARM和Thumb指令的交互工作能力。

E ? DSP指令支持。

J ? Java指令支持。

属于V5T（支持Thumb指令）体系结构的处理器（核）有ARM10TDMI，ARM1020T （ARM10TDMI核处理器）。

属于V5TE（支持Thumb，DSP指令）体系结构的处理器（核）有ARM9E，ARM9E-S（ARM9E 可综合版本），ARM946（ARM9E核的处理器），ARM966（ARM9E核的处理器），ARM10E，ARM1020E（ARM10E核处理器），ARM1022E（ARM10E核的处理器）， Xscale（Intel公司产品）。

属于V5TEJ（支持Thumb，DSP指令，Java指令）体系结构的处理器（核）有ARM9EJ，ARM9EJ-S（ARM9EJ可综合版本），ARM926EJ（ARM9EJ核的处理器），ARM10EJ。

V6结构增加了媒体指令属于V6体系结构的处理器核有ARM11。

ARM体系结构中有四种特殊指令集：Thumb指令（T），DSP指令（E），Java指令（J），Media指令，V6体系结构包含全部四种特殊指令集。

为满足向后兼容，ARMv6也包括了ARMv5的存储器管理和例外处理。

这将使众多的第三方发展商能够利用现有的成果，支持软件和设计的复用。

新的体系结构并不是想取代现存的体系结构，使它们变得多余。

新的CPU核和衍生产品将建立在这些结构之上，同时不断与制造工艺保持同步。

例如基于V4T体系结构的ARM7TDMI核还在广泛被新产品所使用。

新体系结构的发展动力下一代体系结构的发展是由不断涌现的新产品和变化的市场来推动的。

关键的设计约束是显而易见的，功能，性能，速度，功耗，面积和成本必须与每一种应用的需求相平衡。

保证领先的性能/功耗（MIPS/Watt）在过去是ARM成功的基石，在将来的应用中它也是一个重要衡量标准。

随着计算和通讯持续覆盖许多消费领域，功能也变得愈来愈复杂，消费者期望有高级的用户界面，多媒体以及增强的产品性能。

ARMv6将更有效的对这些新性质和技术进行有效的支持。

驱动RMv6体系结构发展的市场主要有无线，网络，自动化和消费娱乐市场。

ARM在过去与体系结构的受权者和主要合作者像Intel,Microsoft,Symbian和TI共同定义了ARMv6体系结构的需求。

ARMv6体系结构的提升发展ARMv6体系结构的过程中，精力主要集中在五个方面：存储器管理存储器管理方式严重影响系统设计和性能。

存储器结构的提升将大大提高处理器的整体性能-尤其是对于面向平台的应用。

ARMv6体系结构可以提高取指（数据）效能。

处理器将花费更少的时间在等待指令和缓存未命中数据重装载上面。

存储器管理的提升将使系统性能提升30%。

而且，存储器管理的提升也会提高总线的使用效率。

更少的总线活动意味着功耗方面的节省。

多处理器应用覆盖驱动系统实现向多处理器方向发展。

无线平台，尤其是2。

5G和3G，都是典型的需要整合多个ARM处理器或ARM与DSP的应用。

多处理器材通过共享内存来有效的共享数据。

新的ARMv6在数据共享和同步方面的能力将使它更容易实现多处理器，以及提高它们的性能。

新的指令使能复杂的同步策略，更大的提升了系统效能。

多媒体支持单指令流多数据流（SIMD）能力使得软件更有效地完成高性能的媒体应用像声音和图像编码器。

ARMv6指令集合中加入了超过60个SIMD指令。

加入SIMD指令将使性能提高2倍到4倍。

SIMD能力使发展商可以完成高端的像图象编码，语音识别，3D图象，尤其是与下一代无线应用相关的。

数据处理数据的大小端问题是指数据以何种方式在存储器中被存储和引用。

随着更多的SOC集成，单芯片不仅包含小端的OS环境和界面（像USB，PCI），也包含大端的数据（TCP/IP包，MPEG流）。

ARMv6体系结构，支持混合。

结果，数据处理问题在ARMv6体系结构中更为有效。

未对齐数据是指数据未与自然边界对齐。

例如，在DSP应用中有时需要将字数据半字对齐。

处理器更有效处理这种情形需要能够装载字到任何半字边界。

当前版本的体系结构需要大量指令处理未对齐数据。

ARMv6兼容结构处理未对齐数据更有效。

对于严重依赖未对齐数据的DSP算法，ARMv6体系结构将有性能的提高以及代码数量的缩减。

未对齐数据支持将使ARM处理器在仿真其它处理器像Motorola的68000系列方面更有效。

与ARMv5的实现像ARM10和Xscale，ARMv6是基于32位处理器。

ARMv6可以实现64位或64位以上的总线宽度。

这使得总线等于甚至超过64位处理器，但功耗和面积却比64位CPU要低。

例外（EXCEPTION）与中断对于实时系统来说，对于中断的效率是要求严格的。

像硬盘控制器，引擎管理应用，这些应用中如果中断没有及时得到响应，那后果将是严重的。

更有效的处理中断与例外也能提高系统整体表现。

在降低系统时尤为重要。

在ARMv6体系结构中，新的指令被加入了指令集合来提升中断与例外的实现。

这些将有效提升特权模式下例外处理。

ARM11主要性能ARM11是ARMv6体系结构的第一个实现，ARM11微结构的设计目的是为了高性能，而实现这一目的流水线是关键。

ARM11微结构的流水线与以前的ARM核不同，它包含8级流水，使贯通率比以前的核提高40%。

单指令发射ARM11微结构的流水线是标量的（SCALAR），即每次只发射一条指令（单发射）。

有些流水线结构可以同时发射多条指令，例如，可以同时向ALU和MAC流水线发射指令。

理论上，多发射微结构会有更高的效能，但实践上，多发射微结构无疑会增加前段指令译码级的复杂程度，因为需要更多的逻辑来处理指令相关（DEPENDENCY），这将使处理器的面积和功耗变得更大。

分支预测分支指令通常是条件指令，它们在跳到新指令前需要进行一些条件的测试。

由于条件指令译码需要的条件码要三四个周期后才可能有结果，分支有可能引起流水线的延迟。

但分支预测将会有助于避免这种延迟。

ARM11微结构使用两种技术来预测分支。

首先，动态的预测器使用历史记录来判断分支是最频繁发生，还是最不频繁发生。

动态预测器是一个64个分录，4状态（StronglyTaken,WeaklyTaken,Strongly notTaken,Weakly notTaken）的分支目标地址缓存（BTAC）。

表格大小足够保持最近的分支情况，分支预测就基于以前的结果。

其次，如果动态的分支预测器没有发现记录，就使用静态的分支算法。

很简单，静态预测检查分支是向前跳转还是向后跳转。

假如是向后跳转，就假定它是一个循环，预测该分支发生，假如是向前跳转，就预测该分支不发生。

通过使用动态和静态的分支预测，ARM11微结构中分支指令中的85%被正确预测。

存储器访问ARM11微结构存储器系统的提高之一就是非阻塞（NON-BLOCKING）和缺失命中（HIT-UNDER-MISS）操作。

当指令取的数据不在缓存中时，一般处理器的流水线会停止下来，但ARM11则进行非阻塞操作，缓存开始读取缺失的数据，而流水线可以继续执行下一指令（NON-BLOCKING），并且允许该指令读取缓存中的数据（HIT-UNDER-MISS）。

并行流水线尽管流水线是单发射的，在流水线的后端还是使用了三个并行部件结构，ALU，MAC（乘加），LS（存取）。

LS流水线是专门用于处理存取操作指令。

把数据的存取操作与数据算术操作的藕合性分隔开来可以更有效的处理执行指令。

在流水线中包含LS部件的ARM11微结构中，ALU或者MAC指令不会由于LS指令的等待而停止下来。

这也使得编译工具有更大的自由度通过重新安排代码来提高性能。

为使并行流水线获得更大的效能，ARM11微结构使用了乱序完成（OUT-OF-ORDER COMPLETION）。

64位数据路径对于目前的许多应用来说，由于成本与功耗的问题，真64位处理器并不十分必要。

ARM11微结构在局部合理使用64位结构，通过32位的成本来实现64位的性能。

ARM11微结构在处理器整数部件与缓存之间，整数部件与协处理器之间使用了64位数据总线。

64位的路径可以在一个周期内从缓存中读取两条指令，允许每周期传送两个ARM寄存器的数据。

这使得许多数据移动操作与数据加工操作变得更为高性能。

浮点处理ARM11微结构支持浮点处理。

ARM11微结构产品线将浮点处理单元作为一个选项。

这可以方便发展商根据需求需用合适的产品。