ARM微处理器硬件结构.ppt

上传人:max****ui 文档编号:3394882 上传时间:2019-12-13 格式:PPT 页数:89 大小:2.74MB
返回 下载 相关 举报
ARM微处理器硬件结构.ppt_第1页
第1页 / 共89页
ARM微处理器硬件结构.ppt_第2页
第2页 / 共89页
ARM微处理器硬件结构.ppt_第3页
第3页 / 共89页
点击查看更多>>
资源描述
第2章ARM微处理器硬件结构,中国矿业大学信息与电气工程学院,中国矿业大学信息与电气工程学院,嵌入式处理器体系结构,按体系结构的不同可分为五大类ARMPOWERPCMIPSX86SH系列,中国矿业大学信息与电气工程学院,第2章ARM微处理器硬件结构,2.0什么是ARM2.0CISC和RISC技术2.1计算机体系结构分类冯诺依曼结构哈佛结构2.2ARM的版本及系列2.3ARM处理器结构2.4存储系统机制2.5嵌入式系统的开发,中国矿业大学信息与电气工程学院,掌握冯诺依曼体系结构和哈佛体系结构两种计算机体系结构及其区别。了解RISC技术。了解ARM定义、版本及处理器版本。了解ARM处理器结构。了解存储系统机制。,本章要求:,第2章ARM微处理器硬件结构,中国矿业大学信息与电气工程学院,2.0什么是ARM,ARM是AdvancedRISCMachine的缩写,它是一家微处理器行业的知名企业,该企业设计大量高性能、廉价、耗能低的RISC处理器。,1985年第一个ARM原型在英国剑桥诞生。,公司的特点是只设计芯片,不生产芯片。提供ARM技术知识产权(IP)核,将技术授权给世界上许多著名的半导体、软体和OEM厂商,并提供服务。,中国矿业大学信息与电气工程学院,2.0什么是ARM,有多个版本,除了一些Unix图形工作站之外,大多数ARM核心的处理器都是用在嵌入式领域。,ARM既可以认为是一个公司的名字,也可认为是对一类微处理器的通称,还可以认为是一种技术的名字。,中国矿业大学信息与电气工程学院,中国矿业大学信息与电气工程学院,ARMPartnershipModel,CISC:复杂指令集计算机(ComplexInstructionSetComputer)具有大量的指令和寻址方式8/2原则:80%的程序只使用20%的指令大多数程序只使用少量的指令就能够运行。,RISC:精简指令集计算机(ReducedInstructionSetComputer)在通道中只包含最有用的指令确保数据通道快速执行每一条指令使CPU硬件结构设计变得更为简单,2.0CISC和RISC技术,中国矿业大学信息与电气工程学院,RISC体系结构特点:,指令集中的大多数指令只需要执行简单和基本的功能;减少存储器访问指令;芯片逻辑采用硬布线逻辑;减少指令数和寻址方式指令译码简化。,典型的高性能RISC处理器,MIPS公司的SGI:MIPS(1986)SUN公司的SPARC(1987)HP公司的PA-RISC,IBM,Motorola公司的PowerPCDEC、Compac公司的AlphaAXPIBM的RS6000(1990)第一台SuperscalarRISC机,中国矿业大学信息与电气工程学院,CISC与RISC的对比,中国矿业大学信息与电气工程学院,冯诺依曼体系结构,2.1计算机体系结构分类,哈佛体系结构,中国矿业大学信息与电气工程学院,冯诺依曼体系结构模型,指令寄存器,控制器,数据通道,输入,输出,中央处理器,存储器,程序,指令0,指令1,指令2,指令3,指令4,数据,数据0,数据1,数据2,2.1计算机体系结构分类,中国矿业大学信息与电气工程学院,1)取指令(InstructionFetch):TF2)指令译码(InstructionDecode):TD3)执行指令(InstructionExecute):TE4)存储(Storage):TS,冯诺依曼体系结构指令的执行周期T,2.1计算机体系结构分类,每条指令的执行周期:T=TF+TD+TE+TS,中国矿业大学信息与电气工程学院,1)数据与指令都存储在存储器中2)被大多数计算机所采用,冯诺依曼体系结构的特点,2.1计算机体系结构分类,ARM7冯诺依曼体系结构,中国矿业大学信息与电气工程学院,指令寄存器,控制器,数据通道,输入,输出,中央处理器,程序存储器,指令0,指令1,指令2,数据存储器,数据0,数据1,数据2,地址,指令,地址,数据,哈佛体系结构,2.1计算机体系结构分类,中国矿业大学信息与电气工程学院,1)程序存储器与数据存储器分开2)提供了较大的存储器带宽3)适合于数字信号处理4)大多数DSP都是哈佛结构,ARM9哈佛体系结构,哈佛体系结构的特点,2.1计算机体系结构分类,中国矿业大学信息与电气工程学院,ARM体系结构从最初开发到现在有了很大的改进,并仍在完善和发展。,2.2ARM的版本及系列,ARM体系结构版本,为了清楚地表达每个ARM应用实例所使用的指令集,ARM公司定义了6种主要的ARM指令集体系结构版本,以版本号V1V6表示。,中国矿业大学信息与电气工程学院,该版架构只在原型机ARM1出现过,只有26位的寻址空间,没有用于商业产品。其基本性能有:基本的数据处理指令(无乘法);基于字节、半字和字的Load/Store指令;转移指令,包括子程序调用及链接指令;供操作系统使用的软件中断指令SWI;寻址空间:64MB。,2.2ARM的版本及系列,ARM体系结构版本I,中国矿业大学信息与电气工程学院,该版架构对V1版进行了扩展,例如ARM2和ARM3(V2a架构)。包含了对32位乘法指令和协处理器指令的支持。版本2a是版本2的变种,ARM3芯片采用了版本2a,是第一片采用片上Cache的ARM处理器。同样为26位寻址空间,现已废弃不再使用。,2.2ARM的版本及系列,ARM体系结构版本II,中国矿业大学信息与电气工程学院,V2版架构与版本V1相比,增加了以下功能:乘法和乘加指令;支持协处理器操作指令;快速中断模式;SWP/SWPB的最基本存储器与寄存器交换指令;寻址空间:64MB,2.2ARM的版本及系列,ARM体系结构版本II,中国矿业大学信息与电气工程学院,ARM作为独立的公司,在1990年设计的第一个微处理器采用的版本3的ARM6。它作为IP核、独立的处理器、具有片上高速缓存、MMU和写缓冲的集成CPU。变种版本有3G和3M。版本3G是不与版本2a向前兼容的版本3,版本3M引入了有符号和无符号数乘法和乘加指令,这些指令产生全部64位结果。V3架构对ARM体系结构做了较大的改动。,2.2ARM的版本及系列,ARM体系结构版本III,中国矿业大学信息与电气工程学院,寻址空间增至32位(4GB)当前程序状态信息从原来的R15寄存器移到当前程序状态寄存器CPSR中(CurrentProgramStatusRegister);增加程序状态保存寄存器SPSR(SavedProgramStatusRegister);增加了两种异常模式,使操作系统代码可方便地使用数据访问中止异常、指令预取中止异常和未定义指令异常;增加了MRS/MSR指令,以访问新增的CPSR/SPSR寄存器;增加了从异常处理返回的指令功能。,2.2ARM的版本及系列,ARM体系结构版本III,中国矿业大学信息与电气工程学院,V4版架构在V3版上做了进一步扩充,V4版架构是目前应用最广的ARM体系结构,ARM7、ARM8、ARM9和StrongARM都采用该架构。V4不再强制要求与26位地址空间兼容,而且明确了哪些指令会引起未定义指令异常。,2.2ARM的版本及系列,ARM体系结构版本IV,中国矿业大学信息与电气工程学院,符号化和非符号化半字及符号化字节的存/取指令;增加了T变种,处理器可工作在Thumb状态,增加了16位Thumb指令集;完善了软件中断SWI指令的功能;处理器系统模式引进特权方式时使用用户寄存器操作;把一些未使用的指令空间捕获为未定义指令。,2.2ARM的版本及系列,ARM体系结构版本IV,中国矿业大学信息与电气工程学院,ARM和Thumb指令,简介,ARM处理器是基于精简指令集计算机(RISC)原理设计的,指令集和相关译码机制较为简单。,ARM体系结构在V4版中增加了16位Thumb指令集。ARM指令集效率高,但是代码密度低;Thumb指令集具有较高的代码密度,却仍然保持ARM的大多数性能上的优势,它是ARM指令集的子集。,ARM7TDMI(-S)指令系统,ARM指令集与Thumb指令集的关系,Thumb指令集具有灵活、小巧的特点,ARM指令集支持ARM核所有的特性,具有高效、快速的特点,ARM和Thumb状态切换,所有的ARM指令都是可以有条件执行的,而Thumb指令仅有一条指令具备条件执行功能。ARM程序和Thumb程序可相互调用,相互之间的状态切换开销几乎为零。,进入Thumb状态:当操作数寄存器的状态态位为1进入ARM状态:当操作数寄存器的状态态位为0,V5版架构是在V4版基础上增加了一些新的指令,ARM10和Xscale都采用该版架构。新增命令包括:带链接和交换的转移BLX指令;计数前导零CLZ指令;BRK中断指令;,2.2ARM的版本及系列,ARM体系结构版本V,中国矿业大学信息与电气工程学院,增加了数字信号处理指令(V5TE版);为协处理器增加更多可选择的指令;改进了ARM/Thumb状态之间的切换效率;E增强型DSP指令集,包括全部算法操作和16位乘法操作;J支持新的JAVA,提供字节代码执行的硬件和优化软件加速功能。,2.2ARM的版本及系列,ARM体系结构版本V,中国矿业大学信息与电气工程学院,V6版架构是2001年发布的,首先在2002年春季发布的ARM11处理器中使用。在降低耗电量的同时,还强化了图形处理性能。通过追加有效进行多媒体处理的SIMD(SingleInstruction,MultipleData,单指令多数据)功能,将语音及图像的处理功能提高到原型机的4倍。,2.2ARM的版本及系列,ARM体系结构版本VI,中国矿业大学信息与电气工程学院,此架构在V5版基础上增加了以下功能:ThumbTM:35%代码压缩;DSP扩充:高性能定点DSP功能;JazelleTM:Java性能优化,可提高8倍;Media扩充:音/视频性能优化,可提高4倍。,2.2ARM的版本及系列,ARM体系结构版本VI,中国矿业大学信息与电气工程学院,2.2ARM的版本及系列,ARM体系结构版本,中国矿业大学信息与电气工程学院,ARMIARMIIARMIIIARMIVARMVARMVI,ARM公司开发了很多系列的ARM处理器核,目前最新的系列已经是ARM11。ARM7、ARM9、ARM9E和ARM10为4个通用处理器系列。每个系列提供一套相对独特的性能来满足不同应用领域的需求。,2.2ARM的版本及系列,ARM处理器系列,中国矿业大学信息与电气工程学院,ARM7系列ARM9系列ARM9E系列ARM10E系列ARM11系列SecurCore系列IntelXscale系列IntelStrongARM系列,2.2ARM的版本及系列,ARM处理器系列,中国矿业大学信息与电气工程学院,低功耗的32bitRISC处理器,冯诺依曼体系结构。极低的功耗,适合便携式产品。具有嵌入式ICE-RT逻辑,调试开发方便。能提供0.9MIPS的三级流水线结构;代码密度高,兼容16位的Thumb指令集;广泛支持操作系统,包括WindowsCE、Linux、PalmOS、VxWorks等;指令系统与ARM9系列、ARM9E系列和ARM10E系列兼容,便于用户的产品升级换代;主频最高可达130MIPS。,2.2ARM的版本及系列,ARM处理器ARM7系列,主要应用于:工业控制、Internet设备、网络和调制解调器设备、移动电话等多种多媒体和嵌入式应用。,中国矿业大学信息与电气工程学院,包括六种类型:ARM7TDMI、ARM7TDMI-S、ARM710T、ARM720T、ARM740T、ARM7EJ;ARM7TDMI是目前最广泛的32位嵌入式RISC处理器,属低端ARM处理器核。,2.2ARM的版本及系列,ARM处理器ARM7TDMI系列,ARM7TDMI-S,ARM7TDMI的可综合(synthesizable)版本(软核),对应用工程师来说其编程模型与ARM7TDMI一致;,嵌入式Embedded-ICE,支持片上断点和调试点;,支持64位乘法;,支持片上调试Debug;,支持高密度16位的压缩Thumb指令集,中国矿业大学信息与电气工程学院,ARM7的产品线。ARM7TDMI:同时具备四个模块,当然用户也可选择其中的几个或一个。ARM7TDMI-S:软件与ARM7TDMI完全兼容,硬件预留功能扩展口。ARM710T:ARM7TDMI+8KCache+MMU,Cache:片内缓存,提高CPU性能,MMU:内存管理单元。ARM740T:ARM7TDMI+8KCache+ProtectionUnit。ARM720T:ARM7TDMI+8KCache+WinCESupport。,2.2ARM的版本及系列,ARM处理器ARM7TDMI系列,中国矿业大学信息与电气工程学院,5级流水线;哈佛体系结构;支持32位ARM指令集和16位Thumb指令集。全性能的MMU,支持WindowsCE、Linux、PalmOS等多种主流嵌入式操作系统;支持数据Cache和指令Cache,具有更高的指令和数据处理能力。,2.2ARM的版本及系列,ARM处理器ARM9系列,主要应用于:无线设备、仪器仪表、安全系统、机顶盒、高端打印机、数码照相机和数码摄像机。,中国矿业大学信息与电气工程学院,支持DSP指令集;5级整数流水线,指令执行效率更高;支持32位ARM指令集和16位Thumb指令集;支持VFP9浮点处理协处理器;全性能的MMU,支持WindowsCE、Linux、PalmOS等多种主流嵌入式操作系统;MPU支持实时操作系统;支持数据Cache和指令Cache;主频最高可达300MIPS。,2.2ARM的版本及系列,ARM处理器ARM9E系列,主要应用于:下一代无线设备、数字消费品、成像设备、工业控制、存储设备和网络设备等领域。,中国矿业大学信息与电气工程学院,与同等的ARM9比较,在同样的时钟频率下,性能提高了近50%,功耗极低;支持DSP指令集;6级整数流水线,指令执行效率更高;支持32位ARM指令集和16位Thumb指令集。支持VFP10浮点处理协处理器。全性能的MMU,支持WindowsCE、Linux、PalmOS等多种主流嵌入式操作系统。支持数据Cache和指令Cache;主频最高可达400MIPS;内嵌并行读/写操作部件。,2.2ARM的版本及系列,ARM处理器ARM10E系列,主要应用于:下一代无线设备、数字消费品、成像设备、工业控制、通信和信息系统等领域。,中国矿业大学信息与电气工程学院,专为安全需要设计,提供了完善的32位RISC技术的安全解决方案;灵活的保护单元,以确保操作系统和应用数据的安全。采用软内核技术,防止外部对其进行扫描探测;可集成用户自己的安全特性和其他协处理器。,2.2ARM的版本及系列,ARM处理器SecurCore系列,主要应用于:对安全性要求较高的应用产品及应用系统,如电子商务、电子政务、电子银行业务、网络和认证系统等领域。,中国矿业大学信息与电气工程学院,2.2ARM的版本及系列,IntelStrongARMSA-1100系列微处理器是采用ARM体系结构高度集成的32位RISC微处理器。融合Intel公司的设计和处理技术以及ARM体系结构的电源效率,采用在软件上兼容ARMV4,同时兼具Intel技术优点。,ARM处理器StrongARM系列,主要应用于:便携式通信产品和消费类电子产品。,基于ARMv5TE体系结构的解决方案,是一款全性能、高性价比、低功耗的处理器;支持16位的Thumb指令和DSP指令集。,2.2ARM的版本及系列,ARM处理器Xscale系列,已使用在:数字移动电话、个人数字助理和网络产品等场合。,中国矿业大学信息与电气工程学院,2.2ARM的版本及系列,ARM系列总结,中国矿业大学信息与电气工程学院,中国矿业大学信息与电气工程学院,ARM7TDMI,4T,1,支持Halfword和signedhalfword/byte和Systemmode,支持Thumb指令集,2,4,ARM9TDMI,ARM720T,ARM940T,改良的ARM/Thumb交互作用以及CLZ指令,5TE,SaturatedmathsDSPmultiply-accumulateinstructions,XScale,ARM1020E,ARM9E-S,ARM966E-S,3,早期的ARMs,ARM9EJ-S,5TEJ,ARM7EJ-S,ARM926EJ-S,Jazelle支持Java字节码,6,ARM11,SIMD,2.2ARM的版本及系列,ARM版本及系列总结,ARM7TDMI内核结构,基于精简指令集RISC结构,指令集和相关的译码机制相对简单结构图,书P32,图2-7,指令集包含11种基本类型2种类型:片上算术逻辑单元、桶式移位器和乘法器(在31个寄存器间执行)3种类型:指令控制数据(存储器和寄存器之间)3种类型:控制流程和特权级执行3种类型:控制外部的协处理器,SHARP公司的LH77790A芯片,ARM7DICPU,Cache,LCD控制器,总线控制器,PWM,82C54计数器/定时器,16C450UART,82C55可编程外围接口,CPU部分,JTAG调试接口,中断/复位,控制部分,典型应用:,液晶显示系统,中国矿业大学信息与电气工程学院,SAMSUNG公司KS32C6200芯片,ARM7TDMI内核,Cache(2K),CPU部分,并口接口,双通道DMA,UART/SIO,中断控制器,典型应用:,网络打印机,可编程方波发生器,存储器控制器,总线接口,定时器,看门狗定时器,Derasterizer/shifter,显示屏,中国矿业大学信息与电气工程学院,ATMEL公司的AT91芯片,ARM7TDMI内核,ICE接口,外部总线接口,片内存储器,典型应用:,工控系统,中国矿业大学信息与电气工程学院,CIRRUS公司的EP系列芯片,ARM720T内核控制电路DAI:数字音频接口LCD控制器存储器控制器DC-DC变换器(PWM)27位通用I/O动态可编程时钟其它控制电路,典型应用:,音频系统,中国矿业大学信息与电气工程学院,带Cache的ARM7TDMI,ARM710T8K统一的cache完整的内存管理单元(mmu),支持虚拟地址和存储器保护写缓冲,ARM720T同ARM710T,但支持WinCEARM740T8K统一的cache内存管理单元写缓冲,ARM7TDMI内核,地址,地址,数据读,AMBA接口,写缓冲,MMU,数据写,数据,ARM7xxT,控制逻辑,Cache,AMBA总线接口,JTAG和非AMBA信号,CP15,中国矿业大学信息与电气工程学院,高速缓存(Cache),1、为什么采用高速缓存微处理器的时钟频率比内存速度提高快得多,高速缓存可以提高内存的平均性能。2、高速缓存的工作原理高速缓存是一种小型、快速的存储器,它保存部分主存内容的拷贝。,CPU,高速缓存控制器,CACHE,主存,数据,数据,地址,2.3ARM处理器结构,从以下四个方面介绍:ARM和Thumb状态RISC技术流水线技术超标量执行,二级流水,串行执行,取指令取指令单元完成,总有一个部件空闲,指令预取,若取指和执行阶段时间上完全重叠,指令周期减半速度提高1倍,执行指令执行指令单元完成,2.3.3流水线技术,中国矿业大学信息与电气工程学院,2.3.3流水线技术,流水线(Pipeline)技术:几个指令可以并行执行提高了CPU的运行效率内部信息流要求通畅流动,译码,取指,执行add,译码,取指,执行sub,译码,取指,执行mov,时间,Add,Sub,mov,中国矿业大学信息与电气工程学院,流水线(pipeline)是Intel首次在486芯片中开始使用的。流水线的工作方式就象工业生产上的装配流水线。,指令流水线,为增加处理器指令流的速度,ARM7系列使用3级流水线.允许多个操作同时处理,比逐条指令执行要快。PC指向正被取指的指令,而非正在执行的指令,Fetch,Decode,Execute,从存储器中读取指令,解码指令,寄存器读(从寄存器Bank)移位及ALU操作寄存器写(到寄存器Bank),PCPC,PC-4PC-2,PC-8PC-4,ARMThumb,中国矿业大学信息与电气工程学院,最佳流水线,该例中用6个时钟周期执行了6条指令所有的操作都在寄存器中(单周期执行)指令周期数(CPI)=1,操作,周期,123456,Fetch,Decode,Execute,Fetch,Decode,Execute,Fetch,Decode,Execute,Fetch,Decode,Execute,Fetch,Decode,Execute,Decode,Execute,Fetch,Decode,Fetch,Fetch,中国矿业大学信息与电气工程学院,LDR流水线举例,该例中,用6周期执行了4条指令指令周期数(CPI)=1.5,周期,操作,123456,Fetch,Decode,Execute,Fetch,Decode,Execute,Fetch,Decode,Execute,Data,Writeback,Fetch,Decode,Execute,Fetch,Decode,Fetch,中国矿业大学信息与电气工程学院,缩短程序执行时间,中国矿业大学信息与电气工程学院,2.3.3流水线技术,ARM的流水线设计问题,:执行一段程序所需时间;,:执行该段程序的指令条数;,:执行每条指令的平均时钟周期数;,:处理器的时钟频率。,降低CPI,提供时钟频率,解决流水线的相关问题,中国矿业大学信息与电气工程学院,2.3.3流水线技术,ARM的流水线设计问题,1)流水线结构相关问题:,资源冲突导致,对数据通路访问的冲突对寄存器访问的冲突,措施:,分离式指令Cache和数据CacheALU中采用独立的加法器完成地址计算,中国矿业大学信息与电气工程学院,解决流水线的相关问题,2.3.3流水线技术,ARM的流水线设计问题,2)流水线数据相关问题:,当前指令需要之前指令执行的结果,而之前指令均在流水线中重叠执行。,写后读写后写读后写,措施:,定向技术:将之前指令运算结果直接传递给后面需要的指令,不必写入寄存器。流水线互锁技术:通过编译器及汇编程序员修改来减少管道互锁的数量。,中国矿业大学信息与电气工程学院,解决流水线的相关问题,2.3.3流水线技术,ARM的流水线设计问题,3)流水线控制相关问题:,流水线遇到分支指令和其他会改变PC值的指令,暂停分支指令之后的所有指令,直到分支指令确定了新的PC值为止。,措施:,引入延时分支:直接跟在分支指令后面的指令被执行,保证流水线处于满的状态。尽早计算分支转移成功时的PC值:通过采用一个专用加法器计算分支的目标地址。,引入控制阻滞延时(分支损失),InstructionFetch,Shift+ALU,MemoryAccess,RegWrite,RegRead,RegDecode,FETCH,DECODE,EXECUTE,MEMORY,WRITE,ARM9TDMI,ARMorThumbInstDecode,RegSelect,RegRead,Shift,ALU,RegWrite,ThumbARMdecompress,ARMdecode,InstructionFetch,FETCH,DECODE,EXECUTE,ARM7TDMI,三级流水线,五级流水线,2.3.3指令流水线,中国矿业大学信息与电气工程学院,指令取指,移位+ALU,寄存器写,寄存器读,寄存器译码,FETCH,DECODE,EXECUTE,MEMORY,WRITE,ARM9TDMI,ARM或Thumb指令解码,ARM10,指令地址生成,移位+ALU,数据Cache接口,寄存器写,FETCH,DECODE,EXECUTE,MEMORY,WRITE,寄存器读+结果前向迁移+记分板,乘法,乘加,协处理器数据接口,分支预测,指令取指,ISSUE,寄存器访问,数据+分支地址生成,ARM或Thumb指令解码,协处理器指令发出,五级流水线,2.3.3指令流水线,六级流水线,中国矿业大学信息与电气工程学院,ARM的流水线技术,中国矿业大学信息与电气工程学院,2.3.4超标量执行,超标量技术:通过重复设置多套指令执行部件,同时处理并完成多条指令,实现并行操作来达到提高处理速度的目的。,控制,指令1,寄存器,指令单元,指令单元,指令2,中国矿业大学信息与电气工程学院,2.3.4超标量执行,超标量技术:超标量CPU采用多条流水线结构。,执行1,取指,指令,译码2,译码1,执行2,执行1,取指,译码2,译码1,执行2,流水线1,流水线2,数据回写,中国矿业大学信息与电气工程学院,2.4存储系统机制,软件,嵌入式处理器,接口,接口,存储器,板级支持包,嵌入式操作系统,应用程序,输入,输出,硬件,软件,存放程序和数据,ARM体系中的存储空间,中国矿业大学信息与电气工程学院,2.4.1ARM存储系统,ARM体系使用单一的平板地址空间。地址空间大小个8位的字节。其单元地址为无符号的32位数,范围为0,ARM体系的也可视为地址空间大小个32位的字。其单元地址为无符号的30位数,范围为0,地址为A的字数据包括A,A+1,A+2,A+3中的4字节内容,ARM体系的也可视为地址空间大小个16位的半字。其单元地址为无符号的31位数,范围为0,地址为A的字数据包括A,A+1中的2字节内容,ARM处理器支持一下6种数据类型:,中国矿业大学信息与电气工程学院,2.4.1ARM存储系统,8位有符号和无符号字节;,16位有符号和无符号半字;(2字节边界对齐),32位有符号和无符号字;(4字节边界对齐),ARM操作面向32位操作数,以字为单位对齐;,Thumb操作面向16位操作数,以半字为单位对齐;,ARM体系结构将存储器看作是从零地址开始的字节的线性组合。从零字节到三字节放置第一个存储的字数据,从第四个字节到第七个字节放置第二个存储的字数据,依次排列。作为32位的微处理器,ARM体系结构所支持的最大寻址空间为4GB(232字节)。,ARM体系结构的存储器格式,2.4.1ARM存储系统,中国矿业大学信息与电气工程学院,ARM体系结构可以用两种方法存储字数据,称之为大端格式和小端格式。大端格式(big-endian):字数据的高字节存储在低地址中,而字数据的低字节则存放在高地址中,中国矿业大学信息与电气工程学院,ARM体系结构的存储器格式(大端),2.4.1ARM存储系统,小端格式(little-endian):与大端存储格式相反。低地址中存放的是字数据的低字节,高地址存放的是字数据的高字节。,中国矿业大学信息与电气工程学院,2.4.1ARM存储系统,ARM体系结构的存储器格式(小端),ARM可以用little/bigendian格式存取数据.,r0=0 x11223344,STRr0,r1,LDRBr2,r1,r1=0 x00,Memory,3210,0123,ByteLane,31,24,23,16,15,8,7,0,11,22,33,44,31,24,23,16,15,8,7,0,44,33,22,11,31,24,23,16,15,8,7,0,11,22,33,44,31,24,23,16,15,8,7,0,00,00,00,44,31,24,23,16,15,8,7,0,00,00,00,11,Littleendian,Bigendian,R2=0 x44,R2=0 x11,2.4.1ARM存储系统,中国矿业大学信息与电气工程学院,2.4.2高速缓冲存储器,cache能够减少内存平均访问时间。Cache可以分为统一cache和独立的数据程序cache。当CPU更新了cache的内容时,要将结果写回到主存中,可以采用写通法(write-through)和写回法(write-back)。写通法是指CPU在执行写操作时,必须把数据同时写入cache和主存。采用写通法进行数据更新的cache称为写通cache。写回法是指CPU在执行写操作时,被写的数据只写入cache不写入主存。仅当需要替换时,才把已经修改的cache块写回到主存中。采用写回法进行数据更新的cache称为写回cache。,当进行数据写操作时,cache分为两类:读操作分配cache和写操作分配cache。对于读操作分配cache,当进行数据写操作时,如果cache未命中,只是简单地将数据写入主存中。主要在数据读取时,才进行cache内容预取。对于写操作分配cache,当进行数据写操作时,如果cache未命中,cache系统将会进行cache内容预取,从主存中将相应的块读取到cache中相应的位置,并执行写操作,把数据写入到cache中。,2.4.3存储管理单元,MMU(MemoryManageUnit,存储管理单元)在CPU和物理内存之间进行地址转换,将地址从逻辑空间映射到物理空间,这个转换过程一般称为内存映射。MMU主要完成以下工作:(1)虚拟存储空间到物理存储空间的映射。(2)存储器访问权限的控制。(3)设置虚拟存储空间的缓冲的特性。,2.4.4存储器系统的层次结构,在这种存储器分层结构中,上面一层的存储器作为下一层存储器的高速缓存。CPU寄存器就是cache的高速缓存,寄存器保存来自cache的字;cache又是内存层的高速缓存,从内存中提取数据送给CPU进行处理,并将CPU的处理结果返回到内存中;内存又是主存储器的高速缓存,它将经常用到的数据从Flash等主存储器中提取出来,放到内存中,从而加快了CPU的运行效率。嵌入式系统的主存储器容量是有限的,磁盘、光盘或CF、SD卡等外部存储器用来保存大信息量的数据。在某些带有分布式文件系统的嵌入式网络系统中,外部存储器就作为其他系统中被存储数据的高速缓存。,中国矿业大学信息与电气工程学院,1)按在系统中的地位分类,存储器部件的几种分类,主存储器(MainMemory),(内存、主存),辅助存储器(AuxiliaryMemory、SecondaryMemory),(外存、辅存),CPU直接访问,速度快,用于存放系统软件、参数以及当前要运行的应用软件和数据、系统软件的部分软件。,速度慢,存放全部应用软件及剩余系统软件。,通过专门设备将数据先置于内存,中国矿业大学信息与电气工程学院,2)按信息存取方式分类,2.4存储系统机制,存储器部件的几种分类,随机存取存储器RAM,只读存储器ROM,RandomlyAccessMemory,ReadOnlyMemory,掩膜式ROM,可编程只读存储器PROM,可改写的只读存储器EPROM,静态RAM,动态RAM,准静态RAM,按功能分,按信息存储的方式分,中国矿业大学信息与电气工程学院,2.4存储系统机制,FlashROM,MX29LV040CTC70G,Options:G:Lead-freepackageR:RestrictedVCC(3.0V3.6V)Q:RestrictedVCC(3.0V3.6V)withLead-freepackage,Speed:55:55ns70:70ns90:90ns12:120ns,Temperaturerange:C:Commercial(070oC)I:Industrial(-4085oC),Vendor:MacronixInternational,Package:Q:PLCCT:TSOP,Device:29:Flash,Type:L,LV:3V,Density&Mode:040:4M,x8EqualSector,Revision:C,中国矿业大学信息与电气工程学院,2.4存储系统机制,现代SDRAM,HYXXXXXXXXXXXXXXXXXXX,HYNIX,ProductFamily:,57:sdram5D:DDRsdram,Process&PowerSupply:,V:CMOS,3VU:CMOS,2.5V,Density&Refresh:,4:4Mbits,1KRef16:8Mbits,4KRef,DataWidth:,40:x480:x8,Bank:,1:2Banks2:4Banks,Interface:,0:LVTTL1:SSTL2:SSTL2,I:IndustrialTempatureE:ExtendedTempature,Speed:,5:5ns55:5.5ns5:6ns65:6.5ns7:7ns75:7.5ns,Package:,TC:400Mil,TSOPIITQ:100Pin-TQFP,PowerConsumption:,Blank:NormalPowerL:LowPower,DieGeneration:,Blank:1stGenerationA:2ndGenerationB:3rdGenerationC:4thGenerationD:5thGeneration,中国矿业大学信息与电气工程学院,SDRAM:SynchronousDynamicRandomAccessMemory,同步动态随机存取存储器:同步是指Memory工作需要同步时钟,内部的命令的发送与数据的传输都以它为基准;动态是指存储阵列需要不断的刷新来保证数据不丢失;随机是指数据不是线性依次存储,而是由指定地址进行数据读写。,2.4存储系统机制,SDRAM,中国矿业大学信息与电气工程学院,2.4存储系统机制,SDRAM,内存芯片存储数据的基本单位是bit(位),而进行寻址的基本单位则是Byte(字节),一个Byte就等于8bit。,进行数据读取时,先进行行的选定,再进行列的选定,最后再从这个单元格中读取出所需要的数据。,bank,存储单元数量=行数列数Bank的数量,一般MW的方式来表示芯片的容量(或者说是芯片的规格/组织结构)。M是该芯片中存储单元的总数,单位是兆(英文简写M,精确值是1048576,而不是1000000),W代表每个存储单元的容量,也就是SDRAM芯片的位宽(Width),单位是bit。比如,8M8,这是一个8bit位宽芯片,有8M个存储单元,总容量是64Mbit(8MB),中国矿业大学信息与电气工程学院,SDRAM,R/W,RAS,CAS,CE,Addr,Data,CLK,2.4存储系统机制,SDRAM,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!