《标量处理机》PPT课件

上传人:wuxin****2020 文档编号:245127842 上传时间:2024-10-07 格式:PPT 页数:27 大小:470.50KB
返回 下载 相关 举报
《标量处理机》PPT课件_第1页
第1页 / 共27页
《标量处理机》PPT课件_第2页
第2页 / 共27页
《标量处理机》PPT课件_第3页
第3页 / 共27页
点击查看更多>>
资源描述
,单击此处编辑母版标题样式,*,第五章 标量处理机,*,第,页,5.3超标量与超流水处理机,指令级并行度ILP:每个时钟周期执行的指令条数。,一、超标量处理机,1,普通标量处理机,-只有一条流水线,每个时钟周期只有一条指令流入流水线。,分为两种类型。,(1)单操作部件流水线处理机,ILP1,10/7/2024,1,第五章 标量处理机,5.3超标量与超流水处理机,(2)多操作部件流水线处理机,ILP1,10/7/2024,2,第五章 标量处理机,5.3超标量与超流水处理机,2单发射与多发射处理机,(1)单发射处理机只有一套指令部件(取指部件和译码部件),并且每个时钟周期只取一条指令,只对一条指令进行译码。,10/7/2024,3,第五章 标量处理机,5.3超标量与超流水处理机,单发射处理机,ILPILP1,10/7/2024,6,第五章 标量处理机,5.3超标量与超流水处理机,超标量处理机:,通常,把,一个时钟周期内能够同时发射多条指令,的处理机称为,超标量处理机,。超标量处理机最基本的要求是必须有,两套或两条以上完整的指令执行部件,。上图是典型超标量处理机的指令流水线,为了能够在一个时钟周期内同时发射多条指令,超标量处理机必须有两条或两条以上能够同时工作的指令流水线。,目前,在多数超标量处理机中,每个时钟周期发射两条指令,通常不超过4条。由于存在有数据相关和条件转移等问题,采用一般的指令调度技术,理论上的,最佳情况是每个时钟周期发射3条指令,。对大量程序的模拟统计结果也表明,每个时钟周期发射2至4条指令比较合理。例如,Intel公司的i860、i960、Pentium处理机,,10/7/2024,7,第五章 标量处理机,5.3超标量与超流水处理机,Motolora公司的MC88110处理机,IBM公司的Power 6000处理机等每个时钟周期都发射两条指令;美国德州仪器公司(TI)为SUN公司生产SuperSPARC处理机每个时钟周期发射三条指令。,(3)超标量处理机指令调度要解决的问题,数据相关,控制相关,功能部件冲突,3多发射流水线的调度问题(例子说明),先看例子:,10/7/2024,8,第五章 标量处理机,5.3超标量与超流水处理机,p327,10/7/2024,9,第五章 标量处理机,5.3超标量与超流水处理机,共需10个周期。有8个空闲周期,其中4个是为了保证指令的顺序发射顺序完成。,(1)顺序发射顺序完成 p.327,10/7/2024,10,第五章 标量处理机,5.3超标量与超流水处理机,(2)顺序发射乱序完成,共需9个周期。仅有3个空闲周期。,10/7/2024,11,第五章 标量处理机,5.3超标量与超流水处理机,(3)乱序发射乱序完成 (采用p326先行指令窗口),共需8个周期。无空闲周期。,10/7/2024,12,第五章 标量处理机,5.3超标量与超流水处理机,4资源冲突,(1)什么是资源冲突?,(2)如何减少资源冲突,操作部件采用流水线结构,10/7/2024,13,第五章 标量处理机,5.3超标量与超流水处理机,二、超流水线处理机,1什么是超流水线处理机,在前面介绍的一般标量流水线处理机中,通常把一条指令的执行过程分解为“取指令”、“译码”、“执行”和“写回结果”4级流水线。如果把其中的,每级流水线再细分,,例如,再分解为两级延迟时间更短的流水线,则一条指令的执行过程就要经过8级流水线。这样,在一个基本时钟周期内就能够“取指令”两条,“译码”、“执行”和“写回结果各两条指令。这种,在一个基本时钟周期内能够分时发射多条指令的处理机称为超流水线处理机,。在有些资料上把指令流水线的级数为8级或超过8级的流水线处理机称为超流水线处理机。,10/7/2024,14,第五章 标量处理机,超流水线处理机的工作方式与上一节中介绍的超标量处理机不同,超标量处理机是通过重复设置多个“取指令”部件,设置多个“译码”、“执行”和“写回结果”部件,并且让这些功能部件同时工作来提高指令的执行速度,实际上是以增加硬件资源为代价来换取处理机性能的;而超流水线处理机则不同,它只需要,增加少量硬件,,是,通过各部分硬件的充分重叠工作来提高处理机性能,的。从流水线的时空图上看,超标量处理机采用的是空间并行性,而超流水线处理机采用的是时间并行性。,10/7/2024,15,第五章 标量处理机,5.3超标量与超流水处理机,2指令执行时序,一台并行度ILP为n的超流水线处理机,它在一个时钟周期内能够分时发射n条指令。但这n条指令不是同时发射的,而是每隔1/n个时钟周期发射一条指令。因此,实际上超流水线处理机的流水线周期为1/n个时钟周期。一台每个时钟周期分时发射2条指令的超流水线处理机的指令执行时空图如下图所示。,10/7/2024,16,第五章 标量处理机,5.3超标量与超流水处理机,3典型结构,在早期生产的计算机中,巨型计算机CRAY-1和大型计算机CDC7600属于超流水线处理机,其指令级并行度n=3。在目前大量使用的微处理器中,只有SGI公司的MIPS(microprocessor without Interlocked piped stages)系列处理机属于超流水线处理机。MIPS是除Intel公司的X86系列微处理器之外,生产量最大的一种微处理器。MIPS系列的微处理器主要有R2000、R3000、R4000、R5000和最近刚投放市场的R10000等几种。,R4000的指令流水线有8级,流水线操作如下图所示。R4000采用超流水线结构,取指令和访问数据都要跨越两个流水级;实际上,每个时钟周期包含两个流水级,处理器取第一条指令(IF)和取第二条指令(IS),10/7/2024,17,第五章 标量处理机,两个,流水级都要访问指令Cache,这两个流水级为一个时钟周期。,10/7/2024,18,第五章 标量处理机,5.3超标量与超流水处理机,三、超标量超流水线处理机,1.超标量超流水线处理机,超标量超流水线处理机,在一个时钟周期内要发射指令n次,每次发射指令m条,,因此,超标量超流水线处理机,每个时钟周期总共要发射指令mn条,。,在下图中,每一个时钟周期分为3个流水线周期,每一个流水线周期发射3条指令。从图中可以看出,每个时钟周期能够发射并执行完成9条指令。因此,在理想情况下,超标量超流水线处理机执行程序的速度应该是超标量处理机和超流水线处理机执行程序速度的乘积。,10/7/2024,19,第五章 标量处理机,m,n,10/7/2024,20,第五章 标量处理机,5.3超标量与超流水处理机,2.超标量超流水线处理机的性能,(1)性能,在一台指令级并行度为(m,n)的超标量超流水线处理机上,连续执行N条没有资源冲突、没有数据相关和控制相关的指令所需要的时间为:,其中,k是指令流水线的时钟周期数,而不是流水线级数。t是一个时钟周期的时间长度。上式中的第一项是开始m条指令通过指令流水线所需要的时间,第二项是执行其余Nm条指令所需要的时间,这时,每一个时钟周期平均执行完成mn条指令,也就是每一个流水线周期平均执行完成n条指令。,10/7/2024,21,第五章 标量处理机,5.3超标量与超流水处理机,(2)性能比较,10/7/2024,22,第五章 标量处理机,5.3超标量与超流水处理机,结论:,第一,,超标量处理机的相对性能最高,,其次是超标量超流水线处理机,超流水线处理机的相对性能最低,主要原因如下:,1超标量处理机在每个时钟周期的一开始就同时发射多条指令,而超流水线处理机则要把一个时钟周期平均分成多个流水线周期,每个流水线周期发射一条指令。因此,超流水线处理机的启动延迟比超标量处理机大。,2条件转移造成的损失,超流水线处理机要比超标量处理机大。,3在指令执行过程中的每一个功能段,超标量处理机都重复设置有多个相同的指令执行部件,而超流水线处理机只是把同一个指令执行部件分解为多个流水级。,10/7/2024,23,第五章 标量处理机,5.3超标量与超流水处理机,因此,超标量处理机指令执行部件的冲突要比超流水线处理机小。,第二,当横坐标给出的设计指令级并行度比较低时,处理机实际指令级并行度的提高比较快。但是,当设计指令级并行度进一步增加时,处理机实际指令级并行度提高的速度越来越慢。因此,在实际设计超标量、超流水线、超标量超流水线处理机的指令级并行度时要适当,否则,有可能造成花费了大量的硬件,但实际上处理机所能达到的指令级并行度并不高。目前,一般认为m和n都不要超过4。,第三,一个特定程序由于受到本身的数据相关和控制相关的限制,它的指令级并行度的最大值是确定的。这个最大值主要由程序自身的语义来决定,与这个程序,10/7/2024,24,第五章 标量处理机,5.3超标量与超流水处理机,运行在那一种处理机上无关。因此,上图中的三条曲线,对于某一个特定的程序,最终都要收拢到同一个点上。当然,对于各个不同程序,这个收拢点的位置也是不同的。,一个程序能够达到的实际指令级并行度还与所采用的调度算法有关。目前,国际上已经提出了多种开发指令级并行性的优化调度算法。对于没有条件转移操作,没有输入输出,没有程序调用和程序中断,单入口单出口的基本块程序,实现最优调度并不十分困难。但是,对于一般程序,要充分开发程序中的指令级并行性,实现最优调度非常复杂,已经证明,这是一个NP完全问题。另外,实现最优调度所需要的代价很大,包括硬件代价和软件代价,通常需要编译器和硬件的结合才能,10/7/2024,25,第五章 标量处理机,5.3超标量与超流水处理机,获得比较好的调度效果。目前,开发程序指令级并行性的许多优化调度算法及编译技术还在进一步研究中。,10/7/2024,26,第五章 标量处理机,本章重点,1.基本概念:标量处理、流水线、VLIW、超标量、超流水,2 先行控制技术原理,3 相关分类及其对策,4 流水线原理、分类,5 线性流水线性能分析,6 非线性流水线调度技术,7 超标量/超流水技术,作业:P343 5.9,5.15,10/7/2024,27,第五章 标量处理机,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!