计算机系统组成与工作原理课件

上传人:痛*** 文档编号:241760728 上传时间:2024-07-21 格式:PPT 页数:60 大小:4.70MB
返回 下载 相关 举报
计算机系统组成与工作原理课件_第1页
第1页 / 共60页
计算机系统组成与工作原理课件_第2页
第2页 / 共60页
计算机系统组成与工作原理课件_第3页
第3页 / 共60页
点击查看更多>>
资源描述
计计算机系算机系统组统组成与工作原理成与工作原理2.1计计算机系算机系统统的基本的基本结结构与构与组组成(掌握)成(掌握)计计算机系算机系统统的的层层次模型次模型计计算机系算机系统统的的结结构、构、组织组织与与实现实现2.2计计算机系算机系统统的工作原理(掌握)的工作原理(掌握)冯冯诺诺依曼依曼计计算机架构算机架构模型机系模型机系统结统结构构模型机指令集模型机指令集模型机工作流程模型机工作流程1 1第第2章章 计计算机系算机系统组统组成与工作原理成与工作原理2.3 微微处处理器体系理器体系结结构的改构的改进进(理解)(理解)冯冯诺诺依曼依曼结结构的改构的改进进并行技并行技术术的的发发展展流水流水线结线结构构超超标标量与超量与超长长指令字指令字结结构构多机与多核多机与多核结结构构2.4 计计算机体系算机体系结结构分构分类类(理解)(理解)2.5 计计算机性能算机性能评测评测(掌握)(掌握)字字长长、存、存储储容量、运算速度容量、运算速度2 2(a)软硬件层次)软硬件层次 (b)语言层次)语言层次2.1.1 计计算机系算机系统统的的层层次模型次模型1.(a)图自下而上反映了系统逐级生成的过程,自上而下反映了系统求)图自下而上反映了系统逐级生成的过程,自上而下反映了系统求解问题的过程;解问题的过程;2.软硬件的逻辑等价性可以表现为:硬件软化(如软硬件的逻辑等价性可以表现为:硬件软化(如RISC思想)、软件硬思想)、软件硬化(如化(如CISC思想)、固件化(如微程序)思想)、固件化(如微程序);3.(b)图中的虚拟机:与某种特殊编程语言对应的假想硬件机器)图中的虚拟机:与某种特殊编程语言对应的假想硬件机器微体系结构层微体系结构层(微程序或硬连逻辑)(微程序或硬连逻辑)操作系统层操作系统层语言处理层(解释、编译)语言处理层(解释、编译)用户程序层(语言编程)用户程序层(语言编程)系统分析层(数学模型、算法)系统分析层(数学模型、算法)硬核硬核级级数字逻辑层(硬件)数字逻辑层(硬件)指令系统层(机器语言指令)指令系统层(机器语言指令)应用语言虚拟机应用语言虚拟机高级语言虚拟机高级语言虚拟机汇编语言虚拟机汇编语言虚拟机操作系统虚拟机操作系统虚拟机机器语言级机器语言级微程序级微程序级寄存器级(硬件)寄存器级(硬件)硬件系统:异常处理机构、指令系统、硬件系统:异常处理机构、指令系统、CPU、存储器、存储器、I/O及通信子系统及通信子系统系统软件:操作系统、编译器、数据库管理系系统软件:操作系统、编译器、数据库管理系统、统、Web浏览器、设备驱动、中断服务程序浏览器、设备驱动、中断服务程序应用软件应用软件3 32.1.2 计算机系统的结构、组成与实现n体系结构体系结构Architecturen 程序员关心的计算机概念结构与功能程序员关心的计算机概念结构与功能特性特性n如:确定指令集中是否有乘法指令;如:确定指令集中是否有乘法指令;n计算机组成计算机组成Organizationn从硬件角度关注物理机器的组织从硬件角度关注物理机器的组织n 如:乘法指令由专用乘法器还是用加法如:乘法指令由专用乘法器还是用加法器实现器实现n计算机实现计算机实现Realizationn底层的器件技术、微组装技术、冷却技底层的器件技术、微组装技术、冷却技术等术等n如:加法器底层的物理器件类型及微组如:加法器底层的物理器件类型及微组装技术装技术系列机系列机4 4计算机的体系结构 1946年,美国宾夕法尼亚大学莫尔学院的物理学博士年,美国宾夕法尼亚大学莫尔学院的物理学博士Mauchley和电气工程师和电气工程师Eckert领导的小组研制成功世界上第一领导的小组研制成功世界上第一台数字式电子计算机台数字式电子计算机ENIAC。著名的美籍匈牙利数学家著名的美籍匈牙利数学家Von Neumann参加了为改进参加了为改进ENIAC而举行的一系列专家会议,研究了新型计算机的体系结而举行的一系列专家会议,研究了新型计算机的体系结构。构。1949年,英国剑桥大学的威尔克斯等人在年,英国剑桥大学的威尔克斯等人在EDSAC 机上实现机上实现了冯了冯诺依曼模式。诺依曼模式。直至今天冯直至今天冯诺依曼体系结构依然是绝大诺依曼体系结构依然是绝大多数数字计算机的基础。多数数字计算机的基础。5 5冯冯诺诺伊曼伊曼计计算机系算机系统结统结构框构框图图 6 6体系结构角度的多层结构硬件向上提供的接硬件向上提供的接口:口:指令系统指令系统异常事件异常事件端口定义端口定义7 7体系结构、组成与实现n体系结构体系结构Architecturen 程序员关心的计算机概念结构与功能程序员关心的计算机概念结构与功能特性特性n如:确定指令集中是否有乘法指令;如:确定指令集中是否有乘法指令;n计算机组成计算机组成Organizationn从硬件角度关注物理机器的组织从硬件角度关注物理机器的组织n 如:乘法指令由专用乘法器还是用加法如:乘法指令由专用乘法器还是用加法器实现器实现n计算机实现计算机实现Realizationn底层的器件技术、微组装技术、冷却技底层的器件技术、微组装技术、冷却技术等术等n如:加法器底层的物理器件类型及微组如:加法器底层的物理器件类型及微组装技术装技术系列机系列机8 8计算机的组成(计算机的组成(1)9 9计算机的组成(计算机的组成(2)总线结构总线结构1010计算机的组成(3)同步数字系统同步数字系统1111组织角度的多层结构1212体系结构、组成与实现n体系结构体系结构Architecturen 程序员关心的计算机概念结构与功能程序员关心的计算机概念结构与功能特性特性n如:确定指令集中是否有乘法指令;如:确定指令集中是否有乘法指令;n计算机组成计算机组成Organizationn从硬件角度关注物理机器的组织从硬件角度关注物理机器的组织n 如:乘法指令由专用乘法器还是用加法如:乘法指令由专用乘法器还是用加法器实现器实现n计算机实现计算机实现Realizationn底层的器件技术、微组装技术、冷却技底层的器件技术、微组装技术、冷却技术等术等n如:加法器底层的物理器件类型及微组如:加法器底层的物理器件类型及微组装技术装技术系列机系列机1313计算机的实现 半导体技术半导体技术 制造技术制造技术 封装技术封装技术 装配技术装配技术 电源技术电源技术 冷却技术冷却技术 14142.2.1 冯诺依曼体系架构n硬件组成硬件组成n五大部分五大部分n以存储器为中心以存储器为中心n信息表示:二进制信息表示:二进制n计算机内部的控制信息和数据信息均采用二进制计算机内部的控制信息和数据信息均采用二进制表示,并存放在同一个存储器中表示,并存放在同一个存储器中n工作原理:存储程序工作原理:存储程序/指令指令(控制控制)驱动驱动n编制好的程序编制好的程序(包括指令和数据包括指令和数据)预先经由输入设预先经由输入设备输入并保存在存储器中备输入并保存在存储器中n计算机开始工作后,在不需要人工干预的情况下计算机开始工作后,在不需要人工干预的情况下由控制器自动、高速地依次从存储器中取出指令由控制器自动、高速地依次从存储器中取出指令并加以执行并加以执行15152.2.2 模型机系统结构基于基于总线的的冯诺依曼架构模型机依曼架构模型机总线子系子系统:作:作为公共通道公共通道连接各子部接各子部件,用于件,用于实现各部件之各部件之间的数据、信的数据、信息等的息等的传输和交和交换(第第4章章)存存储器子系器子系统:存放当前的运行程序和:存放当前的运行程序和数据数据(第第5章章)输入入输出子系出子系统:完成完成计算机与外部的算机与外部的信息交信息交换(第第6章章)CPU子系子系统:集成了运算器、控制器和:集成了运算器、控制器和寄存器的超大寄存器的超大规模集成模集成电路芯片路芯片(VLSI)(第(第3章)章)16161.模型机总线结构模型机总线结构按按传输信息的不同,可将信息的不同,可将总线分分为数据数据总线DB、地、地址址总线AB和控制和控制总线CB三三类:地址地址总线通常是通常是单向的,由主向的,由主设备(如如CPU)发出,用出,用于于选择读写写对象象(如某个特定的存如某个特定的存储单元或外部元或外部设备);数据数据总线用于数据交用于数据交换,通常是双向的;,通常是双向的;控制控制总线包括真正的控制信号包括真正的控制信号线(如如读/写信号写信号)和一和一些状些状态信号信号线(如是否已将数据送上如是否已将数据送上总线),用于,用于实现对设备的的监视和控制。和控制。MPURAMROMI/O接口接口外设外设ABDBCB17172.模型机内存储器存存储器器组织由由许多字多字节单元元组成,每个成,每个单元都有一个唯一的元都有一个唯一的编号(存号(存储单元地址),保存的信息称元地址),保存的信息称为存存储单元内容。元内容。访问(读或写或写)存存储单元元:存:存储单元地址元地址经地址地址译码后后产生生相相应的的选通信号,同通信号,同时在控制信号的作用下在控制信号的作用下读出存出存储单元内元内容到数据容到数据缓冲器,或将数据冲器,或将数据缓冲器中的内容写入冲器中的内容写入选定的定的单元。元。1818small endianness1919各种各种宽度信息的存度信息的存储(a)按任意相连存储紧凑,但访问需要2总线操作(b)按整数边界存储 有浪费,但访问效率高20203.输入/输出子系统n计算机与直接相联的外围设备进行数据交换的过计算机与直接相联的外围设备进行数据交换的过程通常称为输入程通常称为输入/输出输出(In/Out),而与远方设备进,而与远方设备进行数据交换的过程习惯上称为数据通信行数据交换的过程习惯上称为数据通信(data communication)2121算术逻辑单元算术逻辑单元ALU累加器累加器ACC累加锁存器累加锁存器暂存暂存器器标志寄存器标志寄存器FR通用寄存器组通用寄存器组堆栈指针堆栈指针SP程序计数器程序计数器PC微微 操操 作作 控控 制制 电电 路路指令译码器指令译码器ID指令寄存器指令寄存器IR 操作码操作码,地址码地址码脉冲分配器脉冲分配器时钟脉冲源时钟脉冲源控制总线控制总线CB地址总线地址总线AB数据总线数据总线DB内部总线内部总线地址缓冲器地址缓冲器数据缓冲器数据缓冲器运算器运算器寄存器组寄存器组控制器控制器4.模型机CPU子系统2222模型机指令系统指令是指令是发送到送到CPU的命令,指示的命令,指示CPU执行一个特定的行一个特定的处理,理,如从存如从存储器取数据、器取数据、对数据数据进行行逻辑运算等。运算等。CPU可以可以处理的全部指令集合称理的全部指令集合称为指令集指令集(Instruction Set)。指令集。指令集结构构(ISA,Instruction Set Architecture)是体系是体系结构的主构的主要内容之一,要内容之一,对CPU的基本的基本组织会会产生非常大的影响。生非常大的影响。ISA功能功能设计实际就是确定就是确定软硬件的功能分配。硬件的功能分配。指令通常包含操作指令通常包含操作码和操作数两部分。操作和操作数两部分。操作码指明要完成操指明要完成操作的性作的性质,如加、减、乘、除、数据,如加、减、乘、除、数据传送、移位等;操作送、移位等;操作数指明参加上述数指明参加上述规定操作的数据或数据所存放的地址。定操作的数据或数据所存放的地址。汇编语言源程序汇编语言源程序机器语言程序机器语言程序(目标代码)(目标代码)汇编(汇编程序)汇编(汇编程序)高级语言源程序高级语言源程序编译或解释(编译程序)编译或解释(编译程序)23232.2.3 模型机常用汇编指令指指 令令 类类 型型操作码示例操作码示例操作数示例操作数示例说说 明明算算术类加法加法ADDRs1,Rs2,RdRs,Imm,Rd(Rs1)+(Rs2)(Rs1)+(Rs2)RdRd(Rs)+Imm(Rs)+Imm RdRd运算运算类指令只能指令只能对寄存器中寄存器中的数据或立即数的数据或立即数进行直接操行直接操作作减法减法SUBRs1,Rs2,RdRs,Imm,Rd(Rs1)-(Rs2)(Rs1)-(Rs2)RdRd(Rs)-Imm(Rs)-Imm RdRd逻辑类位与位与ANDRs1,Rs2,RdRs,Imm,Rd(Rs1)(Rs1)(Rs2)(Rs2)RdRd(Rs)(Rs)ImmImm RdRd位或位或ORRs1,Rs2,RdRs,Imm,Rd(Rs1)(Rs1)(Rs2)(Rs2)RdRd(Rs)(Rs)ImmImm RdRd位非位非NOTRs,Rd!(Rs)Rd传送送类存存储器或器或I/O读LDRMEM,RdMEM (Rd)将指定地址的存将指定地址的存储单元或元或I/O端口的端口的值读入寄存器入寄存器Rd存存储器或器或I/O写写STRRs,MEM(Rs)(Rs)MEMMEM将寄存器将寄存器Rs的的值写入指定地址写入指定地址的存的存储单元或元或I/O端口端口寄存器寄存器访问MOVRs,RdImm,Rd(Rs)(Rs)(Rd)(Rd)跳跳转类无条件跳无条件跳转JMPLableLable(PC)条件跳条件跳转JX/JNXLableIf X为为真真/假,假,则则Lable (PC)过程程调用用CALLSub-LableSub-Lable(PC)调用子程序用子程序过程返回程返回RET-返回主程序返回主程序其他其他停机停机HLT-24242.2.4 模型机工作原理计算机的工作本算机的工作本质上就是上就是执行程序的行程序的过程。程。顺序序执行行指令指令执行的基本行的基本过程可以分程可以分为取指令取指令(fetch)、分析指令、分析指令(decode)和和执行指令行指令(execute)三个三个阶段。段。非非顺序序执行行转移(移(jump):):执行条件行条件/无条件无条件转移指令,移指令,不返回不返回过程(程(procedure)调用:主程序用:主程序调用子程用子程序后返回断点序后返回断点中断(中断(interrupt):外界突):外界突发事件事件处理完理完后返回断点后返回断点异常(异常(exception):):程序本身程序本身产生的某些例外生的某些例外处理完后重新理完后重新执行行陷阱陷阱(trap):程序本身程序本身产生某些例外条件生某些例外条件处理完后返回理完后返回断点断点2525程序的执行过程取指令、分析指令、执行指令取指令、分析指令、执行指令ABDBALU累加器累加器ACC暂存器暂存器标志寄存器标志寄存器FR寄存器组寄存器组 操作控制器操作控制器OC指令译码器指令译码器ID指令寄存器指令寄存器IR 操作码操作码,地址码地址码内部总线内部总线地址缓冲器地址缓冲器数据缓冲器数据缓冲器程序计数程序计数器器PC地地址址译译码码读控制读控制B0H5CH04H2EH地址地址1001H1002H1003H内容内容1000H内存储器内存储器MOV 5CH,R1ADD R1,2EH,R21CPU外外CPU内内26262.3 冯诺依曼体系结构的演进n演进演进nCPU指令集指令集 n存储器子系统存储器子系统 n总线总线n输入输入/输出子系统输出子系统 n改变改变n改变控制方式,发展数据、需求、模式等其它驱改变控制方式,发展数据、需求、模式等其它驱动方式;动方式;n改变串行执行模式,发展并行技术;改变串行执行模式,发展并行技术;3-6章重点章重点指令功能、指令格式、寻址方式指令功能、指令格式、寻址方式 分层结构分层结构高速总线高速总线+多种接口方式多种接口方式 冯冯诺依曼型计算机的本诺依曼型计算机的本质特点也造成了其瓶颈:质特点也造成了其瓶颈:指令执行的串行性指令执行的串行性 存储器读取的串行性存储器读取的串行性27272.3.1 不同的指令集设计策略:不同的指令集设计策略:CISC与与RISCCISC(Complex Instruction Set Computer,复杂指令集计算机),复杂指令集计算机)不断增强指令的功能以及设置更复杂的新指令不断增强指令的功能以及设置更复杂的新指令取代原先由程序段完成的功能,从而实现软取代原先由程序段完成的功能,从而实现软件功能的硬化。件功能的硬化。RISC(Reduced Instruction Set Computer,精简指令集计算机),精简指令集计算机)通过减少指令种类和简化指令功能来降低硬件通过减少指令种类和简化指令功能来降低硬件设计复杂度,从而提高指令的执行速度。设计复杂度,从而提高指令的执行速度。现代计算机:现代计算机:RISC+CISC2828按按处处理器指令架构分理器指令架构分类类n复杂指令集计算机(Complex Instruction Set Computer,CISC),如X86n控制器的设计实现复杂n包含了复杂计算指令且运行时间长n精简指令集计算机(Reduced Instruction Set Computer,RISC),如IBM的PowerPC,Sun的SPARC,MIPS的MIPS Rxxx系列n高效的编译器才能使RISC优点充分体现n指令数据少且每条指令都能在单时钟周期完成n超长指令集架构是英文(Very Long Instruction Word,VLIW),IA-64,如INTEL的IA64,AMD的X8664n简化处理器结构,删除复杂的控制器电路,每时钟周期可运行20条指令,而CISC通常只能运行1-3条指令,RISC能运行4条指令2929CISC的的设计设计思想及特点思想及特点 n每条指令执行单一功能,硬件复杂n为编程方便,往往增加指令数目,指令编码长度增加,硬件译码更复杂n为编程灵活,增加寻址方式,指令长度不一,译码复杂n每条指令完成一个完整功能,因此单条指令涉及多个操作,如取指、参数、运算、存结果等n为增加新功能,需增加新指令,因此指令系统越来越复杂,这也是CISC的由来n如MC68020机就有25种寻址模式 3030RISC的的设计设计思想及特点思想及特点 nRISC的出现简化了指令系统,克服了CISC的缺点,使更多的芯片硅面积可以用于实现流水和高速缓存,有效地提高了计算机的性能。nRISC机的设计应当遵循以下五个原则。n指令条数少,格式简单,易于译码;n提供足够的寄存器,只允许load和store指令访问内存;n指令由硬件直接执行,在单个周期内完成;n充分利用流水线;n强调优化编译器的作用 3131CISC和和RISC的区的区别别n内核内核结构构nCISC:数据:数据线和指令和指令线分分时复用,即复用,即冯.诺依曼依曼结构,程序存构,程序存储器和数据存器和数据存储器合并器合并编址址nRISC:数据:数据线和指令和指令线分离,即哈佛分离,即哈佛结构。取构。取指令和取数据可同指令和取数据可同时进行行n处理器指令集理器指令集 nCISC:不等:不等长指令集,需要指令集,需要对不等不等长指令指令进行行分割,分割,执行行时间长,采用微,采用微码nRISC:等:等长精精简指令集,指令集,执行速度快且性能行速度快且性能稳定。可同定。可同时执行多条指令,可将一条指令分割成行多条指令,可将一条指令分割成若干个若干个进程或程或线程,交由多个程,交由多个处理器同理器同时执行,行,并行并行处理方面理方面RISC明明显优于于CISCn软件件nCISC:DOS、WindowsnRISC:成熟的操作系:成熟的操作系统少,少,Windows需要翻需要翻译过程,速度慢程,速度慢3232RISC,CISC看法的误区nRISC指令都是指令都是简单简单指令指令nLDREQ R0,R1,R2,LSR#16!指令的指令的强强大,一般的大,一般的CISC处处理器望理器望尘尘莫及。莫及。RISC的的“简单简单”是指指令集的是指指令集的执执行行时间时间、指令指令长长度、指令格式整度、指令格式整齐齐划一划一nCISC的复的复杂杂指令速度慢、指令速度慢、执执行效率很低行效率很低n现现代代CISC处处理器具有非常理器具有非常长长的流水的流水线线(PIII采用了采用了25级级的的流水流水线线),),执执行速度快。但老的行速度快。但老的CPU执执行速度可能行速度可能较较慢慢n但但RISC不管是老的不管是老的CPU,还还是新的是新的CPU,指令,指令执执行行时间时间都是相同的,不需要在都是相同的,不需要在对对指令指令执执行作出行作出优优化化nRISC处处理器比理器比CISC处处理器需要更多的寄存器理器需要更多的寄存器n这这不是一个需求不是一个需求问题问题,而是一个,而是一个实现问题实现问题。所以有的。所以有的CISC寄存器与寄存器与RISC相当。一般情况相当。一般情况RISC需要比需要比较较多的寄多的寄存器存器nRISC都有流水都有流水线线nARM2没有采用流水没有采用流水线线3333CISC与与RISC的数据流的数据流IRIDREGALUMEM开始开始退出退出IRIDALUMEMREG微操作通道微操作通道开始开始退出退出单通数据通道单通数据通道RISC:Load/Store结构结构CISC:寻址方式复杂:寻址方式复杂3434分层的存储子系统分层的存储子系统n如何以合理的价格搭建出容量和速度都满足要求的存储系统,如何以合理的价格搭建出容量和速度都满足要求的存储系统,始终是计算机体系结构设计中的关键问题之一。始终是计算机体系结构设计中的关键问题之一。n现代计算机系统通常把不同的存储设备按一定的体系结构组现代计算机系统通常把不同的存储设备按一定的体系结构组织起来,以解决存储容量、存取速度和价格之间的矛盾织起来,以解决存储容量、存取速度和价格之间的矛盾设计目标:整个存储系统速度设计目标:整个存储系统速度接近接近M1M1而价格和容量接近而价格和容量接近MnMn3535存存储子系子系统n主存(内存):主存(内存):DRAM(存存储数据和数据和临时调入的程序入的程序)、FLASH(存存储引引导程序、固化程序程序、固化程序(固件固件),占用,占用寻址址空空间,临时性存性存储,解决速度,解决速度问题n编址方式:字址方式:字节编址址n信息存放方式:大信息存放方式:大/小端小端(big/small endianness)系系统n辅存(外存):磁存(外存):磁盘、光、光盘。文件。文件/块存存储,虚,虚拟存存储介介质,较长时间存存储,解决容量,解决容量问题n均衡速度、容量、成本、均衡速度、容量、成本、长期存期存储等要求而分等要求而分级n存存储器需考器需考虑的主要因素的主要因素n速度、容量、成本速度、容量、成本3636其他增加存储器带宽的方法并行存储器并行存储器双端口存储器双端口存储器哈佛体系结构哈佛体系结构DSP程序程序数据数据I/O接口接口外设外设程序地址程序地址数据读地址数据读地址数据写地址数据写地址程序读总线程序读总线数据读总线数据读总线程序程序/数据写数据写数据数据程序程序3737现代高速总线现代高速总线高速并行总线高速并行总线高速总线串行化高速总线串行化3838多级总线结构北桥北桥南桥南桥前端总线前端总线Front Side Bus3939外部总线、外部总线、(系统系统)外总线外总线如并口、串口如并口、串口系统总线、系统总线、(系统系统)内总线内总线如如ISAISA、PCIPCI片片(间间)总线总线三总线形式三总线形式片内总线片内总线单总线形式单总线形式计算机系统的四层总线结构运算器运算器寄存器寄存器控控制制器器CPU存储存储芯片芯片I/O芯片芯片主板主板扩展扩展接口板接口板扩展扩展接口板接口板计算机系统计算机系统其其 他他 计算机计算机系系 统统其其 他他仪仪 器器系系 统统4040输入输出管理方式41412.3.2 并行处理技术并行处理技术指令指令级并行技并行技术ISP流水流水线、超、超标量、超量、超长指令字指令字系系统级并行技并行技术SLP多多处理器(多机理器(多机/多核)、多磁多核)、多磁盘线程程级并行技并行技术TLP同同时多多线程程SMT电路路级并行技并行技术CLP组相相联cache、先行、先行进位加法器位加法器 并行处理技术实现多个处理器或处理器模块的并并行处理技术实现多个处理器或处理器模块的并行性,其基本思想包括时间重叠(行性,其基本思想包括时间重叠(time interleaving)、资源重复()、资源重复(resource replicaiton)和资源共享(和资源共享(resource sharing)。)。42422.3.3 流水线技术流水线技术 可通可通过分分割割逻辑,插入插入缓冲冲寄存器寄存器(流水(流水线Reg)来)来构建构建4343指令时空图顺序顺序执行执行4级流级流水线水线执行执行流水线满载流水线满载4444更细的流水线更细的流水线取指(取指(FI)指令指令译码(DI)计算操作数地址(算操作数地址(CO)取操作数(取操作数(FO)执行指令(行指令(EI)写操作数(写操作数(WO)4545流水线CPU的特点优点:点:通通过指令指令级并行来提高性能。并行来提高性能。缺点:缺点:增加了硬件成本。增加了硬件成本。流水寄存器会引入延流水寄存器会引入延迟和和时钟偏移,偏移,这些些额外开外开销会使每条指令的会使每条指令的执行行时间有所增加,有所增加,同同时限制了流水限制了流水线的深度。的深度。流水流水线中各段的操作存在关中各段的操作存在关联(dependence)时可能会引起流水可能会引起流水线中断,中断,从而影响流水从而影响流水线的性能和效率。的性能和效率。4646流水线冲突流水线冲突理想流水理想流水线的性能:每个的性能:每个时钟周期完成一条指令周期完成一条指令实际流水机器中可能存在冒流水机器中可能存在冒险(hazard)导致停致停顿:数据冲突(如后面的数据冲突(如后面的计算要用到前面的算要用到前面的结果)果)定向技定向技术可将可将结果数据从其果数据从其产生的地方直接生的地方直接传送到送到所有需要它的功能部件所有需要它的功能部件编译器可利用流水器可利用流水线调度(度(scheduling)技)技术来重来重新新组织指令指令顺序序结构冲突(硬件构冲突(硬件资源不源不够)增加增加额外的同外的同类型型资源源改改变资源的源的设计使其能被同使其能被同时使用使用控制冲突(分支等跳控制冲突(分支等跳转指令引起指令引起)可采用分支可采用分支预测及及预测执行技行技术最大限度地使最大限度地使处理理器各部分保持运行状器各部分保持运行状态。多端口的寄存器堆多端口的寄存器堆哈佛结构存储器、超标量哈佛结构存储器、超标量4747流水线数据冲突及乱序执行注意注意这里其里其实需要需要两个独立两个独立执行部件行部件4848流水线结构冲突及超标量流水线流水线结构冲突及超标量流水线?有有5个执行单元的超标量流水线个执行单元的超标量流水线有有2套硬件的套硬件的超标量流水超标量流水线线CPU 共用一个取指单元的共用一个取指单元的5段双流水线段双流水线49492.3.4 超标量CPU的体系结构超超标量技量技术:可在一个:可在一个时钟周期内周期内对多条指令多条指令进行并行并行行处理,使理,使CPI小于小于1;特点:特点:处理器中有两个或两个以上的相同的功能部件;理器中有两个或两个以上的相同的功能部件;要求操作数之要求操作数之间必必须没有相关性;没有相关性;整数指令整数指令浮点指令浮点指令5050超标量处理机一般概念性结构instruction fetching多个流水线读取及转移预测逻辑多个流水线读取及转移预测逻辑instruction decoding并行译码器,预译码技术并行译码器,预译码技术instruction dispatching动态规划动态规划instruction execution多个流水线功能单元多个流水线功能单元instruction completion暂存结果数据暂存结果数据instruction retiring真正更新真正更新Reg和和Mem中的结果数据中的结果数据 超标量结构超标量结构两条输入两条输入流水线流水线三条执行三条执行流水线流水线每个时钟周期可每个时钟周期可从存储器中获取从存储器中获取两条指令两条指令用于执行不需要访用于执行不需要访问存储器的指令问存储器的指令可处理所有需要或不需要访可处理所有需要或不需要访问存储器的指令问存储器的指令可用于进行乘、除类较复可用于进行乘、除类较复杂的算术运算杂的算术运算决定应使用哪一决定应使用哪一条执行流水线条执行流水线5252 和超标量处理机不同,超长指令字和超标量处理机不同,超长指令字VLIW(Very Long Instruction Word)依靠编译器在编译时找出指令之间潜在的)依靠编译器在编译时找出指令之间潜在的并行性,并通过指令调度把可能出现的数据冲突减少到最小,并行性,并通过指令调度把可能出现的数据冲突减少到最小,最后把能并行执行的多条指令组装成一条很长的指令,然后由最后把能并行执行的多条指令组装成一条很长的指令,然后由处理机中多个相互独立的执行部件分别执行长指令中的一个操处理机中多个相互独立的执行部件分别执行长指令中的一个操作,即相当于同时执行多条指令。作,即相当于同时执行多条指令。VLIW处理机能否成功,很大程度上取决于代码压缩的效率,处理机能否成功,很大程度上取决于代码压缩的效率,其编译程序和体系结构的其编译程序和体系结构的关系非常密切,缺乏对传关系非常密切,缺乏对传统软件和硬件的兼容,因统软件和硬件的兼容,因而不大适用一般应用领域。而不大适用一般应用领域。VLIW处理机处理机53532.3.5 多机与多核结构多机与多核结构大规模并行处理机(大规模并行处理机(MPP)是一种价格昂贵的超级计算机,)是一种价格昂贵的超级计算机,它由许多它由许多CPU通过高速专用互联网络连接。通过高速专用互联网络连接。机群(机群(cluster)由多台同构或异构的独立计算机通过高性能)由多台同构或异构的独立计算机通过高性能网络或局域网连在一起协同完成特定的并行计算任务。网络或局域网连在一起协同完成特定的并行计算任务。刀片(刀片(blade)通常指包含一个或多个)通常指包含一个或多个CPU、内存以及网络接、内存以及网络接口的服务器主板。通常一个刀片柜共享其它外部口的服务器主板。通常一个刀片柜共享其它外部I/O和电源,而和电源,而辅助存储器则有距离刀片柜较近的存储服务器提供。辅助存储器则有距离刀片柜较近的存储服务器提供。网格(网格(Network)是一组由高速网络连接的不同的计算机系统,)是一组由高速网络连接的不同的计算机系统,可以相互合作也可独立工作。网格计算机将接受中央服务器分可以相互合作也可独立工作。网格计算机将接受中央服务器分配的任务,然后在不忙的时候(如晚上或周末)执行这些任务。配的任务,然后在不忙的时候(如晚上或周末)执行这些任务。5454多核处理器5555多线程技术单片多处理器单片多处理器(Chip MulitProcessor,CMP)问题:晶体管数量、芯片面积及芯片发热量问题:晶体管数量、芯片面积及芯片发热量多线程处理器多线程处理器(Multithreaded Processor)细粒度多线程细粒度多线程(Fine-Grail Multithreading)在每个指令在每个指令中切换线程,处理器必须能在每个时钟周期切换线程。中切换线程,处理器必须能在每个时钟周期切换线程。其优点是可以隐藏停顿引起的吞吐量损失;缺点是单其优点是可以隐藏停顿引起的吞吐量损失;缺点是单个线程处理速度变慢了。个线程处理速度变慢了。粗粒度多线程粗粒度多线程(Coarse-Grail Multithreading)仅当遇仅当遇到开销大的阻塞时才切换线程其缺陷在于流水线启动到开销大的阻塞时才切换线程其缺陷在于流水线启动开销引起吞吐量损失,特别是对于短的阻塞开销引起吞吐量损失,特别是对于短的阻塞56562.4 计算机体系结构的分类 Flynn分类:根据指令流和数据流的多少进行分类分类:根据指令流和数据流的多少进行分类单指令单数据单指令单数据SISD单指令多数据单指令多数据SIMD多指令单数据多指令单数据MISD多指令多数据多指令多数据MIMDCU控制部件控制部件PU处理部件处理部件MM存储单元存储单元CS为控制流为控制流DS为数据流为数据流IS为指令流为指令流传统的顺序处理机、传统的顺序处理机、标量流水线处理机、标量流水线处理机、超标量流水线处理机超标量流水线处理机阵列处理机、阵列处理机、向量处理机向量处理机无实际机型对应无实际机型对应多处理机系统多处理机系统57572.5 计算机系统的性能测定计算机系算机系统的性能由硬件性能和程序特性决定,通常可的性能由硬件性能和程序特性决定,通常可利用利用标准准测试程序来程序来测定性能。定性能。用用MIPS(Million Instructions Per Second,每秒百万每秒百万条指令条指令)或或MFLOPS(每秒百万次浮点操作每秒百万次浮点操作)的数的数值来来衡量衡量计算机系算机系统的硬件速度。的硬件速度。用用 CPU执行行时间T来量化硬来量化硬软件件结合系合系统的有效速度。的有效速度。MIPS=f(MHz)/CPI T(s)=(IC CPI)/f(Hz)f(时钟频率):率):CPU的基本工作的基本工作频率率 IC(指令数目):运行程序的指令(指令数目):运行程序的指令总数数 CPI(Cycles Per Instruction):指令):指令执行的平均周行的平均周期数,可从运行大量期数,可从运行大量测试程序或程序或实际程序程序产生的生的统计数据中数据中计算出来算出来 CPI数越小数越小CPU速度越快速度越快5858计算机系统性能量度值计算假设一台计算机的时钟频率是假设一台计算机的时钟频率是100 MHz(每秒百万周期每秒百万周期),具有,具有4种类型的指种类型的指令,它们的使用率和令,它们的使用率和CPI分别如下表所示。求该计算机的分别如下表所示。求该计算机的MIPS值以及运行一值以及运行一个具有个具有107条指令的程序所需的条指令的程序所需的CPU时间。时间。5959n冯冯.诺诺依曼依曼计计算机由哪几部分构成?算机由哪几部分构成?连连接接这这些部分的些部分的总线总线按功能不同分按功能不同分为为哪几哪几类类?冯冯.诺诺依曼依曼计计算机与哈弗算机与哈弗结结构构计计算机有什么不算机有什么不同?同?6060
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!