计算机系统结构讲义课件

上传人:风*** 文档编号:240931115 上传时间:2024-05-18 格式:PPT 页数:126 大小:1.85MB
返回 下载 相关 举报
计算机系统结构讲义课件_第1页
第1页 / 共126页
计算机系统结构讲义课件_第2页
第2页 / 共126页
计算机系统结构讲义课件_第3页
第3页 / 共126页
点击查看更多>>
资源描述
计算机系统结构计算机系统结构(第(第2版)版)清华大学计算机系列教材清华大学计算机系列教材 郑纬民郑纬民 汤志忠汤志忠 编著编著计算机系统结构(第2版)清华大学计算机系列教材课程介绍课程介绍5/18/20242计算机系统结构 第一章 基本概念课程介绍8/3/20232计算机系统结构第一章1.课程名称课程名称 Computer Architecture 计算机系统结构计算机系统结构 计算机体系结构计算机体系结构 建建筑筑物物的的设设计计或或式式样样,通通常常指指一一个个系系统统的的外外貌貌2.研究内容研究内容 从外部来研究计算机系统从外部来研究计算机系统 使用者所看到的物理计算机的抽象使用者所看到的物理计算机的抽象 编写出能够在机器上正确运行的程序所必须编写出能够在机器上正确运行的程序所必须了解到的计算机属性了解到的计算机属性5/18/20243计算机科学与技术系1.课程名称8/3/20233计算机科学与技术系3.学习目的学习目的建立计算机系统的建立计算机系统的完整概念完整概念学习计算机系统的学习计算机系统的分析方法和设计方法分析方法和设计方法了解计算机系统的了解计算机系统的最新研究成果最新研究成果4.学科方向学科方向一级学科一级学科 1 个:计算机科学与技术个:计算机科学与技术二级学科二级学科 3 个:个:计算机系统结构计算机系统结构、计算机软、计算机软件及理论、计算机应用技术件及理论、计算机应用技术全国重点学科:全国重点学科:计算机系统结构计算机系统结构、计算机应、计算机应用技术用技术5/18/20244计算机系统结构 课程介绍3.学习目的8/3/20234计算机系统结构课程介5.与其他学科的交叉与其他学科的交叉学科交叉:学科交叉:计算机组成、操作系统、汇编语言、计算机组成、操作系统、汇编语言、数据结构、微计算机技术、计算机网络、数据结构、微计算机技术、计算机网络、新内容:新内容:超标量处理机、超流水线处理机、超标量处理机、超流水线处理机、VLIW处理机、向量处理机、并行处理机、处理机、向量处理机、并行处理机、多处理机、互连网络、多处理机、互连网络、计算机系统结构正处于变革时期计算机系统结构正处于变革时期 软件软件-系统结构系统结构-实现技术实现技术,两头发展快中间慢两头发展快中间慢 非冯计算机正兴起非冯计算机正兴起 系统结构的发展时期已经到来系统结构的发展时期已经到来5/18/20245计算机系统结构 课程介绍5.与其他学科的交叉8/3/20235计算机系统结构6.课程安排课程安排课内:课内:60学时,学时,课内外比例:课内外比例:课内课内1:课外:课外1除完成作业之外,还要多看参考书除完成作业之外,还要多看参考书 多看好论文多看好论文(被被 SCI、EI 收录收录),了解国内外,了解国内外最新研究成果最新研究成果7.教材和参考书教材和参考书教材:教材:清华大学计算机系列教材:清华大学计算机系列教材:计算机系统计算机系统结构结构(第二版第二版),清华大学出版社,清华大学出版社5/18/20246计算机系统结构 课程介绍6.课程安排8/3/20236计算机系统结构课程介参考书:参考书:(1)David A.Patterson and John L.Hennessy,Computer Architecture:A Quantitative Approach 3 Ed.San Francisco:Morgan Kaufmann Publishers 中文:计算机系统结构:一种定量的方法(第中文:计算机系统结构:一种定量的方法(第二版二版,第三版即将出版),清华大学出版社第三版即将出版),清华大学出版社(2)Kai Hwang,Advanced Computer Acrchitecture Parallelism Scalability Programmability 中文:高等计算机系统结构:并行性中文:高等计算机系统结构:并行性 可扩展可扩展性性 可编程性,清华大学出版社、广西科学技可编程性,清华大学出版社、广西科学技术出版社术出版社5/18/20247计算机系统结构 课程介绍参考书:8/3/20237计算机系统结构课程介绍1.1 计算机系统结构简介计算机系统结构简介1.2 计算机系统的评价标准计算机系统的评价标准1.3 计算机系统的设计技术计算机系统的设计技术1.4 计算机系统结构的发展计算机系统结构的发展1.5 计算机系统的分类计算机系统的分类第第1章章 基本概念基本概念5/18/20248计算机系统结构 第一章 基本概念1.1计算机系统结构简介第1章基本概念8/3/202381.1 计算机系统结构简介计算机系统结构简介1.1.1 为什么要研究系统结构为什么要研究系统结构1.1.2 如何认识计算机系统如何认识计算机系统1.1.3 计算机系统结构的定义计算机系统结构的定义1.1.4 计算机组成技术计算机组成技术1.1.5 计算机实现技术计算机实现技术5/18/20249计算机系统结构 第一章 基本概念1.1计算机系统结构简介1.1.1为什么要研究系统结构81.1.1 1.1.1 为什么要研究系统结构为什么要研究系统结构1.提高处理机运算速度:提高处理机运算速度:MIPSFz IPC其中:Fz为处理机的工作主频 IPC(InstructionPerCycle)为每个时钟周期平均执行的指令条数每个时钟周期平均执行的指令条数提高提高IPC:依靠先进系统结构:依靠先进系统结构 过去,几个或几十个周期完成一条指令过去,几个或几十个周期完成一条指令 现在,一个周期完成几条指令现在,一个周期完成几条指令提高提高Fz:缩短门电路延迟,依靠技术进步缩短门电路延迟,依靠技术进步 流水线技术等,依靠先进系统结构流水线技术等,依靠先进系统结构 从指令串行执行,到从指令串行执行,到P4的的20级流水线级流水线5/18/202410计算机系统结构 第一章 基本概念1.1.1为什么要研究系统结构1.提高处理机运算速度:5/18/202411计算机系统结构 第一章 基本概念8/3/202311计算机系统结构第一章基本2.计算机性能提高的几个阶段计算机性能提高的几个阶段20世世纪纪70年年代代末末之之前前,大大型型机机和和小小型型机机计计算算机机性性能能每每年年提高提高25%30%。20世世纪纪80年年代代初初,出出现现微微处处理理机机,依依靠靠集集成成电电路路技技术术,性能性能每年提高每年提高35%20世世纪纪80年年中中期期,出出现现RISC技技术术、高高级级语语言言和和操操作作系系统等,性能统等,性能每年提高每年提高50%1995年年,先先进进系系统统结结构构对对微微处处理理器器性性能能的的贡贡献献是是单单纯纯技技术进步的术进步的5倍。倍。3.近几年及将来,计算机性能按摩尔定理发展。近几年及将来,计算机性能按摩尔定理发展。4.计算机系统的设计者们要不断创新。计算机系统的设计者们要不断创新。5/18/202412计算机系统结构 第一章 基本概念2.计算机性能提高的几个阶段8/3/202312计算机系统1.1.2 如何认识计算机系统如何认识计算机系统1.1.虚拟计算机虚拟计算机定义:定义:从不同角度所看到的计算机系统的属性从不同角度所看到的计算机系统的属性是不同的。是不同的。主要观察角度包括:主要观察角度包括:应用程序员应用程序员 系统程序员系统程序员 硬件设计人员硬件设计人员对计算机系统的认识通常只需要在某一个层次对计算机系统的认识通常只需要在某一个层次上上5/18/202413计算机系统结构 第一章 基本概念1.1.2如何认识计算机系统1.虚拟计算机8/3/202虚拟计算机系统虚拟计算机系统5/18/202414计算机系统结构 第一章 基本概念虚拟计算机系统8/3/202314计算机系统结构2.2.计算机系统的计算机系统的层次结构层次结构计算机系统可分为计算机系统可分为7 7个层次个层次 第第3 3级至第级至第6 6级由级由软件实现软件实现,称为称为虚拟机虚拟机从学科领域来划分:从学科领域来划分:第第0 0级和第级和第1 1级属于级属于计算机组成原理计算机组成原理 第第2 2级属于级属于计算机系统结构计算机系统结构 第第3 3至第至第5 5级属于级属于系统软件系统软件 第第6 6级属于级属于应用软件应用软件它们之间有交叉它们之间有交叉 例如:第3级必须依赖第4级和第5级来实现5/18/202415计算机系统结构 第一章 基本概念2.计算机系统的层次结构8/3/202315计算机系统结构计算机系统的层次结构计算机系统的层次结构5/18/202416计算机系统结构 第一章 基本概念计算机系统的层次结构8/3/202316计算机系统结构17175/18/202418计算机系统结构 第一章 基本概念8/3/202318计算机系统结构第一章基本3.3.透明性概念透明性概念定义:定义:本来存在的事物或属性,从某种角度本来存在的事物或属性,从某种角度看似乎不存在看似乎不存在例如:例如:CPUCPU类型、型号、主存储器容量等类型、型号、主存储器容量等 对对应用程序员应用程序员 透明透明 对对系统程序员、硬件设计人员系统程序员、硬件设计人员等等 不透明不透明例如:浮点数表示、乘法指令例如:浮点数表示、乘法指令 对对高级语言程序员、应用程序员高级语言程序员、应用程序员 透明透明 对对汇编语言程序员、机器语言程序员汇编语言程序员、机器语言程序员 不透明不透明例如:数据总线宽度、微程序例如:数据总线宽度、微程序 对对汇编语言程序员、机器语言程序员汇编语言程序员、机器语言程序员 透明透明 对对硬件设计人员、计算机维修人员硬件设计人员、计算机维修人员 不透明不透明5/18/202419计算机系统结构 第一章 基本概念3.透明性概念8/3/202319计算机系统结构1.1.3 1.1.3 计算机系统结构的定义计算机系统结构的定义计算机系统结构定义一计算机系统结构定义一 Amdahl于于1964年在推出年在推出IBM360系列计系列计算机时提出算机时提出:程序员程序员所所看到的看到的计算机系统的属性计算机系统的属性,即即概念性概念性结构结构和和功能特性功能特性程序员程序员:系统程序员系统程序员(包括:汇编语言、机器(包括:汇编语言、机器语言、编译程序、操作系统)语言、编译程序、操作系统)看到的看到的:编写出能在机器上正确运行的程序所编写出能在机器上正确运行的程序所必须了解到必须了解到的的5/18/202420计算机系统结构 第一章 基本概念1.1.3计算机系统结构的定义计算机系统结构定义一8/3概念性结构概念性结构 IBM360系列计算机的概念性结构系列计算机的概念性结构5/18/202421计算机系统结构 第一章 基本概念概念性结构IBM360系列计算机的概念性结构8/3/2 数据表示:数据表示:硬件能够直接认别和处理的数据类型;硬件能够直接认别和处理的数据类型;寻址技术:寻址技术:编址方式、寻址方式和定位方式等;编址方式、寻址方式和定位方式等;寄存器组织:寄存器组织:操作数寄存器、变址寄存器、控制寄存操作数寄存器、变址寄存器、控制寄存 器及专用寄存器的定义、数量和使用规则等;器及专用寄存器的定义、数量和使用规则等;指令系统:指令系统:操作类型、格式,指令间的排序控制等;操作类型、格式,指令间的排序控制等;中断系统:中断系统:中断类型、中断级别和中断响应方式等;中断类型、中断级别和中断响应方式等;存储系统:存储系统:寻址空间、虚拟存储器、寻址空间、虚拟存储器、CacheCache存储器等;存储器等;处理机工作状态:处理机工作状态:定义和切换方式,如管态和目态等;定义和切换方式,如管态和目态等;输入输出系统:输入输出系统:数据交换方式、交换过程的控制等;数据交换方式、交换过程的控制等;信息保护:信息保护:信息保护方式和硬件对信息保护的支持等。信息保护方式和硬件对信息保护的支持等。功能特性功能特性 指令系统及其执行模式指令系统及其执行模式5/18/202422计算机系统结构 第一章 基本概念数据表示:硬件能够直接认别和处理的数据类型;功能特性指令2.计算机系统结构定义二计算机系统结构定义二 研究软硬件功能分配和对软硬件界面的确定研究软硬件功能分配和对软硬件界面的确定计算机系统由软件、硬件和固件组成,它们在计算机系统由软件、硬件和固件组成,它们在功能上是同等的。功能上是同等的。同一种功能可以用硬件实现,也可以用软件或同一种功能可以用硬件实现,也可以用软件或固件实现。固件实现。不同的组成只是性能和价格不同不同的组成只是性能和价格不同,他们的系统他们的系统结构是相同的。结构是相同的。系列计算机概念:系列计算机概念:相同系统结构相同系统结构,不同组成和实不同组成和实现的一系列计算机系统。现的一系列计算机系统。5/18/202423计算机系统结构 第一章 基本概念2.计算机系统结构定义二8/3/202323计算机系统结构1.1.4 1.1.4 计算机组成技术计算机组成技术1.1.课程名称课程名称 Computer Organization 计计算算机机组组成成,计计算算机机组组织织,计计算算机机原原理理,计计算机组成原理算机组成原理2.2.研究方法研究方法 从内部研究计算机系统从内部研究计算机系统 计算机组成是指计算机系统结构的逻辑实现。计算机组成是指计算机系统结构的逻辑实现。5/18/202424计算机系统结构 第一章 基本概念1.1.4计算机组成技术1.课程名称8/3/2023243.3.主要研究内容主要研究内容 确定数据通路的宽度;确定数据通路的宽度;确定各种操作对功能部件的共享程度;确定各种操作对功能部件的共享程度;确定专用的功能部件;确定专用的功能部件;确定功能部件的并行度;确定功能部件的并行度;设计缓冲和排队策略;设计缓冲和排队策略;设计控制机构;设计控制机构;确定采用何种可靠性技术。确定采用何种可靠性技术。5/18/202425计算机系统结构 第一章 基本概念3.主要研究内容8/3/202325计算机系统结构1.1.5 1.1.5 计算机实现技术计算机实现技术计算机实现是指计算机组成的物理实现主要包计算机实现是指计算机组成的物理实现主要包括:括:处理机、主存储器等部件的物理结构;处理机、主存储器等部件的物理结构;器件的集成度和速度;器件的集成度和速度;专用器件的设计;专用器件的设计;器件、模块、插件、底版的划分与连接;器件、模块、插件、底版的划分与连接;信号传输技术;信号传输技术;电源、冷却及装配技术,制造工艺及技术等。电源、冷却及装配技术,制造工艺及技术等。随着技术、器件和应用的发展,三者之间的界随着技术、器件和应用的发展,三者之间的界限越来越模糊。限越来越模糊。5/18/202426计算机系统结构 第一章 基本概念1.1.5计算机实现技术计算机实现是指计算机组成的物理实1.2.1 运算速度运算速度1.2.2 存储器系统存储器系统1.2.3 其他性能其他性能1.2.4 价格标准价格标准1.2 计算机系统的评价标准计算机系统的评价标准5/18/202427计算机系统结构 第一章 基本概念1.2.1运算速度1.2计算机系统的评价标准8/3/201.2.1 1.2.1 运算速度运算速度 运算速度是表示处理机性能的主要指标。运算速度是表示处理机性能的主要指标。有多种表示处理机运算速度的方法。有多种表示处理机运算速度的方法。哪一种表示方法合理?哪一种表示方法合理?1.1.时钟频率(处理机主频)时钟频率(处理机主频)只能用于同一公司、同一类型、同一配置的处理机 如:Pentium4 2.0G比比Pentium4 1.6G快快25%?Pentium4 2.4G比比Pentium4 1.6G快快50%?只表示只表示CPU的指令处理能力的指令处理能力 实际运算速度还与实际运算速度还与Cache、内存、内存、I/O、被执行程序、被执行程序等均有关。等均有关。5/18/202428计算机系统结构 第一章 基本概念1.2.1运算速度运算速度是表示处理机性能的主要指标。2.2.指令执行速度指令执行速度 一种经典的表示运算速度的方法一种经典的表示运算速度的方法 MIPS(Million Instructions Per Second),GIPS,TIPS 其中:FzFz为处理机的工作主频 CPI(Cycles Per Instruction)为 每条指令所需的平均时钟周期数每条指令所需的平均时钟周期数 IPC(Instruction Per Cycle)为 每个时钟周期平均执行的指令条数每个时钟周期平均执行的指令条数例例1:计算 PentiumIV 2GHz 处理机的指令执行速度。5/18/202429计算机系统结构 第一章 基本概念2.指令执行速度8/3/202329计算机系统结构 解:解:由于 PentiumIV 2GHz 处理机的 IPC4(或CPI0.25),Fz2000MHz 因此,MIPSPentiumIV2GFzIPC20004 8000MIPS8GIPS 即每秒钟每秒钟80亿次亿次(平均每秒钟执行80亿条指令)主要优点:主要优点:直观、方便。直观、方便。目前还经常使用目前还经常使用 主要缺点主要缺点:(1)不同指令的执行速度差别很大不同指令的执行速度差别很大 (2)指令使用频度差别很大指令使用频度差别很大 (3)有相当多的非功能性指令有相当多的非功能性指令5/18/202430计算机系统结构 第一章 基本概念解:由于PentiumIV2GHz处理机的8/3/3.3.等效指令速度:等效指令速度:吉普森(吉普森(Gibson)法:)法:加减法加减法5050,乘法,乘法1515,除法除法5 5,程序控制,程序控制1515,其他,其他1515 静态指令使用频度:在程序中直接统计静态指令使用频度:在程序中直接统计 动态指令使用频度:在程序执行过程中统计动态指令使用频度:在程序执行过程中统计5/18/202431计算机系统结构 第一章 基本概念3.等效指令速度:8/3/202331计算机系统结构例例2 2:我国早期研制的一种小型计算机:我国早期研制的一种小型计算机DJS-130DJS-130 定点定点1616位,加法指令每秒位,加法指令每秒5050万次,但没有万次,但没有 硬件乘除法指令。用软件实现乘除法,速硬件乘除法指令。用软件实现乘除法,速 度低度低100100倍左右。求等效指令速度。倍左右。求等效指令速度。解:解:等效指令速度为:等效指令速度为:即每秒即每秒2 2万次,万次,由于用软件实现乘除法,等效指令速度降由于用软件实现乘除法,等效指令速度降低了低了2525倍。倍。5/18/202432计算机系统结构 第一章 基本概念例2:我国早期研制的一种小型计算机DJS-130即每秒例例3 3:假设在一般程序中浮点开平方操作:假设在一般程序中浮点开平方操作FPSQRFPSQR所占所占 的比例为的比例为2 2,它的,它的CPICPI为为100100;其他浮点操作;其他浮点操作 FP FP所占的比例为所占的比例为2323,它的,它的CPICPI4.04.0;其余;其余 75 75指令的指令的CPICPI1.331.33,计算该处理机的等效,计算该处理机的等效 CPI CPI。如果。如果FPSQRFPSQR操作的操作的CPICPI也为也为4.04.0,重新计算,重新计算 等效等效CPICPI。解:解:等效等效CPICPI1 1100100 2 24 4 23231.331.33 75753.923.92等效等效CPICPI2 24 4 25251.331.33 75752.002.00 改进了在用户程序中仅占改进了在用户程序中仅占2 2的开平方操的开平方操作,整个机器的等效运算速度提高了近一倍。作,整个机器的等效运算速度提高了近一倍。5/18/202433计算机系统结构 第一章 基本概念例3:假设在一般程序中浮点开平方操作FPSQR所占等效CPI4.4.指令执行速度的指令执行速度的 4 4 种平均方法种平均方法 算术平均:算术平均:调和平均调和平均(用速率来度量用速率来度量):加权平均加权平均加权算术平均:加权算术平均:加权调和平均:加权调和平均:5/18/202434计算机系统结构 第一章 基本概念4.指令执行速度的4种平均方法8/3/202334计算几何平均:几何平均:其中:n 指不同的程序,ETR(execution time ratio)i是第i个程序相对于参考机器正交化后的执行时间 几几何何平平均均速速度度与与所所参参考考的的机机器器无无关关,有有如如下下性质:性质:几何平均值的比率等于比率的几何平均值几何平均值的比率等于比率的几何平均值5/18/202435计算机系统结构 第一章 基本概念几何平均:8/3/202335计算机系统结构第一运行程序运行程序P1时,时,A的速度是的速度是B的的10倍;倍;运行程序运行程序P2时,时,B的速度是的速度是A的的10倍;倍;运行程序运行程序P1时,时,A的速度是的速度是C的的20倍;倍;运行程序运行程序P2时,时,C的速度是的速度是A的的50倍;倍;运行程序运行程序P1时,时,B的速度是的速度是C的的2倍;倍;运行程序运行程序P2时,时,C的速度是的速度是B的的5倍。倍。5/18/202436计算机系统结构 第一章 基本概念运行程序P1时,A的速度是B的10倍;8/3/202336计算术平均:算术平均:程序P1和P2各执行1次,B的速度是A的9.1倍;程序P1和P2各执行1次,C的速度是A的25倍;程序P1和P2各执行1次,C的速度是B的2.75倍。结论:结论:执行程序P1和P2相同次数,机器机器A最慢,机器最慢,机器C最快最快 算术平均速度:算术平均速度:三台机器的速度之比为:A:B:C=1:9.1:25 5/18/202437计算机系统结构 第一章 基本概念算术平均:8/3/202337计算机系统结构第一加权算术平均加权算术平均 加权算术平均加权算术平均W1三台机器的速度:三台机器的速度:A B C加权加权算术平均算术平均W2三台机器的速度:三台机器的速度:A C B加权算术加权算术平均平均W3三台机器的速度:三台机器的速度:C B Ds,ChCs,当当R很大时,很大时,经常使用的基本功能适宜用硬件实现经常使用的基本功能适宜用硬件实现由于:DsCs,当当V很大时,生产台数很多很大时,生产台数很多时适宜用硬件实现时适宜用硬件实现5/18/202468计算机系统结构 第一章 基本概念2.从价格因素考虑的软硬件取舍8/3/202368计算机系3.从改进性能考虑的软硬件取舍从改进性能考虑的软硬件取舍基本方法:加快经常性事件的执行速度加快经常性事件的执行速度Amdahl定律:系统中某一部件由于采用更快的系统中某一部件由于采用更快的执行方式后,整个系统性能的提高与这种执执行方式后,整个系统性能的提高与这种执行方式的使用频率或占总执行时间的比例有行方式的使用频率或占总执行时间的比例有关关。在Amdahl定律中,加速比与两个因素有关:5/18/202469计算机系统结构 第一章 基本概念3.从改进性能考虑的软硬件取舍8/3/202369计算机系改进后整个任务的执行时间为:其中:0为改进前的整个任务的执行时间。改进后整个系统的加速比达到:改进后整个系统的加速比达到:其中:Fe表示可改进部分所占的百分比,(1-Fe)表示不可改进部分所占的百分比,Se表示改进后,可改进部分的加速比。5/18/202470计算机系统结构 第一章 基本概念改进后整个任务的执行时间为:8/3/202370计算机系统例例5:某:某部件的处理时间仅为整个运行时间的40%,如果将该部件的处理速度加快到10倍,则采用加快措施后能使整个系统的性能提高多少?解:解:由题意可知:Fe=0.4,Se=10,根据Amdahl定律,加速比为:5/18/202471计算机系统结构 第一章 基本概念例5:某部件的处理时间仅为整个运行时间的8/3/2023714.改进性能的主要途径改进性能的主要途径(1)面向目标代码改进面向目标代码改进方法:方法:用一条指令代替一串指令 根据计算结果改进:例如,根据计算结果改进:例如,增加硬件乘法和硬件除法指令能够,使等效指令速度提高25倍,据统计数据改进指令功能:据统计数据改进指令功能:如数据传送指令、快速保存与恢复现场指令等 增加运算型指令的功能:增加运算型指令的功能:如函数运算指令等5/18/202472计算机系统结构 第一章 基本概念4.改进性能的主要途径8/3/202372计算机系统结构(2)面向高级语言和编译程序改进面向高级语言和编译程序改进:方法:方法:增强对高级语言和编译程序支持的指令的功能例如:在do循环中,循环体只有一二条的占60%左右,增加循环控制指令。例如:条件码对高级语言几乎无用,在并行计算机中已经取消条件码。Im1循环体循环体II+m3Im25/18/202473计算机系统结构 第一章 基本概念(2)面向高级语言和编译程序改进:Im1循环体II+m(3)面向操作系统改进:面向操作系统改进:系统结构设计要规整,消除例外情况。寄存器定义要统一(如A寄存器等)操作要均匀(如A-B与B-A)所有的存储部件都要对称进程的管理和切换存储管理和信息保护进程的同步与互斥,信号灯管理处理机工作状态和访问方式的转换这类指令的使用频度往往很低,但必须设置这类指令的使用频度往往很低,但必须设置5/18/202474计算机系统结构 第一章 基本概念(3)面向操作系统改进:8/3/202374计算机系统结构1.3.3 1.3.3 软件兼容性设计方法软件兼容性设计方法 原因:原因:软件相对于硬件的成本越来越贵,已积累了大量成熟的系统软件和应用软件。1.兼容种类兼容种类 (1)向后兼容:向后兼容:在某一时间生产的机器上运行的目标软件能够直接运行于更晚生产的机器上。(2)向前兼容:向前兼容:(3)向上兼容:向上兼容:在低档机器上运行的目标软件能够直接运行于高档机器上。(4)向下兼容:向下兼容:向后兼容必须做到,向后兼容必须做到,向上兼容尽量做到向前兼容和向下兼容,可以不考虑5/18/202475计算机系统结构 第一章 基本概念1.3.3软件兼容性设计方法原因:软件相对于硬件的成本方法一:系列机方法方法一:系列机方法 系列机定义系列机定义:具有相同的系统结构,但组成和实现技术不具有相同的系统结构,但组成和实现技术不同的一系列计算机系统同的一系列计算机系统 实现方法:实现方法:在系统结构基本不变的基础上,根据不同的在系统结构基本不变的基础上,根据不同的性能和不同的器件,研制出多种性能和价格不性能和不同的器件,研制出多种性能和价格不同的计算机系统。同的计算机系统。一种系统结构可以有多种组成,一种组成也一种系统结构可以有多种组成,一种组成也可以有多种物理实现可以有多种物理实现 如如IBM370系列机系列机:115,125,135,145,158,168等5/18/202476计算机系统结构 第一章 基本概念方法一:系列机方法8/3/202376计算机系统结构相同的指令系统,采用顺序执行、重迭、流水和并行处理方式相同的32位字长,数据通路宽度为8位、16位、32位、64位。如如PC系列机有:系列机有:不同主频不同主频:4.7MHz,500MHz,1GHz,2.4GHz,3GHz,不同扩展不同扩展:Pentium、PentiumPro、PentiumMMX、PentiumSSE、PentiumSSE2不同不同Cache:Pentium、Celeron、Xeon不同字长不同字长:8位、16位、32位、64位5/18/202477计算机系统结构 第一章 基本概念相同的指令系统,采用顺序执行、重迭、流水和并行处理方式8/3 采用系列机方法的主要优点:采用系列机方法的主要优点:(1)系列机之间软件兼容,可移植性好系列机之间软件兼容,可移植性好 (2)插件、接口等相互兼容插件、接口等相互兼容 (3)便于实现机间通信便于实现机间通信 (4)便于维修、培训便于维修、培训 (5)有利于提高产量、降低成本有利于提高产量、降低成本 采用系列机方法的主要缺点:采用系列机方法的主要缺点:限制了计算机系统结构的发展限制了计算机系统结构的发展如PC系列机,其系统结构非常落后,使用也最普及5/18/202478计算机系统结构 第一章 基本概念采用系列机方法的主要优点:8/3/202378计算机系统结方法二:模拟与仿真方法二:模拟与仿真 Simulation Emulation定义:定义:在一台现有的计算机上实现另一台计算在一台现有的计算机上实现另一台计算机的指令系统。机的指令系统。全部用软件实现的叫模拟,模拟,用软件、硬件、固件混合实现的叫仿真仿真模拟的实现方法模拟的实现方法在A计算机上通过解释或编译实现B计算机的指令系统。A机器称为宿主机宿主机,B机器称为虚虚拟机拟机。仿真的实现方法仿真的实现方法直接用A机器的一段微程序解释执行B机器的指令。A机器称为宿主机宿主机,B机称为目标机目标机。5/18/202479计算机系统结构 第一章 基本概念方法二:模拟与仿真SimulationEmulati优缺点比较优缺点比较模拟方法速度低,仿真方法速度高仿真需要较多的硬件(包括控制存储器)系统结构差别大的机器难于用仿真方法实现除了指令系统之外,还有存储系统、I/O系统、中断系统、控制台的操作等模拟方法用于计算机系统的设计过程模拟方法用于计算机系统的设计过程在一台已有的机器上用模拟方法实现正在设计中的机器的指令系统等。具体过程如下:设计方案设计方案模拟模拟性能评价性能评价修改设计修改设计投产投产5/18/202480计算机系统结构 第一章 基本概念优缺点比较8/3/202380计算机系统结构第一方法三:统一高级语言方法三:统一高级语言 实现方法:实现方法:采用同一种不依赖于任何具体机器的高级语言编写系统软件和应用软件。困难:困难:至今还没有这样一种高级语言,短期至今还没有这样一种高级语言,短期内很难实现。内很难实现。C、Ada、Java、三种方法比较:三种方法比较:采用统一高级语言最好,是努力的目标采用统一高级语言最好,是努力的目标 系列机是暂时性方法,也是目前最好的方法系列机是暂时性方法,也是目前最好的方法仿真的速度低,芯片设计的负担重,目前用于同一系列机内的兼容,1/101/2的芯片面积用于仿真5/18/202481计算机系统结构 第一章 基本概念方法三:统一高级语言8/3/202381计算机系统结构方法四:目标代码的并行编译技术方法四:目标代码的并行编译技术 一个新的研究课题一个新的研究课题一种机器的目标代码重新编译到另一种机器一种机器的目标代码重新编译到另一种机器的并行目标代码的并行目标代码 两种方法:两种方法:(1)动态代码转换动态代码转换 例例1:IBM公司研制DAISY(DynamicallyArchitectedInstructionSetfromYorktown)处理处理机机 例例2:Transmeta公司研制Crusoe处理机处理机已经大量应用于笔记本计算机,其功耗很低。(2)静态重编译静态重编译:正在研究过程中,难度很大:正在研究过程中,难度很大5/18/202482计算机系统结构 第一章 基本概念方法四:目标代码的并行编译技术8/3/202382计算机系统动态代码转换技术动态代码转换技术采用动态二进制转换技术动态二进制转换技术实现与X86等处理机兼容,把X86等通用处理机的程序直接映射到VLIW处理机中执行。IBM公司推出了开放源代码DAISY,它不仅可以实现IBM的VLIW处理器与X86处理机之间的二进制兼容,还可以实现PowerPC、S/390、IBM的Java虚拟机与VLIW处理器之间的二进制兼容Transmeta公司推出了“Code Morphing Software”,这种软件可以保证Transmeta公司的VLIW处理机Crusoe能够与X86处理机之间实现二进制代码兼容5/18/202483计算机系统结构 第一章 基本概念动态代码转换技术采用动态二进制转换技术实现与X86等处理机兼1.3.4 计算机系统设计过程计算机系统设计过程方法方法1:由上向下(:由上向下(Top-Down)设计过程:设计过程:由上向下面向应用的数学模型面向应用的高级语言面向这种应用的操作系统面向操作系统和高级语言的机器语言面向机器语言的微指令系统和硬件实现应用场合:应用场合:专用计算机的设计特点:特点:对于所面向的应用领域,性能和性能价格比很高。随着通用计算机价格降低,目前已经很少采用5/18/202484计算机系统结构 第一章 基本概念1.3.4计算机系统设计过程方法1:由上向下(Top-Do方法方法2:由下向上(:由下向上(Bottom-Up)设计过程:设计过程:根据当时的器件水平,设计微程序机器级和传统机器级根据不同的应用领域设计多种操作系统、汇编语言、高级语言编译器等最后设计面向应用的用户级应用场合:通用计算机的一种设计方法,应用场合:通用计算机的一种设计方法,在计算机早期设计中(6070年代)广为采用特点:特点:容易使软件和硬件脱节,整个计算机系统的效率降低。5/18/202485计算机系统结构 第一章 基本概念方法2:由下向上(Bottom-Up)8/3/202385计方法方法3:中间开始(:中间开始(Middle-Out)用于系列计算机的设计过程中用于系列计算机的设计过程中5/18/202486计算机系统结构 第一章 基本概念方法3:中间开始(Middle-Out)8/3/202386方法方法3:中间开始(:中间开始(Middle-Out)设计过程:设计过程:首先定义软硬件的分界面首先定义软硬件的分界面(指令系统、存储系统、输入输出系统、中断系统、硬件对操作系统和编译系统的支持等)然后各个层次分别进行设计然后各个层次分别进行设计(软件设计人员设计操作系统、高级语言、汇编语言、应用程序等,硬件设计人员设计传统机器、微程序、硬联逻辑等)应用场合应用场合:用于系列机的设计特点:特点:软硬件人员结合、同时设计,软硬件功能分配合理。5/18/202487计算机系统结构 第一章 基本概念方法3:中间开始(Middle-Out)8/3/2023871.4 计算机系统的发展计算机系统的发展1.4.1 冯冯诺依曼结构诺依曼结构1.4.2 器件发展的影响器件发展的影响1.4.3 应用发展的影响应用发展的影响1.4.4 改进算法的影响改进算法的影响5/18/202488计算机系统结构 第一章 基本概念1.4计算机系统的发展1.4.1冯诺依曼结构8/3/21.4.1 冯冯诺依曼结构诺依曼结构Van Nenmann基本思想于1936年1946年期间形成,由冯由冯诺依曼等人于诺依曼等人于1946年提出年提出5/18/202489计算机系统结构 第一章 基本概念1.4.1冯诺依曼结构VanNenmann基本思想于1.特点特点:存储程序、运算器为中心、集中控制存储程序、运算器为中心、集中控制存储器是字长固定的、顺序线性编址的一维结构,每个地址是唯一定义的。4096个字、40位。由指令形式的低级机器语言驱动。指令顺序执行,即一般按照指令在存储器中存放的顺序执行,程序分支由转移指令实现。运算器为中心,输入输出设备与存储器之间的数据传送都途经运算器。运算器、存储器、输入输出设备的操作以及它们之间的联系都由控制器集中控制。5/18/202490计算机系统结构 第一章 基本概念1.特点:存储程序、运算器为中心、集中控制8/3/2022.现代处理机对冯现代处理机对冯诺依曼结构的改进诺依曼结构的改进 不变的:不变的:存储程序存储程序 改变的:改变的:存储器为中心存储器为中心,总线结构总线结构,分散控制分散控制从基于串行算法变为适应并行算法,出现了向量计算机,并行计算机、多处理机等流水线处理机,超标量处理机,超流水线处理机,超标量超流水线处理机数据库计算机和知识库计算机专用计算机,如FFT变换机、过程控制计算机为获得高可靠性而研制容错计算机功能分散化、专业化,出现了各种分布计算机、外围处理机、通信处理机等5/18/202491计算机系统结构 第一章 基本概念2.现代处理机对冯诺依曼结构的改进8/3/202391计存储器为中心、分散控制存储器为中心、分散控制5/18/202492计算机系统结构 第一章 基本概念存储器为中心、分散控制8/3/202392计算机系统结构 总线结构,分散控制总线结构,分散控制总线:总线:连接计算机各功能部件的连线和管理信连接计算机各功能部件的连线和管理信息传输规则的逻辑电路称为总线。息传输规则的逻辑电路称为总线。特点:特点:在任何时刻,只能有一个部件向总线上在任何时刻,只能有一个部件向总线上发送信息,可以有多个部件同时接收信息。发送信息,可以有多个部件同时接收信息。组成:组成:数据总线、地址总线、控制总线。数据总线、地址总线、控制总线。单总线结构单总线结构CPU主存主存输入输入设备设备输出输出设备设备总线总线5/18/202493计算机系统结构 第一章 基本概念总线结构,分散控制CPU主存输入输出总线8/3/2023 双总线结构双总线结构CPU主存主存扩展总线扩展总线控制线路控制线路I/O设备设备I/O设备设备处理机总线处理机总线32MHz32或或64位位ISA/EISA8.33MHz 8、16、32位位.5/18/202494计算机系统结构 第一章 基本概念双总线结构CPU主存扩展总线I/O设备I/O设备处理机总 三总线结构三总线结构CPU主存主存PCI桥桥I/O设备设备I/O设备设备处理机总线处理机总线100MHz32或或64位位ISA/EISA8.33MHz 8、16、32位位 .PCI BUS 33MHz 4B扩展总线扩展总线控制线路控制线路I/O设备设备I/O设备设备接快速设备接快速设备接慢速设备接慢速设备5/18/202495计算机系统结构 第一章 基本概念三总线结构CPU主存PCI桥I/O设备I/O设备处理机总3.非冯计算机的发展非冯计算机的发展什么是非冯计算机?非指令驱动,什么是非冯计算机?非指令驱动,从传统的指令驱动型改变为数据驱动型,出现了数据流机计算机。从传统的指令驱动型改变为需求驱动型,出现各种图归约计算机。处理非数值化信息的智能计算机,自然语言、声音、图形和图象处理,虚拟现实处理等第五代计算机,由推理机和知识库机等组成。历经10年,召开过多次专题国际会议。神经网络计算机,仿生计算机,5/18/202496计算机系统结构 第一章 基本概念3.非冯计算机的发展8/3/202396计算机系统结构1.4.2 器件发展的影响器件发展的影响1.第第1代至第代至第4代计算机以器件来划分代计算机以器件来划分 第一代:第一代:电子管电子管(Valve)第二代:第二代:晶体管晶体管(Transistor)第三代:第三代:集成电路集成电路(LSI)第四代:第四代:大规模集成电路大规模集成电路(VLSI)第五代:智能计算机智能计算机?第五代计算机以什么作为标志来划分?第五代计算机以什么作为标志来划分?第五代计算机什么时候诞生?第五代计算机什么时候诞生?5/18/202497计算机系统结构 第一章 基本概念1.4.2器件发展的影响1.第1代至第4代计算机以器件来2.器件发展的特点器件发展的特点(1)集成度迅速提高集成度迅速提高目前水平:每个芯片有1010个晶体管单芯片内可以做大于1Gb存储器,单芯片内可以集成2个CPU全部Cache每45年提高一个数量级还远没有达到集成度的极限问题?问题?如何利用器件集成度的提高,不断改进计算机系统的性能:例如,有更多指令并行执行,有更多指令并行执行,采用更深的流水线,集成更多的采用更深的流水线,集成更多的Cache等等5/18/202498计算机系统结构 第一章 基本概念2.器件发展的特点8/3/202398计算机系统结构(2)提高提高速度空间不大速度空间不大目前CPU主频已经到达6GHz,时钟周期0.16ns,门延迟小于0.01ns极限速度30万公里/秒/21.5mm/0.01ns信号在导体中传递速度小于光速的50。Pentium芯片面积500mm2,即23mm23mm器件速度提高的余地已经很小,将来提高处理机速度更多依靠系统结构的发展可从系统结构的两个方面提高处理机速度:提高IPC,从目前的2左右提高到8以上,采用更深度的流水线和并行处理技术5/18/202499计算机系统结构 第一章 基本概念(2)提高速度空间不大8/3/202399计算机系统结构(3)价格直线下降价格直线下降CPU芯片的价格每年要下降80%(4)可靠性越来越高可靠性越来越高芯片可靠性达到108小时,连续使用1万年以上5/18/2024100计算机系统结构 第一章 基本概念(3)价格直线下降8/3/2023100计算机系统结构3.器件种类器件种类通用片通用片:逻辑关系确定大批量生产,如:CPU、存储器、寄存器现场片现场片:可以一次或多次改写逻辑关系如:PLD、PAL、PROM、EPROM、FPGA用户片用户片:各种专用芯片需要单独设计和生产。半用户片半用户片:门阵列片等标准的门电路,前几到工序已经完成;根据用户需要确定最终连线。5/18/2024101计算机系统结构 第一章 基本概念3.器件种类8/3/2023101计算机系统结构4.器件发展对计算机组成技术的影响器件发展对计算机组成技术的影响器件速度与处理机工作主频器件速度与处理机工作主频1955年第一台大型机IBM704机,主频12us,1976年巨型向量计算机CRAY,主频12.5ns,目前,Pentium4的主频已经达到3GHz器件速度与指令执行时间器件速度与指令执行时间46年来器件速度提高年来器件速度提高104,指令速度快,指令速度快108以上以上系统结构和组成技术的作用系统结构和组成技术的作用器件速度提高减慢器件速度提高减慢,处理机主频提高速度减缓处理机主频提高速度减缓 指令执行速度的提高基本保持不变指令执行速度的提高基本保持不变(摩尔定理摩尔定理)5/18/2024102计算机系统结构 第一章 基本概念4.器件发展对计算机组成技术的影响8/3/2023102计1.4.3 应用发展的影响应用发展的影响1.应用需求应用需求高结构化数值计算:气象模型,流体流动,有限元分析。非结构化的数值计算:蒙特卡洛模拟,稀疏矩阵。实时多因素问题:语音识别,图象处理,计算机视觉。海量存储和输入输出密集问题:数据库,事务处理。图形学和设计系统:计算机辅助设计。2.三个时期三个时期通用计算机:主要是通用科学计算专用计算机:科学计算、事务处理、实时控制高性能通用机:满足多种需求目前又开始多种专用处理机的研制5/18/2024103计算机系统结构 第一章 基本概念1.4.3应用发展的影响1.应用需求8/3/2023103.两个发展趋势两个发展趋势维持价格不变,利用VLSI技术等,提高性能性能基本不变,价格迅速下降一般先推出中间机型,然后再分别向高端和低端两个方向发展4.三种设计思想三种设计思想最高性能价格比最高性能价格比:商用机。主要发展方向最高性能:最高性能:国家安全需要,科技发展需要例如:银河计算机、神州计算机、最低价格:最低价格:家用学习机等5/18/2024104计算机系统结构 第一章 基本概念3.两个发展趋势8/3/2023104计算机系统结构1.4.4 改进算法的影响改进算法的影响 在多个层次上,算法影响着系统结构,在多个层次上,算法影响着系统结构,例如:快速乘法、除法、开平方等的实现:记分板算法、Tomasulo算法提高指令级并行性消除名字相关、数据相关、控制相关的算法有些问题,如果算法上有突破,不需要高性能的系统结构,而在普通系统上就能得到解决。许多算法还有改进的余地,通过算法的研究能够大幅度提高系统的性能。系统结构设计者要研究算法,应该研究一系列算法,使所有同类问题都能很好解决。5/18/2024105计算机系统结构 第一章 基本概念1.4.4改进算法的影响在多个层次上,算法影响着系统结1.5 计算机系统的分类计算机系统的分类1.5.1 按处理机性能分类按处理机性能分类1.5.2 佛林分类法佛林分类法1.5.3 库克分类法库克分类法1.5.4 冯泽云分类法冯泽云分类法1.5.5 汉德勒分类法汉德勒分类法5/18/2024106计算机系统结构 第一章 基本概念1.5计算机系统的分类1.5.1按处理机性能分类8/3/1.5.1 按处理机性能分类按处理机性能分类1.按大小划分按大小划分种类:巨型、大型、中型、小型、微型机巨型、大型、中型、小型、微型机划分原则:以性能为特征,按价格来划分以性能为特征,按价格来划分存在问题:划分的标准是随时间而变化,每年左右降低一个等级设计方法:最高性能特殊用途最佳性能价格比一般商用计算机最低价格家用计算机等Smallisfast5/18/2024107计算机系统结构 第一章 基本概念1.5.1按处理机性能分类1.按大小划分8/3/2023 价价最佳性能价格比最佳性能价格比 格格最高性能最高性能巨型机巨型机大型机大型机等性能线等性能线中型机中型机小型机小型机最低价格最低价格微型机微型机(超微型机超微型机)t-3 t-2 t-3 t-2 t-1 t-1 t t t+1t+1时期时期5/18/2024108计算机系统结构 第一章 基本概念价最佳性能价格比格最高性能巨型机大型机等性能线中型机2.按用途划分按用途划分种类:科学计算、事务处理、实时控制、工作科学计算、事务处理、实时控制、工作站、服务器、家用计算机站、服务器、家用计算机等等。划分原则:科学计算:浮点计算速度事务处理:字符处理、十进制运算实时控制:中断响应速度、I/0能力工作站:图形处理能力服务器:数据处理速度,数据存储能力家用计算机:价格便宜,软件丰富发展方向:具备上述所有功能的通用处理机各种专用处理机、协处理器、嵌入式处理机5/18/2024109计算机系统结构 第一章 基本概念2.按用途划分8/3/2023109计算机系统结构3.按数据类型划分按数据类型划分定点计算机、浮点计算机、向量计算机、堆栈计算机等4.按处理机个数和种类划分按处理机个数和种类划分单处理机并行处理机、多处理机、分布处理机关联处理机超标量处理机,超流水线处理机,VLIW处理机SMP(对称多处理机)、MPP(大规模并行处理机)、机群(Cluster)系统等5/18/2024110计算机系统结构 第一章 基本概念3.按数据类型划分8/3/2023110计算机系统结构5.按所使用的器件划分按所使用的器件划分 按使用的器件划分计算机系统的时代按使用的器件划分计算机系统的时代 第一代:第一代:电子管电子管(Valve)计算机计算机第二代:第二代:晶体管晶体管(Transistor)计算机计算机第三代:第三代:集成电路集成电路(LSI)计算机计算机第四代:第四代:大规模集成电路大规模集成电路(VLSI)计算机计算机第五代:智能计算机智能计算机?目前的绝大部分计算机系统是VLSI计算机 公认的第五代计算机什么时候诞生?公认的第五代计算机什么时候诞生?第五代计算机以什么作为标志来划分?第五代计算机以什么作为标志来划分?5/18/2024111计算机系统结构 第一章 基本概念5.按所使用的器件划分8/3/2023111计算机系统结构1.5.2 1.5.2 佛林分类法佛林分类法1966年由Michael.J.Flynn提出按照指令流和数据流的多倍性特征指令流和数据流的多倍性特征进行分类指令流指令流:机器执行的指令序列数据流数据流:由指令流调用的数据序列多倍性多倍性(multiplicity):在系统性能瓶颈部件上同时处于同一执行阶段的指令或数据的最大可能个数 四种类型四种类型(1)单指令流单数据流单指令流单数据流 SISD(SingleInstructionSingleDatastream)(2)单指令流多数据流单指令流多数据流 SIMD(SingleInstructionMultipleDatastream)(3)多指令流单数据流MISD(Multipl
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!