计算机系统结构2011串讲与汇总(第二部分)

资源描述

.wd.第四章存储体系1. 对存储器的根本要求是：大容量、高速度和低价格。2. 存储器容量为：SM = Wlm (其中W为存储体的字长，l为存储体的字数， m为并行工作的存储体数)3. 单体最大频宽：Bm = W/TMm体在座体并行的最大频宽：Bm = Wm/TM (TM 为连续启动一个在存储体所需时间间隔)4. 并行主存系统：能并行读出多个CPU字的单体多字、多体单字、多体多字的穿插访问主存系统系统为并行主存系统。5. 为什么主存实际频宽不是随着模m的提高而线情增大：(1)工程实现上由于模m越高，存储器数据总线越长，总线并联的负载越重，有时不得不增加门的级数，这些会使传输延迟增加(2)实际程序中指令不总是顺序执行的，一旦出现转移，效率就会下降，而数据的性比指令的还差，实际的效率还更低。6. CPU与主存速度差给系统性能带来影响，解决方法有：(1)在CPU中设置通用存放器 (2)采用存储器的多体穿插并行存取 (3)采用Cache存储器。7. 存储体系设计的主要依据是：程序访存的局部性，其主要包括：(1) 时间上：最近的未来要用到的信息很可能是现在正在使用的信息，这是因为程序存在循环。(2) 空间上：最近的未来要用到信息很可能与现在正在使用的信息在程序空间上是邻近的，这是因为指令常是顺序存放、顺序执行，数据通常是以微量、阵列、树形、表格等形式簇聚地存放的。8. 命中率指CPU产生的逻辑地址能在M1中访问到(命中到)的概率。假设逻辑地址流的信息能在M1中访问到的次数为R1，当时在M2中还未调到M1的次数为R2，则命中率HR1 /R1+R2。影响因素：地址流、预判算法、M1的容量等9. 未命中率(失效率)是指由CPU产生的逻辑地址在M1中访问不到的概率。对二级存储层次，失效率为1-H10. 段式管理：将主存按段分配的存储管理方式称为段式管理。将虚地址程序号，段号，段内位移通过段表找到段的基地址，然后再形成物理地址，访问存储器。段表构造=段名，段地址，装入位，段长，访问方式11. 段式管理的主要优点：1程序模块化的性能好，各段在功能上是相互独立的；2便于程序与数据的共享；3便于实现存储保护。12. 段式管理的主要缺点：1地址变换所需的时间比拟长2主存的空间利用不充分。13. 页式管理：把主存空间和程序空间都机械等分成固定大小的页(页面大小随机器而异)14. 页式存储的优点：1主存储器的空间利用率比拟高。2页表比拟简单，大大简化了映像表的硬件，节省了页表的存储量3地址映象与地址转换速度比拟快。15. 页式存储的缺点：1页表很长，占用很大的存储空间。 2程序的模块化性能不好。16. 段页式管理：把实存机械的等分成固定大小的页，把程序按模块分段，每个段分成与主存页面大小一样的页，每道程序通过一个段表和相应于每段的一组页表来进展定位。17. 装入位:标识该段的页表是否已装入主存。地址字段:指明已装入页表在主存中的起始地址。访问方式:指明该段的控制保护信息。页表长:指明该段页表的行数。18. 地址的映象：将每个虚存单元按什么规则算法装入定位于实存，建设起多用户虚地址与实地址之间的对应关系。19. 页面替换算法：1随机算法(RAND) 2先进先出法(FIFO)3近期最少使用法/近期最久未用算法(LRU法)4最优替换算法(OPT)第五章重叠、流水和向量处理机20. 指令的解释方式一般分为顺序、重叠、流水三种。21. 解释一条机器指令的微操作可归并为：1取指令、2分析、3执行三个局部。（1）取指令：是按指令计数器的内容访主存，取出该指令送到指令存放器。（2）指令分析：是对指令的操作码进展译码，按寻址方式和地址字段形成操作数真地址，并用此真地址去取操作数。为取下条数据，还要形成下条指令的地址。（3）指令的执行：是对操作数进展运算、处理，或存储运算结果。(可能要访主存)22. 顺序解释：指的是各条指令之间顺序串行进展。即执行完一条指令后才取下一条指令优点：控制简单，节省设备；缺点：速度慢，机器各部件的利用率很低；23. 重叠解释：是在解释第K条指令的操作完成之前，就可以开场解释第K+1条指令。24. 重叠解释方式存在着访存冲突，解决访主存的冲突的几种方式：1主存分成两个独立编址的存储器，一个专门存放指令一个专门存放操作数；加重了主存总线控制的复杂性及软件设计麻烦2指令和数据仍然混存在一个存储器中，采用多体穿插主存构造；不能根本解决3增设采用先进先出方式工作的指令缓冲存放器指缓。25. 一次重叠：把取指令操作隐含在分析、执行指令过程中，则在任何时候只允许上条指令“执行与下条指令“分析相重叠。26. 相关：因程序相邻指令之间出现了关联，为防止出错它们不能同时解释。这种现象称发生了“相关。1数相关：第K+1条指令的源操作数地址正好是第K条指令结果地址。分为(1)主存空间的数相关(2)通用存放器组的数相关顺序解释没问题，而重叠解释时，在“执行K和“分析K+1重叠时就出现问题。2指令相关：经过第K条指令的执行来形成第K+1条指令。重叠解释时先从指缓中取到第K+1条指令是旧内容出错指令相关是因为机器指令允许修改引起的。27. 指令相关的处理：可通过限定程序运行过程中不准修改指令不可行。IBM370采用“执行指令。被修改的指令以“执行指令的操作数形式出现，将指令相关转成数相关。这样只要统一进展数相关处理就可以了28. 主存空间数相关的处理：相邻两条指令之间出现对同一主存单元要求先写后读的关联。(设置优先级：写优先级读优先级)29. 通用存放器组相关a.通用存放器组数相关 b.通用存放器组基址和变址值相关的处理：(1)推后分析K+1 (降低速度为代价)(2)设置相关专用通路增加设备为代价30. 流水是重叠的进一步延伸：一次重叠：把指令的解释分成两个子过程，同时解释两条指令。流水：把指令的解释分成多个子过程，同时解释多条指令。31. 流水的最大吞吐率：流水线满负荷，每隔 t流出一个结果时所到达的吞吐率。32. 流水的分类：流水按扩展方向分类：1流水向下扩展：把子过程进一步细分。(过程并行)2流水向上扩展：在多个处理机之间流水。(任务并行)流水按处理级别分为1部件级的流水：构成部件内的各个子部件之间的流水。如运算器内的“浮点加流水2处理机级流水：构成处理机的各个部件之间的流水。如取指、分析、执行的流水3系统级流水：构成计算机系统的多个处理机之间的流水，也称为宏流水。按流水线的功能多少分为：1单功能流水线：只能实现一种功能的流水。如“浮点加流水2多功能流水线：同一流水线的各个段之间可以有多种不同的连接方式实现多种不同的运算或功能的流水。(a)静态流水线：在某一时间内各段只能按一种功能联接流水，只有等流水线全部流空后，才能切换成按另一种功能来联接流水。实现简单。(b)动态流水线：各功能段在某一时间内可按不同运算或功能联接。控制复杂。从流水线中各功能段之间是否有反响回路分为：1线性流水线：各个段之间串行连接，无反响也无跳跃，每个任务流经流水线中各个段均只有一次。2非线性流水线：各个段之间除了有串行连接，还有反响回路，使一个任务流经流水线时，需屡次经过某段或越过某段。按机器所具有的数据表示分为：1标量流水机 2向量流水机33. 流水处理机的主要性能：1吞吐率2效率34. 吞吐率：指在单位时间内流水线完成的任务数或输出的结果数。TP = n /Tk (n表示任务数，Tk表示完成n个任务所需时间)35. 最大吞吐率：TPmax = 1/maxt1,t2, t3tn36. 瓶颈子过程：流水线中经过时间最长的子过程。37. 消除瓶颈的方法：1将瓶颈子过程再细分2重复设置多套瓶颈段并联38. 加速比Sp：流水方式相对于非流水顺序方式速度提高的比值。39. 效率：流水线设备的实际使用时间占整个运行时间之比，也称流水线设备的时间利用率。40. 影响流水线效率不高的因素包括：1静态多功能流水线流水时，总有一些本功能用不到的段处于空闲状态。2流水建设过程中，本功能要用到的某些段也有局部处于空闲状态。3功能切换时，增加了前一种功能流水的排空时间及后一种功能流水的建设时间。4上一步运算的结果要送到流水线的输入端，下一任务才能开场。41. 全局性相关：机器系统出现相关时，影响面较宽，较严重，称为全局性相关。如转移指令废指缓42. 局部性相关：机器系统出现相关时，只影响相关的几条指令，最多影响流水线某些段工作的后推，不会改动指缓中预取到的指令，影响是局部的。如指令相关，主存操作数相关等43. 局部性相关的处理：流水技术是重叠技术的开展，因此，重叠机器处理相关的方法也适用于流水机器，即推后读设置相关直接通路。按流水线中流动顺序的安排，分为两种形式：1同步流动：任务(指令)流出流水线的顺序与流入流水线的顺序一致(顺序流动)。2异步流动：任务(指令)流出流水线的顺序与流入流水线的顺序不一致。44. 异步流动要处理的三种相关(都是对同一单元的要求)：1“先写后读相关：在先的指令先写入，在后的指令才能读的关联，称“先写后读相关。2“写写相关：在先的指令先写入，在后的指令才能写的相关。3“先读后写相关：在先的指令先读，在后的指令才能写的相关，称“先读后写相关。s45. 全局相关的处理：（1）猜想法：概率相近时宜选用i+1 不成功转移分枝；概率不均等时，宜选用高概率分支（2）加快和提前形成条件码（3）采取延迟转移（4）加快短循环程序的处理46. 流水机器原中断处理：主要是为了处理好中断点现场的保存和恢复。47. 向量的流水处理：将向量数据表示和流水线技术结合起来，构成向量流水处理机，使向量运算最能充分发挥出流水线效率。48. 向量的三种处理方法：1横向(水平)处理方法：以元素为单位，逐个求向量元素值。例如求：D=A*(B+C)，则进展bi+cik，k*aidi操作。横向处理适合标量处理机，发挥不出流水的优势。2纵向垂直处理方式：以向量为单位，对整个向量求结果向量。例如求：D=A*(B+C)，则进展B+CK，K*AD操作。3分组纵横处理方式：假设向量的长度过长，则可分成假设干组，使每组都能装入向量存放器组，组内按纵向方式处理，组间靠软件循环处理。49. 指令级高度并行的超级处理机：1超标量处理机2超长指令字处理机3超流水线处理机50. 超标量处理机：多条指令流水线，每个t同时流出m条指令(称为度m)，靠编译程序优化指令执行顺序。组成：冗余设置，多套部件多套单流水线部件，多部件并发工作。51. 超长指令字处理机：将水平型微码和超标量处理两者相结合。多个功能部件并发工作，共享大容量存放器堆；工作原理如下：1.编译时找出潜在并行性，进展单指令，多操作，多操作码，多数据压缩，形成超长指令。2.执行时不检测并行性与相关性，直接执行。52. 超流水线处理机：工作原理：每个t只流出一条指令，但t很小，同超标量相比度为m，是其节拍单位时间的1/m。超流水线是单流水线，t非常小，相当于原流水线的t= t/m。第六章阵列处理机53. 阵列处理机：将大量重复设置的处理单元PE按一定方式互连成阵列，在单一控制部件CU控制下对各自所分配的不同数据并行执行同一指令规定的操作，是操作级并行的SIMD计算机。处理单元PE是不带指令控制部件的算术逻辑部件从CU看，指令是串行执行的，从PE看，数据是并行处理的。主要用于高速向量或矩阵运算中54. 阵列处理机的根本构形：1采用分布式存储器的阵列处理机构形2采用集中式共享存储器的阵列处理机构形55. 阵列处理机的特点：1速度快，潜力大 2模块性好，生产和维护方便3可靠性高，容易实现容错和重构 4效率低5潜力大6依赖于互连网络和并行算法7需要有一台高性能的标量处理机56. 阵列处理机的并行算法举例：1矩阵加2矩阵乘3累加和57. SIMD计算机的互连网络：1 根本的单级互连网络2多级互连网络58. 根本的单级互连网络：1立方体单级网络2PM2I单级网络3混洗交换单级网络59. 多级互连网络：1多级立方体互连网络2多级混洗交换网络3多级PM2I网络60. 交换开关：是具有两个入端和两个出端的交换单元a.直连 b.交换 c.上播 d.下播61. 控制方式：对各个交换开关进展控制的方式a.级控制 b.单元控制 c.局部级控制第七章多处理机62. 使用多处理机的目的：1用多台处理机进展多任务处理协同求解一个大而复杂的问题来提高速度2领先冗余的处理机及其重组来提高系统的可靠性、适应性和可用性。63. 多指令流多数据流系统MIMD与单指令流多数据流系统SIMD的主要差异：并行处理机SIMD多处理机MIMD(1)构造灵活性主要针对向量数组处理，故具有专用性只需设计有限、固定的机间互连通路为实现作业、任务、程序段的并行，构造应灵活多变，以实现复杂的机间互连，防止争用共享的硬件资源。(2)程序并行性并行性存在于指令内部程序员解决并行性存在于指令内部和外部(表现在多任务的并行) 利用算法、程序、编译、OS、指令、硬件等解决(3)并行任务活派生由指令反映数据间能否并行计算，并启动多个处理单元并行工作需专门指令或语句指明程序中各程序段的并发关系，控制他们的并发执行，使一个任务执行时可派生出另一些任务(4)进程同步本来就是同步的，无需干预假设并发程序之间有数据相关或控制依赖，需要采取同步措施(5)资源分配和任务调度可知道实际参加并行执行的处理单元数无法知道并行执行的处理单元数故需要解决资源分配任务调度64. 多处理机MIMD存在的主要技术问题：1硬件构造上，如何解决好处理机、在座器模块及I/O了系统间的互连。2如何最大限度开发系统的并行性，以实现多处理机各级的全面并行。3如何选择任务和子任务的大小，即任务的粒度，使并行度高，辅助开销小。4如何协调好多处理机中各并行执行的任务和进程间的同步问题5如果将任务分配到多处理机上，解决好处理机调度、任务高度和资源分配，防止死锁。6一旦某处理机发生故障，如何对系统进展重新组织，而不使其瘫痪。7多处理机机数增多后，如何能给编程者提供良好的编程环境，减轻程序的复杂性。65. 多处理机有紧耦合和松耦合两种。66. 紧耦合多处理机：通过共享主存实现处理机间通讯的，其通讯速率受限于主存频宽。各处理机与主存经互连网络连接处理机数受限于a.互连网络带宽 b.各处理机访主存冲突的概率67. 松耦合多处理机：每台处理机都有一个容量圈套的局部存储器，用于存储经常用的指令和数据，以减少紧耦合系统中存在的访主存冲突。(不同处理器之间通过a.通道互连实现通信或通过b.消息传送系统MTS来交换信息)68. 多处理机机间互连的形式：1总线2环形互连3穿插开关4多端口存储器5开关枢纽构造69. 提高总线形式的系统效率的方法：1用优质调频同轴电缆来提高总线的传输速率2用多总线方式来减少访总线的冲突概率。70. 解决多个处理机同时访问公用总线的冲突的仲裁算法：1静态优先级算法2固定时间片算法3动态优先级算法4先来先服务算法71. 并行程序设计语言根本要求：能使程序员在其余灵活方便地表示出各类并行性，能在各种并行/向量计算机系统中高效地实现72. 并行进程的特点：这些进程在时间上重叠地执行，一个进程未完毕，另一个进程就开场73. 并行任务的派生：使一个任务在执行的同时，派生出可与它并行执行的其他一个或多个任务，分配给不同的处理机完成74. 多处理机的操作系统：1主从型2各自独立型3浮动型第八章其他系统构造75. 脉动阵列构造的特点：（1）构造简单、规整，模块化强，可扩大性好，非常适合用超大规模集成电路实现。（2） PE间数据通信距离短、规则，使数据流和控制流的设计、同步控制等均单单规整。（3）所有PE能同时运算，具有极高的并行性；输入数据能被多个处理单元重复使用，大大减轻了阵列与外界I/O通信量（4）脉动阵列构造的构形与特定计算任务和算法密切相关，具有某种专用性，限制了应用范围，这对VLSI是不利的。76. 开展通用脉动阵列构造的途径：（1）通过增设附加的硬件，对阵列的拜年构造和互连方式用可编程开关进展重构（2）用软件把不同的算法映象到固定的阵列构造上（3）探寻与问题大小无关的脉动阵列处理方法，以及VLSI去处系统的侵害矩阵算法，使它们可以抑制阵列只能求解固定大小题目的缺陷，同时探寻开展适合一类计算问题的通用算法和相应的设置方案。77. 大规模并行处理机MMP：将数百至数万个高性能、低本钱的RISC微处理器用互连网络互连组成的系统。78. 机群系统：将多个高性能的工作站或高档微型计算机，使用调整的通信网络加以互连组成的系统。79. 机群系统比起传统的并行处理系统的优点：（1）系统有高的性能价格比。（2）系统的开发周期短（3）系统的可扩展性好（4）系统的资源利用率高（5）用户投资风险小（6）用编程方便80. 数据驱动的数据流方式：只要一条或一组指令所要求的操作数全部全部准备就绪，就可以立即激发相应的指令或指令组执行。81. 数据驱动的数据流方式的特点：没有通常的共享变量的概念，即没有共享存储数据的概念，指令执行顺序只受指令中数据相关性的制约，数据是以数据令牌方式直接在指令之间传递的。82. 控制驱动的控制方式的特点：通过访问共享存储单元让数据在指令之间传递；指令执行的顺序性隐含于控制流中，可以显式使用专门的控制操作符来实现并行处理；指令执行顺序受程序计算机器的控制，即受控制令牌所支配。83. 数据令牌：实质上是一种表示某一操作数或参数已准备就绪的标志。84. 需求驱动计算：按需求值，只有当某一函数需要用到某一自变量时，才驱动对该自变量的求值操作，是一种滞后求值的策略。85. 数据流是基于1异步性和2函数性的一种计算模型。1异步性：是指一旦操作数到齐就开场操作，这是数据流计算机开拓并行性的根基。2函数性：是指每一数据流操作都是消耗一组输入值，产生一组输出值而不发生副作用，具有变量出现在赋值语句左边仅一次的单赋值我，从而保证任何两个并发操作可以按任意次序执行，而不会相互干扰。86. 数据流计算机的构造：1静态数据流机数据令牌没有加标号2动态数据流机数据令牌加标号87. 数据流机器存在的问题：（1）如果题目本身数据相关性很强，内涵并行性成分不多时，效率反而比传统机还要低。（2）为给数据建设、识别、处理标记，需要花费较多辅助开销和较大存储空间，但如果不用标记则无法递归并会降低并行能力（3）对标量算有利，而对数组、递归及其他高级操作较难管理。数据流机不保存数组（4）数据流语言的变量代表数值而不是存储单元位置，程序员无法控制存储分配。为有效回收存储单元需增大编译程序的难度（5）数据流机互连网络设计困难，I/O系统仍不够完善。（6）数据流机没有程序计数器，给诊断和维护带来困难。88. 归约机：针对函数程序设计语言的特点和问题来设计支持函数式程序运行的新计算机。基于数据流计算模型，需求驱动89. 归约机的特点：（1）归约机应当是面向函数式语言，或以函数式语言为机器语言的非Neumann型机器。（2）具有大容量物理存储器并采用大虚存容量的虚拟存储器，具备高效的动态存储分配和管理软硬件支持。（3）处理局部应当是一种有多个处理器或多个处理机并行的构造形式，以发挥函数式程序并行处理的特点。（4）采用适合于函数式程序运行的多处理器机互连的构造。（5）尽量把运行进程的结点机安排成紧靠该进程所需的数据，并使运行时需相互的进程所占用的处理机也靠近，并使负荷平衡。90. 智能机：主要是一个知识信息处理系统，必须解决好有关知识的获取、表示、存储、处理和应用待诸方面的问题，使计算机能更好地模拟人类大脑的思维活动，提高学习、推理、判断和问题求解的能力。91. 智能机的重要组成局部：1知识库机2推理机3智能接口处理机92. 智能机可采用的3类程序设计语言：（1）与知识库管理系统相联系的知识程序设计语言（2）与智能接口发生交互作用的处理自然语言、语音、图像的语言（3）与解题推理子系统、知识库子系统相互联系的核心语言

展开阅读全文

计算机系统结构2011串讲与汇总(第二部分)

最新文档