计算机体系结构复习题有答案.pdf

资源描述

1 体系结构复习题一、选择题（ 15 分） 1 计算机系统多级层次中，从下层到上层，各级相对顺序正确的应当是（） A.汇编语言机器级 -操作系统机器级 -高级语言机器级 B.微程序机器级 -传统机器语言机器级 -汇编语言机器级 C.传统机器语言机器级 -高级语言机器级 -汇编语言机器级 D. 汇编语言机器级 -应用语言机器级 -高级语言机器级 2 对系统程序员不透明的是（） A.Cache 存储器 B.系列几各档不同的数据通路宽度 C.指令缓冲寄存器 D.虚拟存储器 3 在计算机系统设计中，比较好的方法是（） A.从上向下设计 B.从下向上设计 C.从两头向中间设计 D.从中间开始向上、向下设计 4 不同系列的机器之间，实现软件移植的途径不包括（） A.用统一的高级语言 B.用统一的汇编语言 C.模拟 D.仿真 5 堆栈型机器比通用寄存器型机器优越的是（） A.支持先进先出类接替算法的求解 B.能更好地支持向量的运算 C.支持由逆波兰表达式将高级语言多元赋值语句直接编译生成堆栈指令程序 D.能优化存储器的空间利用率 6 浮点数尾数基值 rm=8,尾数数值部分长 6 位，可表示的规格化最小正尾数为（） A.0.5 B.0.25 C.0.125 D.1/64 7 在尾数下溢处理方法中，平均误差最大的是（） A.截断法 B.舍入法 C.恒置“ 1”法 D.ROM 查表法 8 ILLIAC 是一种（） A.流水线处理机 B.指令重叠处理机 C.阵列处理机 D.多处理机 9 能实现作业、任务级并行的异构型多处理机属（） A.MISD B.SIMD C.MIMD D.SISD 10非线性流水线是指（） A.一次运算中使用流水线中多个功能段 B.一次运算中要多次使用流水线中的某些功能段 C. 流水线中的某些功能段在各次运算中的作用不同 D. 流水线中的各个功能段在各种运算中有不同的组合 11流水机器对全局性的相关处理不包括（） A.猜测法 B.提前形成条件码 C.加快短循环程序的执行 D.设置相关专用通路 12外部设备打印机适合于连接（） A.数组多路通道或选择通道 B.字节多路通道或选择通道 C.选择通道 D.任意一种通道 13虚拟存储器常用的地址映像方式是（） A.全相联 B.段相联 C.组相联 D.直接 2 14下列关于虚拟存储器的说法，比较正确的是（） A.访主存命中率随页面大小增大而提高 B.访主存命中率随贮存容量增加而提高 C.更换替换算法能提高命中率 D.在主存命中率低时，改用堆栈型替换算法，并增大主存容量，可提高命中率 15 Cache 存储器常用的地址映像方式是（） A.全相联映象 B.页表法映象 C.组相联映象 D.段页表映象 16 对系统结构透明的是（） A.字符行运算指令 B.主存地址寄存器 C.虚拟存储器 D.VLSI 技术 17 汇编语言源程序变换成机器语言目标程序是经（）来实现的。 A.编译程序解释 B.汇编程序解释 C.编译程序翻译 D.汇编程序翻译 18 “从中间开始”设计的“中间”目前多数是在（） A.传统机器语言机器级与微程序机器级之间 B.传统机器语言机器级与操作系统机器级之间 C.微程序机器级与汇编语言机器级之间 D. 操作系统机器级与汇编语言机器级之间 19 推出系列机的新机器，不能更改的是（） A.原有指令的寻址方式和操作码 B.系统总线的组成 C.数据通路宽度 D.存储芯片的集成度 20 利用时间重叠概念实现并行处理的是（） A.流水处理机 B.多处理机 C.并行（阵列）处理机 D.相联处理机 21 在相同机器字长和尾数位数的情况下，浮点数尾数基值取小，可使浮点数（） A.运算过程中数的精度损失降低 B.数在数轴上的分布变密 C.可表示数的范围增大 D.可表示数的个数增多 22 当浮点数尾数的基值 rm=16,除尾符之外的尾数机器位数为 8 位时，可表示的规格化最大尾数值是（） A.1/2 B.15/16 C.1/256 D.255/256 23 尾数下溢处理方法中，平均误差可调整到零的方法是（） A.舍入法 B.截断法 C.ROM 查表法 D.恒置“ 1”法 24 支持动态地址再定位的寻址方式是（） A.基址寻址 B.间接寻址 C.变址寻址 D.直接寻址 25磁盘外部设备适合于连接（） A.数组多路通道或选择通道 B.字节多路通道或选择通道 C.数组多路通道或字节通道 D.任意一种通道 26最能确保提高虚拟存储器访主存的命中率的改进途径是（） A.增大辅存容量 B.采用 FIFO 替换算法并增大页面 C.采用 LRU 替换算法并增大页面 D.采用 LRU 替换算法并增大页面数 3 27下列说法正确的是（） A.Cache 容量一般不大，命中率不会很高 B.Cache 芯片速度一般比 CPU 的速度慢数十倍 C.Cache 本身速度很快，但地址变换速度很慢 D.Cache 存储器查映象表和访问物理 Cache 其间可以流水，使速度与 CPU 匹配。 28与流水线最大吞吐率高低有关的是（） A.各个子过程的时间 B.最快子过程的时间 C.最慢子过程的时间 D.最后子过程的时间 29用循环表示 PM2-1 的互连函数，应该是（） A.（ 6 4 2 0）（ 7 5 3 1） B.（ 0 2 4 6 ）（ 1 3 5 7） C.（ 0 1 2 3 4 5 6 7） D.（ 7 6 5 4 3 2 1 0） 30在共享主存的多处理机中，为减少访主存冲突，采用的方式一般是（） A.并行多体交叉主存系统 B.虚拟存储器 C.共享 Cache 存储器 D.用高速单体主存储器 31 直接执行微指令的是（） A.汇编程序 B.编译程序 C.硬件 D.微指令程序 32 从计算机系统结构上讲，机器语言程序员所看到的机器属性是（）。 A.计算机软件所要完成的功能 B.计算机硬件的全部组成 C.编程要用到的硬件组织 D.计算机各部件的硬件实现 33 不同系列的机器之间，实现软件移植的途径不包括（） A.用统一的高级语言 B.用统一的汇编语言 C.模拟 D.仿真 34 多处理机主要实现的是（） A.指令级并行 B.任务级并行 C.操作级并行 D.操作步骤的并行 35 浮点数尾数下溢处理时，最大误差最大，但下溢处理不需要时间，平均误差又趋于零的方法是（） A.截断法 B.舍入法 C.ROM 查表法 D.恒置“ 1”法 36 程序员编制程序所使用的地址是（） A.有效地址 B.逻辑地址 C.辅存实地址 D.主存地址 37 通道流量是在某个时期单位时间内传送的字节数，这个时期应是（） A.通道开始选择设备期 B.通道数据传送期 C.通道数据传送结束期 D.用户经访管指令进入管态，运行 I/O 管理程序的期间 38 用于虚拟存储器页面替换，且为堆栈型的算法是（） A.随机法 B.相联目录表法 C.比较对法 D.近期最久未用法 39 与虚拟存储器的等效访问速度无关的是（） A.页地址流 B.页面调度策略 C.主存的容量 D.辅存的容量 40采用组相联映象的 Cache 存储器，地址变换可用的方法是（） 4 A.目录表法 B.比较对法 C.页表法 D.堆栈法 41组相联映象、 LRU 替换的 Cache 存储器，不影响 Cache 命中率的是（） A.增加 Cache 中的块数 B.增大组的大小 C.增大主存容量 D.增大块的大小 42指令间的“一次重叠”是指（） A.“取指 k+1”与“分析 k” B.“ 分析 k+1”与“执行 k” C.“分析 k”与“执行 k+1” D.“取指 k+1”与“执行 k” 43静态流水线是指（） A.只有一种功能的流水线 B.功能不能改变的流水线 C.同时只能完成一种功能的多功能流水线 D.可同时执行多种功能的流水线 44在流水机器中，全局性相关是指（） A.先写后读相关 B.先读后写相关 C.指令相关 D.由转移指令引起的相关 45多处理机中在先的程序段 1 中的指令 CA*B 和在后的程序段 2 中的指令 AD+E 之间存在（）。 A.RAW 数据相关 B.WAR 数据相关 C.RAR 数据相关 D.WAR 数据相关二、填空题（ 20 分） 1. 实现程序移植的主要途径有统一高级语言、系列机、 _和 _。 2从计算机处理数据的并行性看，由低到高的并行性等级，可有位串字串、位并字串、 _和 _。 3从对执行程序或指令的控制方式上，将计算机系统分为由控制驱动的控制流方式，由数据驱动的 _流方式，按 _驱动的规约方式等。 4浮点数尾数基值增大，可使运算中的精度损失 _，可表示数的精度变 _。 5评价存储器性能的基本要求是大容量、 _和 _。 6 Cache 存储器是增加辅助 _件，使之速度接近于 Cache 的，容量是 _的。 7设 T1 和 T2 为 CPU 访问到 M1 和 M2 中信息的时间， H 为命中 M1 的概率，则由 M1 和 M2 构成的二级存储层次的等效访问时间应等于 _。 8在 ILLIAC IV 阵列机上，实现 N 个元素的累加和，相对单处理机上的顺序相加，速度提高的最大比值只是 _倍。 9就本质而言，并行性包含着 _和 _的二重含义。 10多处理机可用 FORK、 JOIN 语句来管理进程的并行，其中， FORK 用于 _ 新的进程， JOIN 用于 _先前已并发的进程。 11. 系列机软件兼容必须做到 _兼容，尽可能争取 _兼容。 12 从计算机执行程序的并行性看，由低到高的并行性等级可分为 _、指令之间、任务或进程间和 _间四级。 13 沿时间重叠技术途径发展的同构型多处理机系统的典型代表是 _处理机；沿资源重复技术途径发展的同构型多处理机系统的典型代表是 _处理机。 14自定义数据表示又分为 _表示和 _表示两类。 5 15虚拟存储器对 _程序员是透明的，对 _程序员是不透明的（填 “系统”或“应用”）。 16在 Cache 存储器写操作中，只写入 _，仅当需要块替换时，才将其写回 _。称这种修改主存块内容的方法为“写回法”。 17 8 个结点的混洗网络，其混洗函数为 Shuffle(P2 P1 P0)=_。 18解决重叠和流水中的操作数相关，不外乎是 _法和设置 _法两种基本方法。 19流水线消除速度瓶颈的方法有 _和 _两种。 20多处理机的程序段指令之间既有 RAW 相关，又有 WAR 相关，并且以交换数据为目的，则它们必须 _，且读写要 _。 21. 开发并行性是为了并行处理，并行性又包括 _和 _二重含义。 22. 提高计算机系统并行性的主要技术途径有时间重叠、 _、和 _。 23计算机按指令流和数据流及其多倍行分类，典型单处理机属于单指令流、单数据流；阵列处理机属 _；多处理机属 _。 24浮点数阶码位数影响数的可表示 _大小，尾数位数影响数的可表示 _大小。 25虚拟存储器主要是为解决主存 _满足不了要求发展出来的； Cache 主要是解决主存 _满足不了要求发展出来的 26 Cache 存储器采用组相联的映象规则是组间 _映象，组内各块间 _映象。 27多功能流水线各功能同时只能按某一种功能连接地称为 _态流水线，同时可按不同运算或功能连接地称为 _态流水线。 28 N 个端的混洗交换网络中，最远的两个入、出端的二进制编号是 _和 _，其最大距离为 2log2N-1。 29多处理机有 _和 _两种基本构型。 30多处理机实现的是 _、 _间的并行。三、判断题（ 10 分） 1系列机可将单总线改成双总线以减少公用总线的使用冲突。（） 2系统是否设浮点运算指令，对计算机系统结构是透明的。（） 3二进制数表示数据信息较之二十进制数表示，其存储空间利用率低，运算速度要快。（） 4对概率不等的事件用 Huffman 编码，其具体编码不唯一，但平均码长肯定是唯一的，且是最短的。（） 5 I/O 系统所带外设种类数量多，速度差异大，适宜采用专用总线来作 I/O 总线。（） 6 对标量数据来说，并行主存系统的实际频宽采用多体单字方式的要比采用单体单字方式组成的高。（） 7 Cache 组相联映象的块冲突概率比直接映象的高。（） 8指令的重叠解释，即可加快程序的解释，又能加快指令的解释。（） 9为了使阵列机在包括向量、数组、标量等各种题目上有尽可能高的速度性能，只需要在价格允许的情况下，尽可能增大处理单元数 N 即可。 10在多处理机上，各个任务的执行时间不同时，在各处理机总的运行时间均衡的前提下，采用不均匀分配，让各处理机所分配的任务数要么尽量的多，要么尽量的少，这样，才可使总运行时间减少。（） 6 11存储器采用单体单字，还是多体交叉并行存储，对系统结构设计应是透明的。（） 12系列机各档机器不同的数据总线线数，对计算机系统程序员和应用程序员都是不透明的。（） 13多数 I/O 系统的结构应面向操作系统设计，考虑如何在操作系统与 I/O 系统之间进行合理的软、硬件功能分配。（） 14在存储体系中，地址的映象与地址的变换没有区别。（） 15 Cache 存储器等效访问速度达不到接近于第一级 Cache 的，可以增加 Cache 容量来解决。（） 16只要将子程序进一步细分，就可以使流水线吞吐率进一步提高。（） 17 CRAY_1 向量机相邻向量指令之间，既无向量寄存器组的使用冲突，又无流水线的功能部件争用，它们可以同时并行。（） 18在集中式共享存储器的阵列处理机构形中，处理单元数 N 应大于或等于系统存储体体数 K，是各个体都能充分忙碌的工作。（） 19在多处理机系统中，两个程序段的变量可以顺序串行 x 和 y 之间，为了交换数据，程序段 1 中有 x=y，程序段 2 中有 y=x，则这两个程序段可以顺序串行和交换串行，也可以并行执行，不必采取专门的同步措施。 20在多处理机上，各个任务的执行时间不同时，在各处理机总的运行时间均衡的前提下，采用不均匀分配，让各处理机所分配的任务数要么尽量的多，要么尽量的少，这样，才可使总运行时间减少。（） 21软硬功能分配时，提高软件功能的比例会提高系统灵活性，也会提高解题速度。（） 22系列机应用软件应做到向前兼容，力争向下兼容。（） 23在高性能计算机上，信息在存储器中应按整数边界存储，即使会造成存储空间浪费也问题不大。（） 24中断嵌套时，在处理某级中断中的某个中断请求过程中是不能被同级的其他中断请求所中断的。（） 25 Cache 组相联映象的块冲突概率比直接映象的高。（） 26流水线调度是看如何调度各任务进入流水线的时间，使单功能线性流水线有高的吞吐率和效率。（） 27 CRAY_1 向量吉相邻向量指令之间，既无向量寄存器组的使用冲突，又无流水线的功能部件争勇，它们可以同时并行。（） 28 015 共 16 个处理单元用 Cube2 单级互联网络连接，第 10 号处理单元将连至第 8 号处理单元。（） 29 N 个输入、 N 个输出的立方体 log2N 级互联网络，在一次运行中，能实现任意一个入端连到任意一个出端，但不能实现这 N 个端子任意排列的连接。 30在多处理机上，各个任务的执行时间不同时，在各处理机总的运行时间均衡的前提下，采用不均匀分配，让各处理机所分配的任务数要么尽量的多，要么尽量的少，这样，才可使总运行时间减少。（）四、简答题（ 25 分） 1 简要描述计算机系统结构、计算机组成与计算机实现的定义内容。 2 简要叙述模拟和仿真的异同点。 3 什么是峰值性能、持续性能？持续性能有哪几种表示方法？ 4实现软件移植的途径有哪些？各受什么制约？ 5什么是流水线的速度瓶颈？消除这种瓶颈的方法有哪两种？ 7 6在流水线中，什么是全局性相关？处理全局性相关的方法有哪些？简要说明。 7多处理机操作系统有哪三种类型？各适合于哪类机器？ 8 CISC 和 RISC 机各有哪些主要特征？ 9、简要叙述“ 阿姆达尔定律 ”的内容和含义。 10、 RISC 机在 CPU 内部设置大量寄存器，并采用窗口重叠技术有什么好处？ 11、什么是资源冲突，什么情况下产生？如何解决？ 13、提高计算机系统并行性的技术途径有哪三个？简要解释并各举一例。 14 、 CPU 写 Cache 时，会发生 Cache 与贮存的对应复本内容不一致的现象，解决这个问题有哪些方法？各需要增加什么开销？ 15 、计算机访存有哪二种局部性规律？什么是存贮器的层次结构？五、设计与论述题（ 30 分）。 1、假设 Cache 存储器的速度是主存储器速度的 5 倍，程序执行时 90%的时间可以访问到 Cache 存储器，采用这种 Cache 存储器后，加速比多大？（ 8 分） 2、某一动态流水线有 S1、 S2、 S3、 S4 段，其特性有以下的预约表表示，（ 1）确定禁止表 F 和冲突向量 C。（ 4 分）（ 2）画出状态图，确定其最小平均等待时间和最佳调度方案，以及最大吞吐率。（ 8 分） t0 t1 t2 t3 t4 t5 t6 3、试确定在下列两种计算机系统中计算算术表达式 S=A1B1+A2B2+A3B3+A4B4的时间（ 1）具有 4 个 PE 的 SIMD 系统（ 2）具有 4 个处理机的 MIMD 系统加法需要 2 个单位时间。乘法需要 4 个单位时间。取指令和取数据所需存储器访问时间忽略不计。数据从一个 PE 到另一个 PE 的传输时间均为一个单位时间。在 SIMD 系统中， PE 间以线性环形连接，即每个 PE 与两个相邻的 PE 相连。在 MIMD 系统中，每个 PE 可以直接与其他的 PE 通信。 4 CRAY_1 机启动存储器、流水部件及寄存器写入各需一拍，“加” 6 拍，“乘” 7 拍，“访存” 6 拍。现有向量指令串： V3存储器 V4V0+V1 V2V4*V3 向量长度均为 N，计算指令串最短的执行时间。（给出必要的步骤和说明）（ 1）三条指令串行执行；（ 2）前两条并行执行后，再执行第三条指令；（ 3）采用链接技术； 5、某一 5 段的流水线需经 9 拍才能完成一个任务，其预约表如下表示，（ 3）确定禁止表 F 和冲突向量 C。（ 4）画出状态图，确定其最小平均等待时间、最大吞吐率及其调度方案。 S1 S2 S3 S4 8 t0 t1 t2 t3 t4 t5 t6 t7 t8 6、编号分别为 0、 1、 2、、 7 的 8 个处理器之间要求按下列配对通信：（ 0、 2），（ 1、 3），（ 4、 6），（ 5、 7）。试选择互联网络类型、控制方式及各级交换开关状态图。系统结构标准答案（一）一、 1（ a） , 2(d), 3(d), 4(b), 5(c), 6(x)(1/86 ),7(a), 8(c), 9(c), 10(b), 11(d), 12(b), 13(a), 14(4), 15(c) 16（ d） , 17(d), 18(b), 19(a), 20(a), 21(b), 22(x) (1-1/168 ), 23(c), 24(a), 25(a), 26(d), 27(d), 28(c), 29(a), 30(a)， 31（ c） , 32(c), 33(b), 34(b),35(d), 36(b), 37(b), 38(d), 39(d), 40(a), 41(c), 42(b), 43(c), 44(d), 45(b) 二、 1. 模拟，仿真 2. 位片串字并，全并行 3.数据，需求 4.减小，低 5.高速度，低价格 6.硬，主存 7. HT1+(1-H) T2 8.N/log2N 9.同时性，并发性 10.派生，汇合 11.后，上 12.指令内部，作业和程序 13.流水线，阵列（并行） 14.带标志符数据表示，数据描述符 15.应用，系统 16.Cache，主存 17. P1 P0 P2 18.推后法，设置相关专用通路 19.平静子程序进一步细分，瓶颈子程序并联多套 20.并行，完全同步 21.同时性，并发性 22.资源重复，资源共享 23. 单指令流、多数据流，多指令流、多数据流 24.范围，精度 25.容量，速度 26.直接，全相联 27.静，动 28.全“ 0”，全“ 1” 29.紧密耦合，松散耦合 30.作业，任务三、 1.(对 ) 2.(错 ) 3.(错 ) 4.(对 ) 5.(错 ) 6.(对 ) 7.(错 ) 8.(错 ) 9.(错 ) 10.( 错 ) 11.(对 ) 12.(错 ) 13.(对 ) 14.(错 ) 15.(对 ) 16.(错 ) 17.(对 ) 18.(错 ) 19.(错 ) 20.(对 ) 21.(错 ) 22.(错 ) 23.(对 ) 24.(对 ) 25.(错 ) 26.(错 ) 27.(对 ) 28.(错 ) 29.(对 ) 30.(对 ) 四、 1计算机系统结构是指多级层次结构中传统机器级的结构，它是软件和硬件 /固件的主要交界面，是让编制的机器语言程序、汇编语言源程序及高级语言源程序编译生成的机器语言目标程序能在机器上正确运行所看到的计算机属性。 S1 S2 S3 S4 S5 9 计算机组成，主要指的是机器级内部数据流和控制流的组成及逻辑设计。它主要与计算机操作的并行度、重叠度及部件的共享度等有关，直接影响系统的速度与价格。计算机实现是计算机组成的武力实现。它着眼于用什么样的器件技术和微组装技术。它也直接影响系统的速度和价格。 2模拟和仿真能在结构不同的机器之间实现机器语言程序的移植。模拟是用机器语言程序解释另一机器的机器指令实现软件移植的方法。模拟方法在机器指令系统差异比较大时，会使程序运行速度严重下降。仿真是用微程序直接解释另一机器的机器指令实现软件移植的方法。仿真可以提高被移植软件运行速度，但及其结构差异较大时，很难实现。区别是模拟用机器语言解释，其解释程序在主存中；仿真用微程序解释，其解释程序在控制存储器中。 3 峰值性能是指在理想的状况下计算机系统可获得的最高理论性能值，它不能真实反映系统的实际性能。持续性能又称实际性能，使计算机系统可获得的平均理论性能值，通常用算术平均、几何平均、和调和平均三种方法表示 4 CISC 设计风格的主要特点是： (1)指令系统复杂； (2)绝大多数指令需要多个机器周期方可执行完毕； (3)各种指令都可访问存储器； (4)采用微程序控制； (5)有专用寄存器； (6)难以用优化编译器生成高效的目标代码程序。 RISC 机的特点： (1)简化指令系统； (2)除了 LOAD/STORE 指令外，所有指令都在一个时钟周期内执行完毕； (3)除了 LOAD/STORE 指令外，其余指令只与寄存器打交道； (4)绝大部分采用硬联线控制，不用或少用微程序实现； (5)使用较多的通用寄存器，一般至少有 32 个，绝没有专用寄存器； (6)采用优化编译技术，生成高效的目标代码程序。 5 计算机访存有两种局部性规律：（ 1）时间局部性：如果一个存储项被访问，则可能很快会再次被访问。（ 2）空间局部性：如果一个存储项被访问，则其领近的项也可能很快被访问。存储器的层次结构是指：构成存储系统有 n 种不同的存储器（ M1 M2）之间，增加辅助的软件或硬件，使之从应用程序员角度上看，他们在逻辑上是一个整体。使得存储层次的等效访问速度接近于最高层 M1 ，容量接近于最底层 Mn ，每位价格也接近于 Mn ，典型的层次存储结构如： Cache 存储器主存虚拟存储器。 6实现软件移植的主要途径有：统一高级语言、采用系列机、模拟和仿真等。统一高级语言：只能实现高级语言软件的移植，目前高级语言种类繁多，无法完全统一成一种。系列机：由于系列内各档机器的结构变化不能太大，到一定时候会阻碍系列发展。只能实现在结构相同或相近的机器间的汇编语言应用软件的移植。模拟：用宿主机的机器指令解释，机器语言差别大时，速度慢。仿真：用宿主机的微程序解释，机器差别大时，仿真难、仿真效率和灵活性差。 7一个由若干段组成的流水线，在达到稳定状态后所获得的吞吐率与其中延迟最大的那一 10 段长度有关，这一段就成为影响流水线速度的瓶颈。消除流水线速度瓶颈的方法主要有两种：（ 1）尽量采取将瓶颈子过程再细分，使之接近于流水线其他段的工作速度。（ 2）将多个瓶颈子过程并联。 8全局性相关是指转移指令与其后续指令之间的相关。处理方法有：（ 1）猜测法：猜中其中一条分支，预取指令。待条件码形成后决定是否继续执行。（ 2）提前形成转移所需条件。（ 3）加快短循环程序处理。 9多处理机操作系统有主从型、独立监控型和浮动监控型 3 类。主从型适合于工作负荷固定，逐级功能较强、从及功能较弱的异构型多处理机系统。独立监控型适合于松耦合的多处理机系统。浮动监控型适合于紧耦合的多处理机系统。 10计算机系统的 3T 性能目标是： 1 TFLOPS 的计算能力， 1 TByte 的主存容量， 1 特 TByte/s 的 I/O 系统带宽。 11“ 阿姆达尔定律 ”是指：系统中对某一部件采用某种更快执行方式所能获得的系统性能改进程度，取决于这种执行方式被使用的频率，或所占总执行时间的比例。实际上定义了采取增强某部分功能处理后可获得的性能改进或执行时间的加速比。即 12 RISC 机在 CPU 内部设置大量寄存器和采用寄存器窗口重叠技术可以缩短 CALL 和 RETURN 语句的操作时间。采用寄存器窗口重叠技术，可在发生过程调用或返回时，过程参数能自动传送而不需要再用额外的传送时间，所以使处理器与存储器之间的代码传送量大大减少。 13资源相关是指，当有多条指令进入流水线后在同一机器周期内争用同一功能部件所发生的冲突。解决方法是：（ 1）后条指令停顿一派流水线；（ 2）重复设置发生冲突的功能部件。 14有时间重叠、资源重复、资源共享等三个途径。时间重叠是让多个处理过程在实践上相互错开，轮流使用统一硬件设备的各个处理部分，以加快执行速度的方法。如流水线处理机 CRAY-1。资源重复是通过重复设置硬件资源来提高性能。如阵列处理机 ILLIAC- 。资源共享是利用软件方法让多个用户共享同一套资源，来提高资源利用率和系统性能的。如多道程序分时系统、多处理机、分布处理系统、计算机网等。 15写回法： CPU 只写入 Cache，不写入主存，仅当 Cache 块替换时，才先写回主存后再替换。要求对每个 Cache 块增加一个修改位的资源开销。全写法（写直达法）： CPU 每次写 Cache 的同时，也直接写入主存。要增加写主存的时间开销。五、 1 57.2 28.0 1 5 9.09.01 1)1( 1 e eep rff s 11 2（ 1）禁止表 F=2,4,6，冲突向量 C=101010 最佳调度方案 =（ 1， 7）或（ 3， 5），最小平均延迟 = 4，最大吞吐率 =1/4 （ 3）（ 1） SIMD 系统：乘法运算时间： 4 个 PE 并行执行：时间 = 4 （ PE1=A1B1, PE2=A2B2, PE3=A3B3, PE4=A4B4）加法时间：传送时间：（ PE2 PE1 ， PE3 PE4 ，并行） = 1 加法时间：（ PE1=PE2+PE1 ， PE4=PE3+PE4 ，并行） =2 加法时间：传送时间：（ PE1 PE4 ） =1 加法时间：（ PE1=PE4+PE1） =2 最短执行时间 =4+1+2+1+2=10（个时间单位），结果在 PE1 处理单元中）（ 2） MIMD 系统：执行时间 =10 个时间单位。 3单独流水： V3存储器： 1（启动访存） +6（访存） +1（打入 V3） + N-1 = 7+N V4V0+V1： 1（启动加） +6（加） +1（打入 V4） + N-1 = 7+N V2V4*V3： 1（启动乘） +7（乘） +1（打入 V2） + N-1 = 8+N （ 1）（ 7+N） +(7+N)+(8+N)=22+3N（拍）（ 2） (7+N)+(8+N)=15+2N（拍）（ 3） (7+1)+(8+N)=16+N（拍） 4禁止表 F=1,3,4,8 冲突向量 C=(10001101) 状态转换图：见图 2-5-2 调度方案：调度方案平均延迟（拍）（ 2， 5）（ 2， 7）（ 5）（ 6， 5）（ 6）（ 6， 7）（ 7）（ 5， 2） 3.5 4.5 5 5.5 6 6.5 7 3.5 最小平均等待时间 =3.5 拍，最大吞吐率为 Tp max=1/3.5（任武 /拍）最佳调度方案：（ 2， 5）、（ 5， 2） 5配对关系：（ 0、 2）是（ 000， 010） 12 （ 1、 3）是（ 001， 011）（ 4、 6）是（ 100， 110）（ 5、 7）是（ 101， 111）规律是二进制编号为 P2 P1 P0 的处理器与二进制编号为 P2 P1 P0 的处理器配对交换数据。所以采用级控制多级立方体互连网络。因为 N=8，由 n=log28=3 级组成，每级二功能交换单元个数 2N/2=4 ，互连函数为 Cube(P2 P1 P0)= P2 P1 P0 ，第 0、 2 级直通，第 1 级交换。即级控信号为 P2 P1 P0=010 互连网络拓扑结构为：见教材图 9.20 6 Huffman 树图略。等长操作码平均码长为 log214=4 位； Huffman 编码平均码长为 14 1 38.3i ii lp 位采用两种码长的扩展操作码编码为： 000101 对应频度为 0.15、 0.15、 0.14、 0.13、 0.12、 0.11 的指令操作码， 110、 111 作为扩展码，在扩展出两位码： 11000、 11001、 11010、 11011； 11100、 11101、 11110、 11111 分别对应频度较低的 8 条指令。平均码长为 14 1 4.32.0580.03i ii lp 位

展开阅读全文