计算机组成原理重点总结(详版).doc

资源描述

计算机组成原理【考查目标】1. 理解单处理器计算机系统中各部件的内部工作原理、组成结构以及相互连接方式，具有完整的计算机系统的整机概念。2. 理解计算机系统层次化结构概念，熟悉硬件与软件之间的界面，掌握指令集体系结构的基本知识和基本实现方法。3. 能够运用计算机组成的基本原理和基本方法，对有关计算机硬件系统中的理论和实际问题进行计算、分析，并能对一些基本部件进行简单设计。一、计算机系统概述（一）计算机发展历程第一台电子计算机ENIAC（Electronic Numerical Integrator And Computer）诞生于1946年的美国宾夕法尼亚大学。ENIAC用了18000电子管、1500继电器、重30吨、占地170m3、耗电140kw、每秒计算5000次加法。冯诺依曼（VanNeumann）首次提出存储程序的概念，将数据和程序一起放在存储器中，使得编程更加方便。50多年来，虽然对冯诺依曼机进行了很多改革，但结构变化不大，仍然称为冯诺依曼机。一般把计算机的发展分为四个阶段：第一代（1946-50s后期）：电子管计算机时代；第二代（50s中期-60s后期）：晶体管计算机时代；第三代（60s中期-70s前期）：集成电路计算机时代；第四代（70s初-）：大规模集成电路计算机时代。（二）计算机系统层次结构1. 计算机硬件的基本组成计算机硬件主要指计算机的实体部分，通常有运算器、控制器、存储器、输入和输出五部分。CPU是指将运算器和控制器集成到一个电路芯片中。2. 计算机软件的分类计算机软件按照面向对象的不同可分两类：系统软件：用于管理整个计算机系统，合理分配系统资源，确保计算机正常高效地运行，这类软件面向系统。应用软件：是面向用户根据用户的特殊要求编制的应用程序，这类软件通常实现用户的某类要求。3. 计算机的工作过程（1）计算机的工作过程就是执行指令的过程指令由操作码和操作数组成：操作码地址码操作码指明本指令完成的操作地址码指明本指令的操作对象（2）指令的存储指令按照存储器的地址顺序连续的存放在存储器中。（3）指令的读取为了纪录程序的执行过程，需要一个记录读取指令地址的寄存器，称为指令地址寄存器，或者程序计数器。指令的读取就可以根据程序计数器所指出的指令地址来决定读取的指令，由于指令通常按照地址增加的顺序存放，故此，每次读取一条指令之后，程序计数器加一就为读取下一条指令做好准备。（4）执行指令的过程在控制器的控制下，完成以下三个阶段任务:1）取指令阶段按照程序计数器取出指令，程序计数器加一2）指令译码阶段分析操作码，决定操作内容，并准备操作数3）指令执行阶段执行操作码所指定内容（三）计算机性能指标1. 吞吐量、响应时间（1) 吞吐量：单位时间内的数据输出数量。（2) 响应时间：从事件开始到事件结束的时间，也称执行时间。2. CPU时钟周期、主频、CPI、CPU执行时间（1） CPU时钟周期：机器主频的倒数，Tc（2）主频：CPU工作主时钟的频率，机器主频Rc（3）CPI：执行一条指令所需要的平均时钟周期（4）CPU执行时间：TCPU=InCPITC In执行程序中指令的总数 CPI执行每条指令所需的平均时钟周期数 TC时钟周期时间的长度3. MIPS、MFLOPS（1）MIPS：MIPS(Million Instructions Per Second) MIPS = In/(Te106) = In/(InCPITc106) = Rc/(CPI106)Te：执行该程序的总时间In：执行该程序的总指令数Rc：时钟周期Tc的到数 MIPS只适合评价标量机，不适合评价向量机。标量机执行一条指令，得到一个运行结果。而向量机执行一条指令，可以得到多个运算结果。（2） MFLOPS： MFLOPS(Million Floating Point Operations Per Second) MFLOPS=Ifn/(Te106)Ifn：程序中浮点数的运算次数 MFLOPS测量单位比较适合于衡量向量机的性能。一般而言，同一程序运行在不同的计算机上时往往会执行不同数量的指令数，但所执行的浮点数个数常常是相同的。二、数据的表示和运算（一）数制与编码1. 进位计数制及其相互转换1）进位计数制进位计数制是指按照进位制的方法表示数，不同的数制均涉及两个基本概念：基数和权。基数：进位计数制中所拥有数字的个数。权：每位数字的值等于数字乘以所在位数的相关常数，这个常数就是权。任意一个R进制数X，设整数部分为n位，小数部分为m位，则X可表示为：Xan-1rn-1 + an-2rn-2 + + a0r0 + a-1r-1 + a-2r-2 + + a-mr-m(X)r = 2）不同数制间的数据转换（1）二、八、十六进制数转换成十进制数利用上面讲到的公式： (N)2=Di2i 、(N)8=Di8i、 (N)16=Di16i、进行计算。（2）十进制数转换成二进制数通常要对一个数的整数部分和小数部分分别进行处理，各自得出结果后再合并。u对整数部分，一般采用除2取余数法，其规则如下：将十进制数除以2，所得余数（0或1）即为对应二进制数最低位的值。然后对上次所得商除以2，所得余数即为二进制数次低位的值，如此进行下去，直到商等于0为止，最后得的余数是所求二进制数最高位的值。u对小数部分，一般用乘2取整数法，其规则如下：将十进制数乘以2，所得乘积的整数部分即为对应二进制小数最高位的值，然后对所余数的小数部分部分乘以2，所得乘积的整数部分为次高位的值，如此进行下去，直到乘积的小数部分为0，或结果已满足所需精度要求为止。（3）二进制数、八进制数和十六进制数之间的转换八进制数和十六进制数是从二进制数演变而来的：由3位二进制数组成1位八进制数；由4位二进制数组成1位十六进制数。对于一个兼有整数和小数部分的数以小数点为界，小数点前后的数分别分组进行处理，不足的位数用0补足。对整数部分将0补在数的左侧，对小数部分将0补在数的右侧。这样数值不会发生差错。2. 真值和机器数真值：数据的数值通常以正(+)负(-)号后跟绝对值来表示，称之为真值。机器数：在计算机中正负号也需要数字化，一般用0表示正号，1表示负号。把符号数字化的数成为机器数。3. BCD码在计算机中采用4位二进制码对每个十进制数位进行编码。4位二进制码有16种不同的组合，从中选出10种来表示十进制数位的09，用0000，0001，1001分别表示0，1，9，每个数位内部满足二进制规则，而数位之间满足十进制规则，故称这种编码为以二进制编码的十进制（binary coded decima1，简称BCD）码。在计算机内部实现BCD码算术运算，要对运算结果进行修正，对加法运算的修正规则是：如果两个一位BCD码相加之和小于或等于(1001)2，即(9)10，不需要修正；如相加之和大于或等于(1010)2，或者产生进位，要进行加6修正，如果有进位，要向高位进位。4. 字符与字符串在计算机中要对字符进行识别和处理，必须通过编码的方法，按照一定的规则将字符用一组二进制数编码表示。字符的编码方式有多种，常见的编码有ASCII码、EBCDIC码等。1）ASCII码ASCII码用7位二进制表示一个字符，总共128个字符元素，包括10个十进制数字（0-9）、52个英文字母（A-Z和a-z）、34专用符号和32控制符号。2）EBCDIC码为Extended Binary Coded Decimal Interchange Code的简称，它采用8位来表示一个字符。3）字符串的存放向量存储法：字符串存储时，字符串中的所有元素在物理上是邻接的。串表存储法：字符串的每个字符代码后面设置一个链接字，用于指出下一个字符的存储单元的地址。5. 校验码数据校验码是一种常用的带有发现某些错误或自动改错能力的数据编码方法。其实现原理，是加进一些冗余码，使合法数据编码出现某些错误时，就成为非法编码。这样，可以通过检测编码的合法性来达到发现错误的目的。合理地安排非法编码数量和编码规则，可以提高发现错误的能力，或达到自动改正错误的目的。码距：码距根据任意两个合法码之间至少有几个二进制位不相同而确定的，仅有一位不同，称其码距为1。1）奇偶校验码它的实现原理，是使码距由1增加到2。若编码中有1位二进制数出错了，即由1变成0，或者由0变成1。这样出错的编码就成为非法编码，就可以知道出现了错误。在原有的编码之上再增加一位校验位，原编码n位，形成新的编码为n+1 位。增加的方法有2种：奇校验：增加位的0或1要保证整个编码中1的个数为奇数个。偶校验：增加位的0或1要保证整个编码中1的个数为偶数个。 2）海明校验码它的实现原理，是在数据中加入几个校验位，并把数据的每一个二进制位分配在几个奇偶校验组中。当某一位出错就会引起有关的几个校验组的值发生变化，这不但可以发现出错，还能指出是哪一位出错，为自动纠错提供了依据。假设校验位的个数为r，则它能表示2r个信息，用其中的一个信息指出没有错误，其余2r-1个信息指出错误发生在哪一位。然而错误也可能发生在校验位，因此只有k=2r-1-r个信息能用于纠正被传送数据的位数，也就是说要满足关系：2r=k+r+1 3）CRC校验码CRC校验码一般是指k位信息之后拼接r位校验码。关键问题是如何从k位信息方便地得到r位校验码，以如何从位k+r信息码判断是否出错。将带编码的k位有效信息位组表达为多项式： M(x)=Ck-1xk-1+ Ck-2xk-2 + + Cixi + C1x + C0式Ci中为0或1.若将信息位左移r位，则可表示为多项式M(x).xr。这样就可以空出r位，以便拼接r位校验位。 CRC码是用多项式M(x).xr除以生成多项式G(x)所得的余数作为校验码的。为了得到r位余数，G(x)必须是r+1位。设所得的余数表达式为R(x)，商为Q(x)。将余数拼接在信息位组左移r位空出的r位上，就构成了CRC码，这个码的可用多项式表达为：M(x)xr+R(x)=Q(x)G(x)+R(x)+R(x) =Q(x)G(x)+R(x)+R(x) =Q(x)G(x)因此，所得CRC码可被G(x)表示的数码除尽。将收到的CRC码用约定的生成多项式G(x)去除，如果无错，余数应为0，有某一位出错，余数不为0. （二）定点数的表示和运算1. 定点数的表示1）无符号数的表示无符号数就是指正整数，机器字长的全部位数均用来表示数值的大小，相当于数的绝对值。对于字长为n+1位的无符号数的表示范围为： 0-2n+1-12）带符号数的表示带符号数是指在计算机中将数的符号数码化。在计算机中，一般规定二进制的最高位为符号位，最高位为表示该数为正，为表示该数为负。这种在机器中使用符号位也被数码化的数称为机器数。根据符号位和数值位的编码方法不同，机器数分为原码、补码和反码。（1）原码表示法机器数的最高位为符号位，0表示正数，1表示负数，数值跟随其后，并以绝对值形式给出。这是与真值最接近的一种表示形式。原码的定义：（2）补码表示法机器数的最高位为符号位，0表示正数，1表示负数，其定义如下：（3）反码表示法机器数的最高位为符号，0表示正数，1表示负数。反码的定义： 2. 定点数的运算1）定点数的位移运算左移，绝对值扩大；右移，绝对值缩小。算术移位规则符号位不变码制添补代码正数0负数原0补右移添0左移添1反1算术移位和逻辑移位的区别：算术移位：带符号数移位；逻辑移位：无符号数移位；2）原码定点数的加/减运算；对原码表示的两个操作数进行加减运算时，计算机的实际操作是加还是减，不仅取决指令中的操作码，还取决于两个操作数的符号。而且运算结果的符号判断也较复杂。例如，加法指令指示做（A）（B）由于一操作数为负，实际操作是做减法（A）-（+B），结果符号与绝对值大的符号相同。同理，在减法指令中指示做（A）（B）实际操作做加法（A）（B），结果与被减数符号相同。由于原码加减法比较繁琐，相应地需要由复杂的硬件逻辑才能实现，因此在计算机中很少被采用。3）补码定点数的加/减运算；(1) 加法整数 A补 + B补= A+B补（mod 2n+1）小数 A补 + B补= A+B补（mod 2）(2) 减法整数 A补 - B补= A+(-B)补=A补 + -B补（mod 2n+1）小数 A补 - B补= A+(-B)补=A补 + -B补（mod 2）无需符号判定，连同符号位一起相加，符号位产生的进位自然丢掉4）定点数的乘/除运算（1）一位乘法原码定点一位乘法两个原码数相乘，其乘积的符号为相乘两数的异或值，数值两数绝对值之积。设 X原=X0 X1 X2 Xn Y原=Y0 Y1 Y2 Yn XY原=X原Y原 = (X0Y0)(X1 X2 Xn)(Y1 Y2 Yn)符号表示把符号位和数值邻接起来。定点补码一位乘法有的机器为方便加减法运算，数据以补码形式存放。乘法直接用补码进行，以减少转换次数。具体规则如下： XY补=X补（Y0 + 0. Y1 Y2 Yn ）布斯法“布斯公式”：在乘数Yn后添加Yn+1=0。按照Yn+1 ，Yn相邻两位的三种情况，其运算规则如下：（1） Yn+1 ，Yn =0（ Yn+1 Yn =00或11），部分积加0，右移1位;（2） Yn+1 ，Yn =1（ Yn+1 Yn =10），部分积加X补，右移1位；（3） Yn+1 ，Yn =-1（ Yn+1 Yn =01），部分积加X补，右移1位最后一步不移位。（2）两位乘法原码两位乘法，因此实际操作用Yi-1、Yi、C三位来控制，运算规则如下Yi-1 Yi C操作 0 0 0 0 0 1 0 1 0 0 1 1 1 0 0 1 0 1 1 1 0 1 1 1 +0，右移2位 0C +X，右移2位 0C +X，右移2位 0C +2X，右移2位 0C +2X，右移2位 0C -X，右移2位 1C -X，右移2位 1C +0，右移2位 1C 补码两位乘法根据前述的布斯算法，将两步合并成一步，即可推导出补码两位乘的公式。Yn-i-1 Yn-i Yn-i+1Pi+2补 0 0 0 0 0 1 0 1 0 0 1 1 1 0 0 1 0 1 1 1 0 1 1 1 +0，右移2位 +X补，右移2位 +X补，右移2位 +2X补，右移2位 -2X补，右移2位 -X补，右移2位 -X补，右移2位 +0，右移2位求部分积的次数和右移操作的控制问题。当乘数由1位符号位和以n（奇数）位数据位组成时，求部分积的次数为（1n）2，而且最后一次的右移操作只右移一位。若数值位本身为偶数n，可采用下述两种方法之一：可在乘数的最后一位补一个0，乘数的数据位就成为奇数，而且其值不变，求部分积的次数为1+(n+l)/2，即n/21，最后一次右移操作也只右移一位。乘数增加一位符号位，使总位数仍为偶数，此时求部分积的次数为n/2+1，而且最后一次不再执行右移操作。（3）补码除法定点原码一位除法1恢复余数法被除数（余数）减去除数，如果为0或者为正值时，上商为1，不恢复余数；如果结果为负，上商为0，再将除数加到余数中，恢复余数。余数左移1位。2加减交替法当余数为正时，商上1，求下一位商的办法，余数左移一位，再减去除数；当余数为负时，商上0，求下一位商的办法，余数左移一位，再加上除数。定点补码一位除法（加减交替法）1如果被除数与除数同号，用被除数减去除数；若两数异号，被除数加上除数。如果所得余数与除数同号商上1，否则，商上0，该商为结果的符号位。2求商的数值部分。如果上次商上1，将除数左移一位后减去除数；如果上次商上0，将余数左移一位后加除数。然后判断本次操作后的余数，如果余数与除数同号商上1，如果余数与除数异号商上0。如此重复执行n-1次（设数值部分n位）。3商的最后一位一般采用恒置1的办法，并省略了最低+1的操作。此时最大的误差为2-n。5）溢出概念和判别方法当运算结果超出机器数所能表示的范围时，称为溢出。显然，两个异号数相加或两个同号数相减，其结果是不会溢出的。仅当两个同号数相加或者两个异号数相减时，才有可能发溢出的情况，一旦溢出，运算结果就不正确了，因此必须将溢出的情况检查出来。判别方法有三种：1当符号相同的两数相加时，如果结果的符号与加数（或被加数）不相同，则为溢出。2当任意符号两数相加时，如果C=Cf，运算结果正确，其中C为数值最高位的进位，Cf为符号位的进位。如果CCf ，则为溢出，所以溢出条件=CCf 。3采用双符号fs2fs1。正数的双符号位为00，负数的双符号位为11。符号位参与运算，当结果的两个符号位甲和乙不相同时，为溢出。所以溢出条件= fs2fs1 ，或者溢出条件= fs2fs1 + fs2fs1（三）浮点数的表示和运算1. 浮点数的表示1）浮点数的表示范围；浮点数是指小数点位置可浮动的数据，通常以下式表示： N=MRE其中，N为浮点数，M为尾数，E为阶码，R称为“阶的基数（底）”，而且R为一常数，一般为2、8或16。在一台计算机中，所有数据的R都是相同的，于是不需要在每个数据中表示出来。因此，浮点数的机内表示一般采用以下形式：浮点数的机内表示一般采用以下形式：MsEM 1位 n+1位 m位Ms是尾数的符号位，设置在最高位上。E为阶码，有n+1位，一般为整数，其中有一位符号位，设置在E的最高位上，用来表正阶或负阶。M为尾数，有m位，由Ms和M组成一个定点小数。Ms=0，表示正号，Ms=1，表示负。为了保证数据精度属数通常用规格化形式表示：当R2，且尾数值不为0时，其绝对值大于或等于(0.5)10。对非规格化浮点数，通过将尾数左移或右移，并修改阶码值使之满足规格化要求。2）IEEE754标准根据IEEE 754国际标准，常用的浮点数有两种格式：（1）单精度浮点数（32位），阶码8位，尾数24位（内含：位符号位）。（2）双精度浮点数（64位），阶码11位，尾数53位（内含：位符号位）。单精度格式32位，阶码为8位，尾数为23位。另有一位符号位S，处在最高位。由于IEEE754标准约定在小数点左部有一位隐含位，从而实际有效位数为24位。这样使得尾数的有效值变为1.M 。例如，最小为x1.00,，最大为x1.11。规格化表示。故小数点左边的位横为1，可省去。阶码部分采用移码表示，移码值127，1到254经移码为-126到+127。S(1位) E(8位) M(23位) N(共32位) 符号位 0 0 0 符号位 0 不等于0 (-1)S2-126(0.M) 为非规格化数符号位 1到254之间 - (-1)S2E-127(1.M) 为规格化数符号位 255不等于0 NaN(非数值) 符号位 2550 无穷大 0 有了精确的表示，无穷大也明确表示。对于绝对值较小的数，可以采用非规格化数表示，减少下溢精度损失。非规格化数的隐含位是0，不是1。2. 浮点数的加/减运算加减法执行下述五步完成运算：1）“对阶”操作比较两浮点数阶码的大小，求出其差E，保留其大值E，E=max(Ex, Ey)。当E0时，将阶码小的尾数右移E位，并将其阶码加上E，使两数的阶码值相等。2）尾数加减运算执行对阶之后，两尾数进行加减操作。3）规格化操作规格化的目的是使得尾数部分的绝对值尽可能以最大值的形式出现。4）舍入在执行右规或者对阶时，尾数的低位会被移掉，使数值的精度受到影响，常用“0”舍“1”入法。当移掉的部分最高位为1时，在尾数的末尾加1，如果加1后又使得尾数溢出，则要再进行一次右规。5）检查阶码是否溢出阶码溢出表示浮点数溢出。在规格化和舍入时都可能发生溢出，若阶码正常，加/减运算正常结束。若阶码下溢，则设置机器运算结果为机器零，若上溢，则设置溢出标志。（四）算术逻辑单元ALU1. 串行加法器和并行加法器1）串行进位加法器并行加法器可以同时对数据的各位进行相加，一般用n个全加器来实现2个操作数的各位同时向加。其操作数的各位是同时提供的，由于进位是逐位形成，低位运算所产生的进位会影响高位的运算结果。串行进位（也称波形进位）加法器，逻辑电路比较简单，但是最高位的加法运算，一定要等到所有低位的加法完成之后才能进行，低位的进位要逐步的传递到高位，逐级产生进位，因此运算速度比较慢。串行进位加法器2）并行进位加法器为了提高运算速度，减少延迟时间，可以采用并行进位法，也叫提前进位或先行进位。全加器中，输入Ai 、Bi、Ci-1，输出：Si = Ai Bi Ci-1+Ai Bi Ci-1+Ai Bi Ci-1+Ai Bi Ci-1Ci = Ai Bi Ci-1+Ai Bi Ci-1+Ai Bi Ci-1+Ai Bi Ci-1 = Ai Bi + (Ai+Bi)Ci-1进位产生函数：Gi = Ai Bi进位传递函数：Pi = Ai+BiCi = Gi + Pi Ci-1C4 = G4 + P4G3 + P4P3G2 + P4P3P2G1 + P4P3P2P1C0并行进位加法器的运算速度很快，形成最高进位输出的延迟时间很短，但是以增加硬件逻辑线路为代价。对于长字长的加法器，往往将加法器分成若干组，在组内采用并行进位，组间则采用串行进位或并行进位，由此形成多种进位结构。（1）单级先行进位单级先行进位方式将n位字长分为若干组，每组内采用并行进位方式，组与组之间册采用串行进位方式。（2）多级先行进位多级先行进位在组内和组间都采用先行进位方式。16位单级先行进位加法器2. 算术逻辑单元ALU的功能和机构ALU部件是运算器中的主要组成部分，又称为多功能函数发生器，主要用于完成各种算术运算和逻辑运算。ALU的算术运算部件包含加法器、减法器、乘法器、除法器、增量器（+1）、减量器（-1）、BCD码运算器等组件。ALU的主要工作是根据CPU的指令要求执行各种指定的运算，如加法、减法、乘法、除法、比较、逻辑移位等操作。通用寄存器组是一组存取速度最快的存储器，用于保存参加运算的操作数和中间结果。访问寄存器无需高速缓存，也不需要运行总线周期，因此指令的执行速度很快。几乎所有的指令都要将寄存器指定为一个操作数，有些指令还要求将操作数存放在专用的寄存器中。专用寄存器通常用于表示CPU所处于某种系统状态，ALU中有两个重要的状态寄存器：指令指针寄存器IP（即程序计数器PC）和标志寄存器FLAGS。三、存储器层次机构（一）存储器的分类1. 按存储介质分类 1）半导体存储器 2）磁表面存储器 3）磁芯存储器 4）光盘存储器2. 按存取方式分类 1）随机存储器 2）只读存储器 3）串行访问存储器3. 按在计算机中的作用分类（二）存储器的层次化结构存储器有3个重要的指标：速度、容量和每位价格，一般来说，速度越快，位价越高；容量越大，位价越低，容量大，速度就越低。上述三者的关系用下图表示：存储系统层次结构主要体现在缓存-主存-辅存这两个存储层次上，如下图所示：（三）半导体随机存取存储器1. SRAM存储器的工作原理1）静态存储单元SRAM静态存储单元的每个存储位需要四到六个晶体管组成。比较典型的是六管存储单元，即一个存储单元存储一位信息“0”或“1”。静态存储单元保存的信息比较稳定，信息为非破坏性读出，故不需要重写或者刷新操作；另一方面，其结构简单、可靠性高、速度较快，但其占用元件较多，占硅片面积大，且功耗大，所以集成度不高。静态随机存储单元2. DRAM存储器的工作原理1）动态存储单元常见的动态RAM存储单元有三管式和单管式两种，它们的共特点是靠电容存储电荷的原理来寄存信息。若电容上存有足够的电荷表示“”，电容上无电荷表示“0”。电容上的电荷一般只能维持1-2ms，因此即使电源不掉电，电容上的电荷会自动消失。因此，为保证信息的不丢失，必须在2ms之内就要对存储单元进行一次恢复操作，这个过程称为再生或者刷新。与静态RAM相比，动态RAM具有集成度更高、功耗更低等特点，目前被各类计算机广泛使用。三管动态RAM基本单元单管动态RAM基本单元（四）只读存储器前面介绍的DRAM和SRAM均为可任意读写的随机存储器，当掉电时，所存储的内容消失，所以是易失性存储器。只读存储器，即使停电，所存储的内容也不丢失。根据半导体制造工艺的不同，可分为ROM，PROM，EPROM，E2ROM和Flash Memory1. 只读存储器（ROM）掩模式ROM由芯片制造商在制造时写入内容，以后只能读而不能再写入。其基本存储原理是以元件的“有无”来表示该存储单元的信息（“1”或“0”），可以用二极管或晶体管作为元件，显而易见，其存储内容是不会改变的。2. 可编程序的只读存储器（PROM） PROM可由用户根据自己的需要来确定ROM中的内容，常见的熔丝式PROM是以熔丝的通和断开来表示所存的信息为“1”或“0”。刚出厂的产品，其熔丝是全部接通的。根据需要断开某些单元的熔丝（写入）。显而易见，断开后的熔丝是不能再接通了，因而一次性写入的存储器。掉电后不会影响其所存储的内容。3. 可擦可编程序的只读存储器（EPROM）为了能修改ROM中的内容，出现了EPROM。利用浮动栅MOS电路保存信息，信息的改写用紫外线照射即可擦除。4. 可电擦可编程序只读存储器（E2PROM） E2PROM的编程序原理与EPROM相同，但擦除原理完全不同，重复改写的次数有限制（因氧化层被磨损），一般为10万次。其读写操作可按每个位或每个字节进行，类似SRAM，但每字节的写入周期要几毫秒，比SRAM长得多。E2PROM每个存储单元采则2个晶体管。其栅极氧化层比EPROM薄，因此具有电擦除功能。 5. 快除读写存储器（Flash Memory） F1ash Memory是在EPROM与E2PROM基础上发展起来的，其读写过程和E2PROM不同，F1ash Memory的读写操作一般是以块为单位。（五）主存储器与CPU的连接1个存储器的芯片的容量是有限的，它在字数或字长方面与实际存储器的要求都有很大差距，所以需要在字向和位向进行扩充才能满足需要。根据存储器所需的存储容量和所提供的芯片的实际容量，可以计算出总的芯片数。一个存储器的容量为MN位，若使用LK位存储器芯片，那么，这个存储器共需要M/LN/K存储器芯片。1位扩展位扩展指的是用多个存储器器件对字长进行扩充。位扩展的连接方式是将多片存储器的地址、片选己、读写控制端R/W可相应并联，数据端分别引出。2）字扩展字扩展指的是增加存储器中字的数量。静态存储器进行字扩展时，将各芯片的地址线、数据线、读写控制线相应并联，而由片选信号来区分各芯片的地址范围。 3）字位扩展实际存储器往往需要字向和位向同时扩充。（六）双口RAM和多模块存储器1.双端口存储器双端口存储器是一种具有两个单独的读/写端口及控制电路的存储器，通过增加一个读/写端口，双端口存储器扩展了存储器的的信息交换能力。2.多模块存储器为了解决CPU与主存储器之间的速度匹配问题，在高速存储器中，普遍采用并行主存系统。即利用类似存储器扩展（位扩展、字扩展、字位扩展）的方法，将n个字长为W位的存储器并行连接，构建一个更大的存储器。并行主存有单体多字方式、多体并行方式和多体交叉方式。（七）高速缓冲存储器（Cache）1. 程序访问的局部性从大量的统计中得到的一个规律是，程序中对于存储空间90%的访问局限于存储空间的10%的区域中，而另外10%的访问则分布在存储空间的其余90%的区域中。这就是通常说的局部性原理。访存的局部性规律包括两个方面：时间局部性：如果一个存储项被访问，则可能该项会很快被再次访问。空间局部性：如果一个存储项被访问，则该项及其邻近的项也可能很快被访问。2. Cache的基本工作原理Cache通常由两部分组成，块表和快速存储器。其工作原理是：处理机按主存地址访问存储器，存储器地址的高段通过主存-Cache地址映象机构借助查表判定该地址的存储单元是否在Cache中，如果在，则Cache命中，按Cache地址访问Cache。否则，Cache不命中，则需要访问主存，并从主存中调入相应数据块到Cache中，若Cache中已写满，则要按某种算法将Cache中的某一块替换出去，并修改有关的地址映象关系。从这个工作原理我们可以看出，它已经涉及到了两个问题。首先是定位、然后是替换的问题。Cache的存在对程序员是透明的。其地址变换和数据块的替换算法均由硬件实现。通常Cache被集成到CPU内以提高访问速度。3. Cache和主存之间的映射方式因为处理机访问都是按主存地址访问的，而Cache的空间远小于主存，如何知道这一次的访问内容是不是在Cache中，在Cache中的哪一个位置呢? 这就需要地址映象，即把主存中的地址映射成Cache中的地址。让Cache中一个存储块(空间)与主存中若干块相对应，如此，访问一个主存地址时，就可以对应地知道在cache中哪一个地址了。地址映象的方法有三种：直接映象、全相联映象和组相联映象。直接映象就是将主存地址映象到Cache中的一个指定地址。任何时候，主存中存储单元的数据只能调入到Cache中的一个位置，这是固定的，若这个位置已有数据，则产生冲突，原来的块将无条件地被替换出去。直接映射全相联映象就是任何主存地址可映象到任何Cache地址的方式。在这种方式下，主存中存储单元的数据可调入到Cache中的任意位置。只有在Cache中的块全部装满后才会出现块冲突。全相连映射组相联映象指的是将存储空间的页面分成若干组，各组之间的直接映象，而组内各块之间则是全相联映象。组相联映射4. Cache中主存块的替换算法在直接映象方式下，不存在块替换的算法，因为每一块的位置映象是固定的，需要哪一块数据就可直接确定地将该块数据调入上层确定位置。而其他两种映象就存在替换策略的问题，就是要选择替换到哪一个Cache块。即替换算法。思想优点缺点随机算法RAND 用软的或硬的随机数产生器产生上层中要被替换的页号简单、易于实现没有利用上层存储器使用的历史信息，没有反映等程序局部性，命中率低。先进先出FIFO 选择最早装入上层的页作为被替换的页实现方便，利用了主存历史的信息不能正确反映程序局部性原理，命中率不高，可能出现一种异常现象。近期最少使用法LRU 选择近期最少访问的页作为被替换的页比较正确反映程序局部性，利用访存的历史信息，命中率较高实现较复杂优化替换算法OPT 将未来近期不用的页换出去命中率最高，可作为衡量其他替换算法的标准不现实，只是一种理想算法 5. Cache写策略对Cache的写操作，情况比读操作要复杂一些。由于写入Cache时，并没有写入主存，因此就出现Cache和主存数据不一致的情况。如何处理Cache和主存不一致的方法就称为更新策略。更新策略思想优点缺点写回法是指在CPU执行写操作时，信息只写入Cache中，仅当需要替换时，才将改写过的Cache块先送回主存(写回)，然后再调块（设置dirty位）有利于省去许多将中间结果写入主存的无谓开销。需设修改位增加Cache的复杂性全写法(写直达法) 在写操作时，将数据同时写入Cache和主存实现开销小、简单为了写中间结果浪费了不少时间另外，当写不命中时(也就是写Cache块时，这块早被人替换出去而在Cache中找不到时)是不是要把这块再取回Cache中，有两个解决方法：u不按写分配法，就是直接写到主存里，不再把该地址对应的块调回Cache中。u按写分配法，就是写到主存，而且把这一块从主存中调入到Cache。一般写回法用按写分配法，全写法则采用不按写分配。（八）虚拟存储器1. 虚拟存储器的基本概念虚拟存储器是主存的扩展，虚拟存储器的空间大小取决于计算机的访存能力而不是实际外存的大小，实际存储空间可以小于虚拟地址空间。从程序员的角度看，外存被看作逻辑存储空间，访问的地址是一个逻辑地址(虚地址)，虚拟存储器使存储系统既具有相当于外存的容量又有接近于主存的访问速度。虚拟存储器的访问也涉及到虚地址与实地址的映象、替换算法等，这与Cache中的类似，前面我们讲的地址映象以块为单位，而在虚拟存储器中，地址映象以页为单位。设计虚拟存储系统需考虑的指标是主存空间利用率和主存的命中率。虚拟存储器与Cache存储器的管理方法有许多相同之处，它们都需要地址映象表和地址变换机构。但是二者也是不同的。虚拟存储器的三种不同管理方式：按存储映象算法，分为段式、页式和段页式等，这些管理方式的基本原理是类似的。2. 页式虚拟存储器页式管理:是把虚拟存储空间和实际空间等分成固定大小的页，各虚拟页可装入主存中的不同实际页面位置。页式存储中，处理机逻辑地址由虚页号和页内地址两部分组成，实际地址也分为页号和页内地址两部分，由地址映象机构将虚页号转换成主存的实际页号。页式管理用一个页表，包括页号、每页在主存中起始位置、装入位等。页表是虚拟页号与物理页号的映射表。页式管理由操作系统进行，对应用程序员的透明的。3. 段式虚拟存储器段式管理: 把主存按段分配的存储管理方式。它是一种模块化的存储管理方式，每个用户程序模块可分到一个段，该程序模块只能访问分配给该模块的段所对应的主存空间。段长可以任意设定，并可放大和缩小。系统中通过一个段表指明各段在主存中的位置。段表中包括段名(段号)、段起点、装入位和段长等。段表本身也是一个段。段一般是按程序模块分的。4. 段页式虚拟存储器段页式管理:是上述两种方法的结合，它将存储空间按逻辑模块分成段，每段又分成若干个页，访存通过一个段表和若干个页表进行。段的长度必须是页长的整数倍，段的起点必须是某一页的起点。5. TLB（快表）在虚拟存储器中进行地址变换时，需要虚页号变换成主存中实页号的内部地址变换，这一般通过查内页表实现。当表中该页对应的装入位为真时，表示该页在主存中，可按主存地址问主存；如果装入位为假时，表示该页不在存储器中，就产生页失效中断，需从外存调入页。中断处理时先通过外部地址变换，一般通过查外页表，将虚地址变换为外存中的实际地址，到外存中去选页，然后通过I/0通道调入内存。当外存页面调入主存中时还存在一个页面替换略的问题。提高页表的访问速度是提高地址变换速度的关键。因为，每次访存都要读页表，如果页存放在主存中，就意味着访存时间至少是两次访问主存的时间，这样查表的代价大大。只有内部地址变换速度提高到使访问主存的速度接近于不采用虚拟存储器时的访主存速度时，虚拟存储器才能实用。根据访存的局部性，表内各项的使用的概率不是均匀分布的。在一段时间内，可能只用表中的很少几项，因此应重点提高使用概率高的这部分页表的访问速度，可用快速硬件构成全表小得多的部分表格，而将整个表格放在主存中，这就引出了快表和慢表的概念和技术。这样，虚地址到实地址的变换方法如后图所示。查表时，根据虚页表同时查找快表和慢表，当在快表中查到该虚页号时，就能很快找到对应的实页号，将其送入主存实地址寄存器，同时使慢表的查找作废，这时主存的访问速度没降低多少。如果在快表中查不到，则经过一个访主存的时间延迟后，将从慢表中查到的实页送入实地址寄存器，同时将此虚页号和对应的实页号送入快表，这里也涉及到用一个替换算法从快表中替换出一行。快表的存在对所有的程序员都是透明的。四、指令系统（一）指令格式1. 指令的基本格式计算机是通过执行指令来处理各种数据的。为了指出数据的来源、操作结果的去向及所执行的操作，一条指令必须包含下列信息：（1）操作码，具体说明了操作的性质及功能。（2）操作数的地址。（3）操作结果的存储地址。（4）下一条指令的地址。从上述分析可知，一条指令实际上包括两种信息即操作码和地址码。操作码（operation code）用来表示该指令所要完成的操作（如加、减、乘、除、数据传送等），其长度取决于指令系统中的指令条数。地址码用来描述该指令的操作对象，或者直接给出操作数或者指出操作数的存储器地址或寄存器地址（即寄存器名）。2. 定长操作码指令格式1）零地址指令OPCODE格式：OPCODE-操作码指令中只有操作码，而没有操作数或没有操作数地址。这种指令有两种可能：（1）无需任何操作数，如空操作指令，停机指令等。（2）所需的操作数是默认的。如堆栈结构计算机的运算指令，所需的操作数默认在堆栈中，由堆栈指针SP隐含指出，操作结果仍然放回堆栈中。又如Intel 8086的字符串处理指令，源、目的操作数分别默认在源变址寄存器SI和目的变址寄存器DI所指定的存储器单元中。2）一地址指令OPCODEA格式：OPCODE-操作码A-操作数的存储器地址或寄存器名指令中只给出一个地址，该地址既是操作数的地址，又是操作结果的存储地址。如加1，减1和移位等单操作数指令均采用这种格式，对这一地址所指定的操作数执行相应的操作后，产生的结果又存回该地址中。在某些字长较短的微型机中（如早期的Z80，Intel8080，MC6800等），大多数算术逻辑指令也采用这种格式，第一个源操作数由地址码A给出，第二个源操作数在一个默认的寄存器中，运算结果仍送回到这个寄存器中，替换了原寄存器内容，通常把这个寄存器称累加器。3）二地址指令OPCODEA1A2格式：OPCODE-操作码 A1-第一个源操作数的存储器地址或寄存器地址。 A2-第二个源操作数和存放操作结果的存储器地址或寄存器地址。这是最常见的指令格式，两个地址指出两个源操作数地址，其中一个还是存放结果的目的地址。对两个源操作数进行操作码所规定的操作后，将结果存入目的地址，在本例中即为A2指定的地址4）三地址指令OPCODEA1A2A3格式：OPCODE-操作码 A1-第一个源操作数的存储器地址或寄存器地址 A2-第二个源操作数的存储器地址或寄存器地址 A3-操作结果的存储器地址或寄存器地址其操作是对A1，A2指出的两个源操作数进行操作码（OPCODE）所指定的操作，结果存入A3中。5）多地址指令在某些性能较好的大、中型机甚至高档小型机中，往往设置一些功能很强的，用于处理成批数据的指令，如字符串处理指令，向量、矩阵运算指令等。为了描述一批数据，指令中需要多个地址来指出数据存放的首地址、长度和下标等信息3. 扩展操作码指令格式设某机器的指令长度为16位，包括4位基本操作码字段和三个4位地址字段，其格式下：OPCODE(4)A1(4)A2(4)A3(4)4位基本操作码有16个码点（即有16种组合），若全部用于表示三地址指令，则只有16条。但是，若三地址指令仅需15条，两地址指令需15条，一地址指令需15条，零地址指令需16条，共61条指令，应如何安排操作码？显然，只有4位基本操作码是不够的，必须将操作码的长度向地址码字段扩展才行。一种可供扩展的方法和步骤如下：（1）15条三地址指令的操作码由4位基本操作码从00001110给出，剩下一个码点1111用于把操作码扩展到A1，即4位扩展到8位；（2）15条二地址指令的操作码由8位操作码从1111000011111110给出，剩下一个码点11111111用于把操作码扩展到A2，即从8位扩展到12位；（3）15条一地址指令的操作码由12位操作码从111111110000111111111110给出，剩下的一个码点111111111111用于把操作码扩展到A3，即从12位扩展到16位；（4）16条零地址指令的操作码由16位操作码从11111111111100001111111111111111给出。（二）指令的寻址方式1. 有效地址的概念操作数的真实地址称为有效地址，记做EA，它是寻址方式和形式地址共同来决定的。2. 数据寻址和指令寻址寻址方式是指确定本条指令的数据地址以及下一条将要执行的指令的地址，与硬件结构密切相关，寻址方式分为指令寻址和数据寻址两大类指令寻址分为顺序寻址和跳跃寻址两种。顺序寻址可以通过程序计数器PC加1自动形成下一条指令的地址，跳跃寻址则通过转移类指令实现，是通过对PC的运算得到新的下一条指令的地址。3. 常见寻址方式1）立即寻址所需的操作数由指令的地址码部分直接给出，就称为立即数（或直接数）寻址方式。这种方式的特点是取指时，操作码和一个操作数同时被取出，不必再次访问存储器，提高了指令的执行速度。但是由于这一操作数是指令的一部分，不能修改，而一般情况下，指令所处理的数据都是在不断变化的（如上条指令的执行结果作为下条指令的操作数），故这种方式只能适用于操作数固定的情况。通常用于给某一寄存器或存储器单元赋初值或提供一个常数等。2）直接寻址指令的地址码部分给出操作数在存储器中的地址。3）隐含寻址操作数的地址隐含在操作码或者某个寄存器中。4）间接寻址在寻址时，有时根据指令的地址码所取出的内容既不是操作数，也不是下一条要执行的指令，而是操作数的地址或指令的地址，这种方式称为间接寻址或间址。5）寄存器寻址计算机的中央处理器一般设置有一定数量的通用寄存器，用以存放操作数、操作数的地址或中间结果。假如指令地址码部分给出某一通用寄存器地址，而且所需的操作数就在这一寄存器中，则称为寄存器寻址。通用寄存器的数量一般在几个至几十个之间，比存储单元少很多，因此地址码短，而且从寄存器中存取数据比从存储器中存取快得多，所以这种方式可以缩短指令长度、节省存储空间，提高指令的执行速度，在计算机中得到广泛应用。6）寄存器间接寻址寄存器中给出的是操作数的地址，因此还需要访问一次存储器才能得到操作数。7）基址寻址在计算机中设置一个专用的基址寄存器，或由指令指定一个通用寄存器为基址寄存器。操作数的地址由基址寄存器的内容和指令的地址码A相加得到 8）变址寻址指令地址码部分给出的地址A和指定的变址寄存器X的内容通过加法器相加，所得的和作为地址从存储器中读出所需的操作数。这是几乎所有计算机都采用的一种寻址方式。9）相对寻址把程序计数器PC的内容（即当前执行指令的地址）与指令的地址码部分给出的位移量（disp）之和作为操作数的地址或转移地址，称为相对寻址。主要用于转移指令，执行本条指令后，将转移到（PC）disp，（PC）为程序计数器的内容。相对寻址有两个特点： 1转移地址不是固定的，它随着PC值的变化而变化，并且总是与PC相差一个固定值disp，因此无论程序装人存储器的任何地方，均能正确运行，对浮动程序很适用。 2位移量可正、可负，通常用补码表示。如果位移量为n位，则这种方式的寻址范围在 (PC)-2n-1 (PC)+2n-1-1之间计算机的程序和数据一般是分开存放的，程序区在程序执行过程中不允许修改。在程序与数据分区存放的情况下，不用相对寻址方式来确定操作数地址。10）堆栈寻址在一般计算机中，堆栈主要用来暂存中断和子程序调用时现场数据及返回地址，用于访问堆栈的指令只有压入（即进栈）和弹出（即退栈）两种，它们实际上是一种特殊的数据传送指令：压入指令（PUSH）是把指定的操作数送入堆栈的栈

展开阅读全文