计算机组成原理第九章课件(白中英版)

上传人:hjk****65 文档编号:248551726 上传时间:2024-10-24 格式:PPT 页数:21 大小:241KB
返回 下载 相关 举报
计算机组成原理第九章课件(白中英版)_第1页
第1页 / 共21页
计算机组成原理第九章课件(白中英版)_第2页
第2页 / 共21页
计算机组成原理第九章课件(白中英版)_第3页
第3页 / 共21页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,组织与结构,并行组织,计算机组成原理,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,第,*,页,计算机组成原理,第九章并行组织,计算机组成原理,任课教师:石磊,郑州大学信息工程学院计算机系,Email:,Tel:13676986863,第一章,计算机系统概论,第二章,运算方法和运算器,第三章 存储系统,第四章 指令系统,第五章 中央处理器,第六章 总线系统,第七章 外围设备,第八章 输入输出系统,第九章 并行组织,目录,教材,白中英,计算机组成原理,网络版,科学出版社,,2002,参考书,石磊,计算机组成原理,第,2,版,清华大学出版社,,2006,钱晓捷,微型计算机原理及应用,清华大学出版社,,2006,王爱英,计算机组成与结构,第,3,版,清华大学出版社,,2001,白中英 邝坚,计算机组织与结构,网络版,科学出版社,,2003,第,9,章 并行组织,9.1,体系结构中的并行性,参见第,5.8.1,节 并行处理技术,9.2,互连网络,解决多处理机系统的互连问题,9.3,向量处理机,处理向量数据,提高指令级并行能力,9.4,阵列处理机,利用资源重复实现并行性,9.5,多处理机系统,多台独立的计算机组成,9.6,机群系统,分布计算机系统,9.2,互连网络,互连网络,(interconnection),是并行处理系统的核心组成部分,也称网络,(network),或通信子网,(communication subnet),互连网络,是由高速开关元件按照一定的拓扑结构和控制方式构成的网络,用来实现计算机系统内部多个功能部件或多个处理机之间的相互连接,结点,(,节点,Node),是系统中的处理机或功能部件,静态互连网络,在各个节点之间使用专用的连接通路,构成后在运行中固定不变,动态,互,连,网络,由程序控制,沿着连接通路使用开关或仲裁器实现所需的通信模式,9.3,向量计算机,(vector processor),最初面向诸如科学计算这样的超级计算应用问题,高层次处理向量:线性数组,用一条向量指令同时处理两个数组的运算;相当于标量处理的一个循环过程,+,r1,r2,r3,add r3,r1,r2,标量,(1,个操作,),v1,v2,v3,+,vector,length,vadd.vv v3,v1,v2,向量,(N,个操作,),向量处理方法,For(i=1;i=N;i+),di,=,ai,*(,bi,+,ci,);,水平(横向)处理方式,逐个求,di,,先计算,d1=a1*(b1+c1),,再计算,d2,,,,最后计算,dN,垂直(纵向)处理方式,将整个向量按相同的运算处理完后,再执行别的运算,分组(纵横)处理方式,把长度为,N,的向量,分成若干组,每组长度为,n,,组内按纵向方式处理,依次处理各组,向量处理机的结构,存储器,-,存储器结构,所有向量操作是在存储器与存储器之间进行,图,9.10,寄存器,-,寄存器向量结构,所有向量操作是在向量寄存器之间进行(除向量读取和存储),对应标量的寄存器,-,寄存器(,load-store,)结构,图,9.12,向量机的特点,一条指令执行大量运算(相当于标量处理的一个循环),减少了大量取指操作,每个结果都与前一个结果不相关,编译器保证了不存在相关,多个操作可以并行执行,更简单的设计,更高的时钟频率,减少了流水线中的分支及其延迟,向量指令以确定的方式访问存储器,有效的预取,通过大量数据元素分摊了存储器延迟,可充分利用高带宽的存储器系统,无需(数据),Cache,向量处理机的未来,从,20,世纪,70,年代中期,向量机从一个新结构发展到为工程师和科学家提供高效的计算能力,超标量微处理器的高性能价格比使得价格昂贵的向量超级计算机,(supercomputer),走向终结,另一方面,超标量微处理机开始应用早期向量处理机的成熟技术,多数商用微处理器都加入了多媒体扩展指令,被称为,SIMD,指令,例如,,Pentium 4,支持的整数,MMX,指令,浮点数,SSE/SSE2/SSE3,指令,9.4,阵列处理机,阵列处理机,是单指令流多数据流结构的专用计算机,也称为,SIMD,计算机、并行处理机,阵列处理机主要采用硬件的资源重复方法实现并行性,对大量数据进行向量处理,分布式存储器的阵列机,每个处理单元,PE,有各自的本地存储器,LM,图,9.15,共享存储器的阵列机,集中设置存储器,共享的多体并行存储器,SM,通过网络与各个处理单元,PE,相连,图,9.16,9.5,多处理机系统,多处理机,由若干台独立的计算机组成,每台计算机能够独立执行自己的程序;处理机之间通过互连网络进行连接,从而实现程序之间的数据交换和同步,多处理机属于,MIMD,计算机,实现任务或作业级的并行,紧耦合系统,通过总线或高速开关实现互连,具有较高的物理连接频带,可以共享主存;,松耦合系统,通过通道或通信线路时间互连,可以共享外存,同构型多处理机系统,的每个处理机是同类型的,完成同样的功能;,异构型多处理机,系统由多个不同类型,担负不同功能的处理机组成,并行向量处理机,PVP,、对称多处理机,SMP,、大规模并行处理机,MMP,、分布共享存储器多处理机,DSM,9.6,机群(集群),机群系统,(Cluster),通过高速互连网络将通用的计算机(如,PC,机、工作站)连接起来,采用消息传递机制,向最终用户提供单一并行编程环境和资源,机群具有低费用、可扩展且故障分离的优势;有许多大型机的应用更适合在松散连接的机器上运行,例如网络服务公司的文件服务器、,Web,服务器,还有数据库领域、科学计算市场,机群的优点:使用方便、可靠性好、可缩放性好、性能价格比好,机群的不足:维护工作量和费用较高,多线程技术,进程,(process),是可以独立运行的一段代码,多个处理器可以执行同一个程序并共享程序代码和地址空间。当多个进程用这种方式共享程序代码和地址空间时,常被称之为,线程,(thread),现在,线程常用来指在不同处理器上的多个执行过程,即使它们没有共享地址空间,多处理器系统会有多个进程或线程在执行,多个线程中存在并行性,被称为,线程级并行,TLP,(thread-level parallel),,由高层的软件系统来识别,多线程,(multithreading),技术允许多个线程以重叠的方式共享单个处理器的功能单元,在单个处理器中开发线程级并行,同时多线程技术,实现线程级并行处理器的典型技术主要有,同时多线程,SMT,(Simultaneous Multi-Threading),:,通过复制处理器上的结构状态,让同一个处理器上的多线程同时执行并共享处理器的执行资源,最大限度地提高部件的利用率,单芯片多处理器,CMP,(Chip Multi-Processors),:,在一个芯片上制作多个处理器,同时多线程技术将线程级并行转化为指令级并行,其最具吸引力的是只需小规模改变处理器核心的设计,几乎不用增加额外的成本就可以显著地提升效能,超线程技术,超线程技术,HT,(Hyper Threading),是同时多线程技术的一种,Intel,首先在其面向服务器的,Xeon,微处理器上采用。从,3.06GHz,的,Pentium 4,开始,所有,IA-32,微处理器都支持,HT,技术,超线程技术,使,一个物理处理器,看似有,两个逻辑处理器,,每个逻辑处理器维持一套完整的结构状态,共享几乎物理处理器上所有执行资源,从软件角度看,这意味操作系统和用户程序像传统多处理器系统一样在逻辑处理器上调度线程或进程,从微结构角度看,这意味两个逻辑处理器的指令可以在共享的执行资源上同时保持和执行,Pentium 4,的,NetBurst,微结构,Pentium 4,的超线程流水线,两套相互独立的指令指针跟踪着两个软件线程,各有一套队列缓冲器,两个线程共享同一个译码逻辑,保存两套译码指令的所有状态,微操作队列划分为两个区域,每个逻辑处理器各占一半,8,个通用寄存器被动态扩展成,128,个,调度,和执行不区别微操作来自哪个逻辑处理器,只要执行资源得到满足,就分派执行,退出逻辑跟踪两个逻辑处理器,交替以程序顺序退出微操作,第,9,章教学要求,了解互连网络的作用,区别标量处理和向量处理,了解向量处理机和阵列处理机的概念,了解多处理机系统和机群系统的概念,END,第,九,章 小结,本章小结,计算机系统由硬件和软件组成。计算机系统结构主要研究软件、硬件功能分配和对软件、硬件界面的确定。计算机系统结构、计算机组成和计算机实现是三个不同的概念。系统结构是计算机系统的软、硬件的界面,计算机组成是计算机系统结构的逻辑实现,计算机实现是计算机组成的物理实现。,按照指令系统和数据流的不同,计算机系统分为:单指令流单数据流、单指令流多数据流、多指令流所单数据流、多指令流多数据流计算机系统。,向量处理机有巨型计算机和向量协处理机两种类型。,并行性包含两方面意思:同时性和并行性。主要表现为时间重叠、资源重复和资源共享。,精简指令系统计算机(,Reduced Instruction Set Computer,),,简称,RISC,。,精简指令系统计算机是通过简化指令使计算机的结构更加简单合理,从而提高运算速度,其途径是减少指令的执行周期数。,新一代计算机系统必将对人类社会产生更为深远的影响。,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 机械制造 > 工业自动化


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!