多核处理器体系结构及并行设计

上传人:guoc****ang 文档编号:243692400 上传时间:2024-09-28 格式:PPT 页数:37 大小:1,014.50KB
返回 下载 相关 举报
多核处理器体系结构及并行设计_第1页
第1页 / 共37页
多核处理器体系结构及并行设计_第2页
第2页 / 共37页
多核处理器体系结构及并行设计_第3页
第3页 / 共37页
点击查看更多>>
资源描述
http:/,Click to Edit Master Title Style,Click to edit Master text styles,Second level,Third level,*,多核处理器体系结构及并行程序设计,天津大学 于策,yuce_air,1,Outline,多核处理器简介,并行程序设计方法学(,PCAM,),科研及技术(天津大学,SRDC,及,IBM,技术中心),2, http:/,Outline,多核处理器简介,并行程序设计方法学(,PCAM,),科研及技术(天津大学,SRDC,及,IBM,技术中心),3, http:/,什么是多核处理器?,两个或多个独立运行的内核集成于同一个处理器上面,双核处理器,=,一个处理器上包含,2,个内核,多核处理器,=,一个处理器上包含,2,个或多个内核,Core0,Core1,Front Side Bus,4, http:/,为什么要采用多核技术?,5, http:/,最终目标,:,提升用户的体验,摩尔定律,不断发展和改进处理器的性能,最大限度地利用越来越多的晶体管,实现最优的价值,缩减处理时间,提高计算能力,开发平台的新特性和新功能,6, http:/,通过并行方式改进处理器的性能,2005+,Dual- and Multi-core,2-way SMP system,4 Cores,4 Threads,2001,Hyper-Threading,2-way SMP system,2 Cores,4 Threads,1995,Multi-processing,2-way SMP system,2 Cores,2 Threads,7, http:/,多核技术的发展,Cache,Execution,State,State,Bus,Cache,Execution,State,Bus,Cache,Execution,State,Bus,Cache,Execution,State,Bus,Cache,Execution,State,Bus,Pentium 4,with HT,Dual Xeon Processors,Dual Core,2 Threads,1 Package,2 Threads,2 Packages,2 Threads,1 Package,Two independent execution cores in the same processor,8, http:/,几种不同的技术,HT Hyper Threading:,2 threads,running on the same,processor core,处理器上的某些资源会被共享,使用相同的缓存和运算器,DC Dual Core:,2 execution cores,in the same,processor package,共享系统总线,与双处理器的性能相同,DP/MP Dual/Multi-Processing:,2 or more processors,in the same,system,只共享系统总线,独立缓存,高性能,资源冲突少,9, http:/,双核技术,VS.,超线程技术,双核是真正意义上的双处理器,不会发生资源冲突,每个线程拥有自己的缓存、寄存器和运算器,一个,3.2GHz,Smithfiled,在性能上并非等同于,3.2GHz P4 with HT,的,2,倍,HT,使处理器的性能至少提升了,1/3,双核的性能相当于,2,块,non-HT,处理器,双核技术与,HT,技术在性能上的对比,Ex 1:,两个,floating point,线程,(Smithfield client),每个线程拥有自己的,FPU,没有资源冲突,尽管性能上没有提升太多,但仍然优于,HT,Ex 2:,一个,integer,线程与一个,floating point,线程,性能大幅度提升,没有资源冲突,10, http:/,Single core , With HT,(,Eg,. Pentium 4 Processor With HT ),Integer and Floating Point Threads,L2 Cache and Control,L2 Cache and Control,L1 D-Cache and D-TLB,Schedulers,Integer,Trace Cache,Rename/Alloc,uop Queues,BTB,uCode,ROM,3,3,Decoder,BTB & I-TLB,Floating,Point,2 threads can be executed at the same time (per processor) if theyre,not competing for the same execution resource,11, http:/,Single core , With HT,(,Eg,. Pentium 4 Processor with HT ),Two Floating Point Threads,L2 Cache and Control,L2 Cache and Control,L1 D-Cache and D-TLB,Schedulers,Integer,Trace Cache,Rename/Alloc,uop Queues,BTB,uCode,ROM,3,3,Decoder,BTB & I-TLB,Floating,Point,2 threads CANNOT be executed at the same time (per processor) if theyre competing for the same execution resource (,eg,. 2 floating point threads in a P4P architecture),12, http:/,Dual core , Without HT,(,Eg,. Pentium D Processor ),Two Floating Point Threads,L2 Cache and Control,L2 Cache and Control,L1 D-Cache and D-TLB,Schedulers,Integer,Trace Cache,Rename/Alloc,uop Queues,BTB,uCode,ROM,3,3,Decoder,BTB & I-TLB,Floating,Point,L2 Cache and Control,L2 Cache and Control,L1 D-Cache and D-TLB,Schedulers,Integer,Trace Cache,Rename/Alloc,uop Queues,BTB,uCode,ROM,3,3,Decoder,BTB & I-TLB,Floating,Point,Even 2 floating point,threads can be executed,at the same time now,(per processor) as there,are multiple floating point,execution units,13, http:/,Dual core , With HT,(,Eg,. Dual Core Pentium Processor Extreme Edition ),Supports HT,Multiple Integer and Floating Point Threads,L2 Cache and Control,L2 Cache and Control,L1 D-Cache and D-TLB,Schedulers,Integer,Trace Cache,Rename/Alloc,uop Queues,BTB,uCode,ROM,3,3,Decoder,BTB & I-TLB,Floating,Point,L2 Cache and Control,L2 Cache and Control,L1 D-Cache and D-TLB,Schedulers,Integer,Trace Cache,Rename/Alloc,uop Queues,BTB,uCode,ROM,3,3,Decoder,BTB & I-TLB,Floating,Point,With dual core & HT together, maximum # of threads that can,be executed at a time is 4 per,processor,14, http:/,多核技术与超线程技术的结合,产 量,多功能,功 效,Core0,Core1,Front Side Bus,Dual Core with Hyper-Threading,4 threads/socket,Core0,Core1,Front Side Bus,Dual Core,2 threads/socket,15, http:/,AMD,与,Intel,双核架构,的对比,AMD,Opteron,双核架构示意图,Intel,奔腾至尊版双核架构示意图,16, http:/,多核面临的困难,如何计算软件授权,?,按,CPU,个数收取软件授权费用,按,芯片,个数收取软件授权费用,应用软件,是否,支持,?,如果应用程序是基于多处理器编写的,如果应用程序是基于单处理器编写的,双核发热大,散热是难题,17, http:/,DualCore,、,SMP,、,Cluster,体系结构,特性,SMP,(对称多处理机),Cluster,(集群),DualCore,处理器,单一主机,多个处理器,多台主机,有各自的处理器(一或多),单一主机,单一处理器,多个核心,操作系统,单一,多个,单一,主要并行计算方式,多进程,内存共享,多进程,基于消息传递,多线程,18, http:/,Outline,多核处理器简介,并行程序设计方法学(,PCAM,),科研及技术(天津大学,SRDC,及,IBM,技术中心),19, http:/,PCAM,设计方法学,划分,(Partitioning),通讯,(Communication),组合,(Agglomeration),映射,(Mapping),20, http:/,PCAM,设计方法学,设计并行算法的四个阶段,划分,(Partitioning),通讯,(Communication),组合,(Agglomeration),映射,(Mapping),划分:,分解成小的任务,开拓并发性;,通讯:,确定诸任务间的数据交换,监测划分的合理性;,组合:,依据任务的局部性,组合成更大的任务;,映射:,将每个任务分配到处理器上,提高算法的性能。,21, http:/,PCAM,设计过程,22, http:/,域分解,划分的对象是数据,可以是算法的输入数据、中间处理数据和输出数据;,将数据分解成大致相等的小数据片;,划分时考虑数据上的相应操作;,如果一个任务需要别的任务中的数据,则会产生任务间的通讯;,23, http:/,域分解,示例:三维网格的域分解,各格点上计算都是重复的。下图是三种分解方法:,24, http:/,功能分解,划分的对象是计算,将计算划分为不同的任务,其出发点不同于域分解;,划分后,研究不同任务所需的数据。如果这些数据不相交的,则划分是成功的;如果数据有相当的重叠, 意味着要重新进行域分解和功能分解;,功能分解是一种更深层次的分解。,25, http:/,划分判据,划分是否具有灵活性?,划分是否避免了冗余计算和存储?,划分任务尺寸是否大致相当?,任务数与问题尺寸是否成比例?,功能分解是一种更深层次的分解,是否合理?,26, http:/,通讯,通讯是,PCAM,设计过程的重要阶段;,划分产生的诸任务,一般不能完全独立执行,需要在任务间进行数据交流;从而产生了通讯;,功能分解确定了诸任务之间的数据流;,诸任务是并发执行的,通讯则限制了这种并发性;,27, http:/,通讯判据,所有任务是否执行大致相当的通讯,?,是否尽可能的局部通讯?,通讯操作是否能并行执行,?,同步任务的计算能否并行执行?,28, http:/,组合,组合是由抽象到具体的过程,是将组合的任务能在一类并行机上有效的执行;,合并小尺寸任务,减少任务数。如果任务数恰好等于处理器数,则也完成了映射过程;,通过增加任务的粒度和重复计算,可以减少通讯成本;,保持映射和扩展的灵活性,降低软件工程成本;,29, http:/,组合判据,增加粒度是否减少了通讯成本?,重复计算是否已权衡了其得益?,是否保持了灵活性和可扩放性?,组合的任务数是否与问题尺寸成比例,?,是否保持了类似的计算和通讯?,有没有减少并行执行的机会?,30, http:/,映射,每个任务要映射到具体的处理器,定位到运行机器上;,任务数大于处理器数时,存在负载平衡和任务调度问题;,映射的目标:减少算法的执行时间,并发的任务,不同的处理器,任务之间存在高通讯的,同一处理器,映射实际是一种权衡,属于,NP,完全问题,31, http:/,映射判据,采用集中式负载平衡方案,是否存在通讯瓶颈?,采用动态负载平衡方案,调度策略的成本如何?,32, http:/,Outline,多核处理器简介,并行程序设计方法学(,PCAM,),科研及技术(天津大学,SRDC,及,IBM,技术中心),33, http:/,技术力量,天津大学,IBM,新技术中心(,http:/,),共享大学研究(,SUR,),软件技术培训,Lotus,(协同工作),WebSphere,(,J2EE,),Rational,(应用程序设计与开发),DB2,(数据库与商务智能),AIX/Linux,(操作系统管理),Eclipse,(程序开发,,IDE,设计),全球专业认证,34, http:/,科研情况,天津大学软件研究与开发中心(,http:/,/,),网格计算,分布式与并行计算,可视化与图像处理,虚拟现实,数字艺术与动画,真实感图形,网络与信息安全,智能,Agent,,语义网,嵌入式系统,35, http:/,Lotus Workplace,产品家族,Lotus Domino(,服务器,邮件及应用程序,),Lotus Notes(,客户端,),Lotus Designer(,应用程序设计开发环境,),Lotus Document Manager(,文档管理,),Lotus Workflow(,工作流,),Lotus Enterprise Integrator(,企业集成,),Lotus Instant Messaging and Web Conferencing (,消息,), http:/,Eclipse,(http:/,www.eclipse.org,),Eclipse Platform,Platform Runtime,Tool,(plug-in),Tool,(plug-in),Tool,(plug-in),Workbench,Workspace,Help,Team,37, http:/,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 小学资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!