资源描述
西安电子科技大学 何超电磁场数值分析考点 1: 矩量法的一般过程 (算子方程、 离散化过程、 选配过程、 矩阵方程求解) 。给定算子方程和基函数,采用伽略金法, 计算阻抗矩阵和激励电压矩阵,从而求得 电流系数矩阵 ,即得到 方程的近似解。 (矩阵维数一般为 22,或 33,便于计算) 。1有3个矩量法例题考点 2:ScaLAPACK 的矩阵分布方式。给定进程网格,矩阵分块大小,要求能写出按 ScaLAPACK矩阵分布方式,每个进程对应的矩阵元素。?1 并行矩阵填充 在 PC集群系统中MPI并行矩量法研究 36 37考点 3: temporary block column 对 active block column 分解产生的影响.对于当前活动列块(即正在进行LU分解的列块),要能够分析其左侧临时列块对其LU分解所产生的影响。?英文书写得很详细了啊 45-55有 lu分解 将系数矩阵A转变成等价两个矩阵L和U的乘积 ,其中L和U分别是下三角和上三角矩阵。当A的所有顺序主子式都不为0时,矩阵A可以分解为A=LU,且当L的对角元全为1时分解唯一。其中L是下三角矩阵,U是上三角矩阵。 4阶矩阵的LU分解1高斯消元法 见数值分析 教材考点 4:积分方程的建立要求掌握 EFIE 、MFIF 、PMCHW(电场、磁场、表面积分方程) 根据 等效原理建立的过程,即对于给定的问题(PEC (理想导体)或 介质)能根据等效原理建立积分方程(不要求写出场的位函数表达式,主要考察方程建立的思想) 。看矩量法的书那个英文书只有EFIE等效原理EFIE考点 5:RWG 基函数考察 RWG 基函数的 表达式,以及其 特点,对于给定的一个三角形网格图要能够标出哪些地方( 公共边上) 存在基函数。 书上都有啊RWG基函数用共边的三角形对作为基本的面元形式,如图2所示,第n条边对应的电流基函数表示为考点 6:解矩阵方程的迭代方法-CG 迭代方法要求掌握 RCG 和 RPCG 的计算流程,二者中考一个。书上有啊 只有 RCG考点 7:并行性能评测Wall clock time 、并行加速比、并行效率、可扩展性。其中 Wall clock time由哪几部分时间 组成。时钟时间(墙上时钟时间wall clock time):从进程从开始运行到结束,时钟走过的时间,这其中包含了进程在阻塞和等待状态的时间。进程的三种状态为阻塞、就绪、运行。 Wall clock time由哪几部分时间组成? 时钟时间 阻塞时间 就绪时间 运行时间用户CPU时间 就是用户的进程获得了CPU资源以后,在用户态执行的时间。系统CPU时间 = 用户进程获得了CPU资源以后,在内核态的执行时间。用户CPU时间+系统CPU时间=运行时间。并行算法的评价方法.1. 加速比(speedup),是同一个任务在单处理器系统和并行处理器系统中运行消耗的时间的比率, Sp=T1/TpSp是加速比,T1是单处理器下的运行时间,Tp是在有P个处理器并行系统中的运行时间。该评测指标,如果能够随着P保持一个线性的增长,则表示,多台机器能够很好的缩短所需时间2.并行效率也是评价并行性能的重要指标之一,它其实是“每个进程”的加速比:线性加速比相当于并行效率p/p=1.0,通常,效率都小于1。3.scaleup可扩展性评测scaleup的方法是,在扩大数据的同时,增加计算机的数目。scaleup计算方法如下:scaleup(DB,m)=使用1台电脑在DB上运行算法使用的时间/使用m台电脑在m*DB上运行算法使用的时间。如果scaleup值随着m的改变,一直在1.0附近,或者更低,则表示该算法,对数据集的大小有很好的适应性。考点 8:并行矩量法的调优方法调优参数:Block size 、process grid 、in-core buffer(核外而言) 。要掌握一些基本的结论。 197-199 170-176出了矩量法基本原理 和积分方程那一块可能没有 就说这些参数怎么影响性能的1 对于Intel CPU,当问题规模增加时,Block size为104表现优于Block size为112.2 The matrix solving time decreases to approximately 70% of the original time after the process grid is changed from 1*64 to 8*8. Using more CPU cores does not guarantee faster simulation unless the code is executed with a properly designed process grid.The choice of 2*32 process grid is better than the choice of the 4*16 process grid.The choice of the optimum process grid changes with the hardware configuration.Properly choosing the number of cores and the shape of the process grid is the key to attaining the best performance. 3 但是积分方程应该就考简单的EFIFBlock size 是ScaLAPACK 矩阵循环分布时 矩阵分块的大小process grid过程网格in-core buffer 内核的缓冲区评价算法优劣的标准是? 时间复杂度:同样的输入规模(问题规模)花费多少时间空间复杂度:同样的输入规模花费多少空间(主要是内存)以上两点越小越好稳定性:不会因为输入的不同而导致不稳定的情况发生算法思路是否简单:越简单越容易实现越好程序优化方法1 程序尽量采用多线程机制,利用平行处理的观念 ,2充分利用CPU时间片;尽量减少数据的搬移操作。3优化耗时比较大的环节 4使用软件流水技术 5尽量少进行函数调用6尽量使用逻辑运算代替乘除运算7 增加CACHE高速缓存的使用 电场积分方程是对于金属问题根据电场满足的边界条件建立的方程MPI 消息传递互动进程 一段程序的执行过程RCS 雷达散射截面介绍计算电磁学中的几种典型算法
展开阅读全文