资源描述
,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,公共知识部分,第一章数据结构及算法,一、算法,1,、算法的概念,算法:是指解题方案的准确而完整的描述。算法不等于程序,也不等计算机方法,程序需考虑许多与方法分析无关的细节,因为在编写程序时要受到计算机系统运行环境的影响,因此程序的编制不可能优于算法的设计。,2,、算法的基本特征(,P2,),(,1,)可行性,(,2,)确定性,算法中每一步骤都必须有明确定义,不充许有模棱两可的解释,不允许有多义性,(,3,)有穷性,算法必须能在有限的时间内做完,即能在执行有限个步骤后终止,包括合理的执行时间的含义。,(,4,)拥有足够的情报。当有足够的情报时,该算法才有效。,综上所述:算法是一组严谨地定义运算顺序的规则,每一个规则都是有效的,是明确的,此顺序将在有限的次数下终止。,3,、算法的基本要素,(,1,)是对数据对象的运算和操作;每个算法实际上是按解题要求从环境能进行的所有操作中选择合适的操作所组成的一组指令序列。因此,计算机算法就是计算机能处理的操作所组成的指令序列。通常,计算机可以执行的基本操作是以指令的形式描述的。计算机系统能执行的所有指令的集合,称为该计算机系统的指令系统。,基本运算和操作包括:算术运算、逻辑运算、关系运算、数据传输(赋值、输入、输出),(,2,)是算法的控制结构。一个算法的功能不仅取决于所选用的操作,而且还与各操作之间的执行顺序有关。算法中各操作之间的执行顺序称为算法的控制结构。算法的控制结构给出了算法的基本框架,它不仅决定了算法中各操作的执行顺序,而且也直接反映了算法的设计是否符合结构化原则。,算法的控制结构:顺序结构、选择结构、循环结构。,算法描述工具有:传统流程图、,N-S,流程图、算法描述语言。,算法基本设计方法:列举法、归纳法、递推、递归、减斗递推技术、回溯法。(,P5,),4,、算法复杂度,包括:算法时间复杂度和算法空间复杂度。,算法时间复杂度是指执行算法所需要的计算工作量。算法的工作量用算法所执行的基本运算次数来度量。,算法空间复杂度是指执行这个算法所需要的内存空间。,1,、数据结构是指相互有关联的数据元素的集合,(比如春、夏、秋、冬,有共同特征,存在某种关系,这种关系用前后件来描述,夏是秋的前件,是春的后件),2,、数据结构研究的三个方面:,(,1,)数据集合中各数据元素之间所固有的逻辑关系,即数据的逻辑结构;,(,2,)在对数据进行处理时,各数据元素在计算机中的存储关系,即数据的存储结构;,(,3,)对各种数据结构进行的运算。,二、数据结构,3,、数据的逻辑结构,数据结构是指反映数据元素之间关系的数据元素集合的表示。更通俗地说,数据结构是带有结构的数据元素的集合。这种结构实际上就是指数据元素之间的前后件关系。,数据的逻辑结构包含:,(,1,)表示数据元素的信息;,(,2,)表示各数据元素之间的前后件关系。,数据的逻辑结构,是指反映数据元素之间的逻辑关系的数据结构,与计算机中的存储位置无关,即与数据的存储结构无关。,4,、数据的存储结构,在实际进行数据处理时,被处理的各数据元素总是被存放在计算机的存储空间中,并且,各数据元素在计算机存储空间中的位置关系与它们逻辑关系不一定是相同的,而且一般也不可能相同。,数据的逻辑结构在计算机存储空间中的存放形式称为数据的存储结构(也称数据的物理结构),为了表示存放在计算机存储空间中的各数据元素之间的逻辑关系(前后件关系),在数据的存储结构中,不仅要存放各数据元素的信息,还需要存放各数据元素之间的前后件关系的信息。,一般来说,一种数据的逻辑结构根据需要可以表示成多种存储结构,常用的存储结构有顺序、链接、索引等存储结构。,5,、数据结构,根据数据结构中各数据元素之间前后件关系的复杂程序,一般将数据结构分为二大类型:线性结构与非线性结构。,线性结构(也称为线性表)条件:,(,1,)有且只有一个根结点;,(,2,)每一个结点最多有一个前件,也最多有一个后件。,非线性结构:不满足线性结构条件的数据结构。,6,、线性表及其顺序存储结构,线性表由一组数据元素构成,数据元素的位置只取决于自己的序号,元素之间的相对位置是线性的。,在复杂线性表中,由若干项数据元素组成的数据元素称为记录,而由多个记录构成的线性表又称为文件。,非空线性表的结构特征:,(,1,)且只有一个根结点,a1,,它无前件;,(,2,)有且只有一个终端结点,an,,它无后件;,(,3,)除根结点与终端结点外,其他所有结点有且只有一个前件,也有且只有一个后件。结点个数,n,称为线性表的长度,当,n=0,时,称为空表。,线性表的顺序存储结构具有以下两个基本特点:,(,1,)线性表中所有元素的所占的存储空间是连续的;,(,2,)线性表中各数据元素在存储空间中是按逻辑顺序依次存放的。,ai,的存储地址为:,ADR(ai)=ADR(a1)+(i-1)k,,,ADR(a1),为第一个元素的地址,,k,代表每个元素占的字节数。,顺序表的运算:插入、删除。,(详见,14-16,页),7,、线性表的顺序存储结构:栈、队列,栈实际上也是线性表,只不过是种特殊的线性表,在这种特殊的线性表中,其插入与删除运算都只在线性表的一端进行,即在这种线性表的结构中,一端是封闭的,不允许进行插入与删除元素;另一端是开口的,允许插入与删除元素。在顺序存储结构下,该类线性表的插入与删除运算是不需要移动表中其他数据元素的,栈是限定在一端进行插入与删除的线性表。允许插入与删除的一端称为栈顶,不允许插入与删除的另一端称为栈底。栈按照,“,先进后出,”,(,FILO,)或,“,后进先出,”,(,LIFO,)组织数据,栈具有记忆作用。用,top,表示栈顶位置,用,bottom,表示栈底。,栈的基本运算:,(,1,)插入元素称为入栈运算:首先将栈顶指针进一,(,即,top,加,1,),然后将新元素插入到栈顶指针指向的位置,(,2,)删除元素称为退栈运算:首先将栈顶元素赋给指定变量,然后将栈顶指针退一,(,即,top,减,1),(,3,)读栈顶元素是将栈顶元素赋给一个指定的变量,即时不删除元素,指针无变化。,在计算机系统中,如一次只能执行一个用户程序,则在多个用户程序需执行时,这些用户程序必须按到来的顺序进行排队等待。用一个线性表来组织管理用户程序的排队执行,原则是:,P19,(,1,)初始时线性表为空,(,2,)当有用户程序来到时,将该用户程序加入到线性表的末尾进行等待,(,3,)当计算机系统执行当前的用户程序后,就从线性表的头部取出一个用户程序执行。,队列是,“,先进行出,”,(,FIFO,)或,“,后进后出,”,(,LILO,)的线性表。,队列运算包括,(,1,)入队运算:从队尾插入一个元素;,(,2,)退队运算:从队头删除一个元素。,循环队列:,s=0,表示队列空,,s=1,且,front=rear,表示队列满,8,、线性链表 数据结构中的每一个结点对应于一个存储单元,这种存储单元称为存储结点,简称结点。结点由两部分组成:(,1,)用于存储数据元素值,称为数据域;(,2,)用于存放指针,称为指针域,用于指向前一个或后一个结点。在链式存储结构中,存储数据结构的存储空间可以不连续,各数据结点的存储顺序与数据元素之间的逻辑关系可以不一致,而数据元素之间的逻辑关系是由指针域来确定的。链式存储方式即可用于表示线性结构,也可用于表示非线性结构。线性链表,,HEAD,称为头指针,,HEAD=NULL,(或,0,)称为空表,如果是两指针:左指针(,Llink,)指向前件结点,右指针(,Rlink,)指向后件结点。线性链表的基本运算:查找、插入、删除。,9,、树树是一种简单的非线性结构,所有元素之间具有明显的层次特性。在树结构中,每一个结点只有一个前件,称为父结点,没有前件的结点只有一个,称为树的根结点,简称树的根。每一个结点可以有多个后件,称为该结点的子结点。没有后件的结点称为叶子结点,在树结构中,一个结点所拥有的后件的个数称为该结点的度,所有结点中最大的度称为树的度。树的最大层次称为树的深度。,在树中,以某结点的一个子结点为根构成的树称为该结点的一棵子树。,10,、二叉树,(p32),二叉树的特点:(,1,)非空二叉树只有一个根结点;(,2,)每一个结点最多有两棵子树,且分别称为该结点的左子树与右子树。,由上可看出,在二叉树中,每个结点的度最大为,2,,即所有子树(左子树或右子树)也均为二叉树,面树结构中每一个结点的度可以是任意的。在二叉树中,一个结点可以只有左子树而没有右子树,也可以只有右子树而没有左子树,当一个结点既没有左子树也没有右子树时,廖结点即是叶子结点,二叉树的基本性质:(,1,)在二叉树的第,k,层上,最多有,2,k-1,(k1),个结点;(,2,)深度为,m,的二叉树最多有,2,m,-1,个结点;(,3,)度为,0,的结点(即叶子结点)总是比度为,2,的结点多一个;(,4,)具有,n,个结点的二叉树,其深度至少为,log,2,n+1,其中,log2n,表示取,log2n,的整数部分;,满二叉树:除最后一层外,每一层上的所有结点都有两个子结点。,在满二叉树,每一层上的结点数都达到最大值,即在满二叉树的第,K,层上有,2,k-1,(k1),个结点,深度为,m,的满二叉树有,2,m,-1,个结点,完全二叉树:除最后一层外,第一层上的结点数均达到最大值,在最后一层上只缺少右边的若干结点。,(,5,)具有,n,个结点的完全二叉树的深度为,log,2,n+1,;(,6,)设完全二叉树共有,n,个结点。如果从根结点开始,按层序(每一层从左到右)用自然数,1,,,2,,,.n,给结点进行编号(,k=1,2,.n,),有以下结论:若,k=1,,则该结点为根结点,它没有父结点;若,k1,,则该结点的父结点编号为,INT(k/2),;若,2kn,,则编号为,k,的结点的左子结点编号为,2k,;否则该结点无左子结点(也无右子结点);若,2k+1n,,则编号为,k,的结点的右子结点编号为,2k+1,;否则该结点无右子结点。,二叉树存储结构采用链式存储结构,对于满二叉树与完全二叉树可以按层序进行顺序存储。二叉树的遍历:,(,1,)前序遍历(,DLR,),首先访问根结点,然后遍历左子树,最后遍历右子树;,注意遍历左、右子树时也采用前序遍历方法,(,2,)中序遍历(,LDR,),首先遍历左子树,然后访问根结点,最后遍历右子树;,注意遍历左、右子树时也采用中序遍历方法,(,3,)后序遍历(,LRD,)首先遍历左子树,然后访问遍历右子树,最后访问根结点。,注意遍历左、右子树时也采用后序遍历方法,11,、查找技术 顺序查找:从线性表的第一个元素开始,依次将线性表中的元素与被查元素进行比较,若相等则表示找到(查找成功),若线性表中所有的元素都与被查元素进行了比较但都不相等,则表示查找失败。对于长度为,n,的线性表,最坏情况需比较,n,次。,顺序查找的使用情况:(,1,)线性表为无序表;(,2,)表采用链式存储结构。,二分查找:只适用于顺序存储的有序表,设有序线性表的长度为,N,,被查元素为,X,,对分查找方法如下:,将,X,与线性表的中间项进行比较:,=X,,查到,查找结束;,X,,则在线性表前半部分以相同方法进行查找;,x,,则在线性表后半部分以相同方法进行查找;,二分法查找只适用于顺序存储的有序表,对于长度为,n,的有序线性表,最坏情况只需比较,log2n,次。,12,、排序技术 排序是指将一个无序序列整理成按值非递减顺序排列的有序序列。交换类排序法:(,1,)冒泡排序法,需要比较的次数为,n(n-1)/2,;(,2,)快速排序法。插入类排序法:(,1,)简单插入排序法,最坏情况需要,n(n-1)/2,次比较;(,2,)希尔排序法,最坏情况需要,O(n,1.5,),次比较。选择类排序法:(,1,)简单选择排序法,最坏情况需要,n(n-1)/2,次比较;(,2,)堆排序法,最坏情况需要
展开阅读全文