资源描述
数据库系统原理(第2章),第二章关系数据库,2-5章为本课程重点与难点关系数据库的理论基础1970,E.F.Codd“ARelationalModelofDataforSharedDataBanks”现代主流数据库几乎全部支持关系模型Oracle(甲骨文),Sybase,IBMDB2,MSSQLServer,Ingres,2.1关系模型概述,关系模型由关系数据库、关系操作集合和关系完整性约束三部分组成。单一的数据结构关系实体和实体之间的联系都用关系描述,二.关系操作就关系模型而言,仅仅给出了关系操作的能力,并不给定(限定)RDBMS语言的语法要求。关系操作的特点:一次一集合的操作方式Set-at-a-Time操作的对象和结果都是关系。,三种具有相同表达能力的抽象查询语言:关系代数ISBL元组关系演算语言ALPHA,QUEL域关系演算语言QBE,SQL则是介于关系代数和关系演算之间的标准查询语言。由IBM提出,是应用得最广泛的关系数据库标准语言。,三.关系的三类完整性约束条件关系模型必须满足:实体完整性和参照完整性约束。应用领域中的大量语义约束则由DBMS实现的用户定义完整性保证。注意:这是由DBMS来保证的,而非应用程序保证。,2.2关系数据结构及其形式化定义,从集合论的角度给出关系数据结构的形式化定义。(需要离散数学集合论的概念)2.2.1关系(Relation)1.域定义2.1:域是具有相同数据类型的值的集合。如自然数,全班同学的名字等。,2.2笛卡儿集(卡氏集)定义2.2给定一组域D1,D2,Dn,这些域中可以有相同的,D1,D2,Dn的笛卡儿集为:D1D2Dn(d1,d2,dn)|diDi,i=1,2,n,其中每一个元素称为一个n元组,元素中的每个值称为一个分量。,例:D1=大,中,小,D2=红,绿,例:D1=大,中,小,D2=红,绿D1D2=(大,红),(大,绿),(中,红),(中,绿),(小,红),(小,绿)共有326个2元组,注意:集合论中笛卡儿集不满足交换率,即笛卡儿集的元组有序。基数的概念:若Di(i=1,2,n)为有限集,其基数为|Di|,则D1D2Dn的基数为:|D1|D2|Dn|,3.关系定义2.3D1D2Dn的任意子集叫做在域D1,D2,Dn上的关系,可记做:R(D1,D2,Dn),R为关系名,n是关系的目或度(degree)。,注意:1.这里的“子集”是“任意子集”,包括空集。2.笛卡儿集不满足交换率,而关系通过给关系的列附加属性名的方式取消元组的有序性。3.按2.3的定义,关系可以是无限集。通常我们在关系数据模型中限定关系为有限关系。,候选码若关系中的某一属性组的值能唯一地标识一个元组,则称该属性组为该关系的一个候选码(CandidateKey)。一个关系可能有多个候选码,则选定其中一个作为主码(PrimaryKey)。包含在任何候选码中的属性称为主属性,不包含在任何候选码中的属性称为非主属性。全码(All-Key)关系模式的所有属性组构成此关系模式的唯一候选码。,基本关系六性质列是同质的;不同列可出自同一个域,每一列为一个属性,不同属性(列)给不同属性名;列的顺序可任意交换;任意两个元组不能完全相同;行的顺序可任意交换;每一分量是不可分的数据项。记忆方法:三列两行一分量。,注意:在许多实际关系数据库产品中,基本表并不完全具有这六条性质,例如,有的数据库产品(如FoxPro)仍然区分了属性顺序和元组的顺序;许多关系数据库产品中,例如Oracle,FoxPro等,它们都允许关系表中存在两个完全相同的元组。,2.2.2关系模式关系模式是对关系的描述。(是对型的描述)需描述元组集合的结构:由哪些属性构成,这些属性来自哪些域,以及属性与域之间的映象关系。此外,关系模式应刻划出完整性约束条件。,定义2.4关系的描述称为关系模式,可表述为:R(U,D,dom,F)其中R为关系名,U为组成该关系地属性名集合,D为属性组U中属性所来自的域,dom为属性向域的映象集合,F为属性间数据的依赖关系集。,关系模式通常可以简记为:R(U)或R(A1,A2,AN)其中R为关系名,A1,A2,AN为属性名。而域名及属性向域的映象常常直接说明为属性的类型、长度。关系模式是静态度、稳定的,而关系是动态的、随时间变化的,两者是型与值的关系。,2.2.3关系数据库在给定应用领域中,用于描述所有实体和实体间的联系的关系的集合构成一个关系数据库。同样,关系数据库也有型和值之分。型:关系数据库模式是对关系数据库的描述。值:一般就称为关系数据库。,2.3关系的完整性,关系模型的完整性规则是对关系的某种约束条件。关系模型的三类完整性:实体完整性参照完整性用户定义的完整性,其中实体完整性和参照完整性是关系模型必须满足的完整性约束条件,被称为是关系的两个不变性,应该由关系系统自动支持。一、实体完整性实体完整性规则(规则2.1):每一关系必有一主码,构成主码的各属性值均不能取空值。实体完整性规则规定基本关系的所有主码的各属性都不能取空值,而不仅是主码整体不能取空值。,例如学生选课关系“选修(学号,课程号,成绩)”中,“学号、课程号”为主码,则“学号”和“课程号”都不能取空值,而不是整体不为空。实体完整性可以引申一下,主码也不能取重复值。,有关实体完整性的说明:(1)实体完整性规则是针对基本关系而言的。一个基本表通常对应现实世界的一个实体集。(名字怎么来的)(2)现实世界中的实体是可区分的,即它们具有某种唯一性标识。(3)相应地,关系模型中以主码作为唯一标识。(4)主码中的属性即主属性不能取空值。所谓空值就是“不知道”或“不确定”的值。,二、参照完整性现实世界中的实体之间往往存在某种联系,在关系模型中实体及实体间的联系都是用关系来描述的。这样就自然存在着关系与关系之间的引用。引用的时候,必须取基本表中已经存在的值。由此引出参照的引用规则。参照完整性规则就是定义外码与主码之间的引用规则。,定义2.5设F是基本关系R的一个或一组属性,但不是关系R的码,如果F与基本关系S的主码Ks相对应,则称F是基本关系R的外码(Foreignkey),并称基本关系R为参照关系(Referencingrelation),基本关系S为被参照关系(Referencedrelation)或目标关系(Targetrelation)。关系R和S不一定是不同的关系。,参照完整性规则(规则2.2):若属性(或属性组)F是基本关系R的外码,它与基本关系S的主码Ks相对应(基本关系R和S不一定是不同的关系),则对于R中每个元组在F上的值必须为:或者取空值(F的每个属性值均为空值);或者等于S中某个元组的主码值。,例如,学生选课系统,选课关系的学号按实体完整性要求,不能为空;按参照完整性要求,只能选学生关系中的学号,表示语义关系“只有注册的学生才能选课”。课程号也类似(请同学们自己考虑)。,三、用户定义的完整性(User-definedintegrity)实体完整性和参照性适用于任何关系数据库系统。除此之外,不同的关系数据库系统根据其应用环境的不同,往往还需要一些特殊的约束条件。用户定义的完整性就是针对某一具体关系数据库的约束条件,它反映某一具体应用所涉及的数据必须满足的语义要求。关系模型应提供定义和检验这类完整性的机制,以便用统一的系统的方法处理它们,而不要由应用程序承担这一功能。,2.4关系代数,本节要求给定关系和关系代数表达式,要会算。给定关系模式和查询(语义)要求,要会写关系代数表达式。,关系代数是一种抽象的查询语言,用对关系的运算来表达查询,作为研究关系数据语言的数学工具。关系代数的运算对象是关系,运算结果亦为关系。关系代数用到的运算符包括四类:集合运算符、专门的关系运算符、算术比较符和逻辑运算符。,比较运算符和逻辑运算符是用来辅助专门的关系运算符进行操作的,所以关系代数的运算按运算符的不同,主要分为传统的集合运算和专门的关系运算两类。,2.4.1传统的集合运算,是四种二目运算:,把关系看作元组的集合,于是,这四种运算与传统集合运算类似。,其中,三种运算要求参与运算的两个关系R,S具有相同的目n,且相应属性取自同一个域。并:RSt|tRtS交:RSt|tRtS差:RSt|tRtS,广义笛卡尔积(Extendedcartesianproduct)元组连接的记号:R为n目关系,S为m目关系。trts称为元组的连接(Concatenation)。它是一个(n+m)列的元组,前n个分量为R中的一个n元组,后m个分量为S中的一个m元组。,两个分别为n目和m目的关系R和S的广义笛卡尔积是一个(n+m)列的元组的集合。元组的前n列是关系R的一个元组,后m列是关系S的一个元组。记作:RStrts|trRtsS若R有k1个元组,S有k2个元组,则关系R和关系S的广义笛卡尔积有k1k2个元组。,2.4.2专门的关系运算,一般包括选择、投影、连接和除。,1.选择选择又称为限制(Restriction)。它是在关系R中选择满足给定条件的诸元组,记作:F(R)=t|tRF(t)=真其中F表示选择条件,它是一个逻辑表达式,取逻辑值真或假。,逻辑表达式F的基本形式为:X1Y1X2Y2表示比较运算符,它可以是、或。X1、Y1等是属性名或常量或简单函数。属性名也可以用它的序号来代替。表示逻辑运算符,它可以是、或。因此选择运算实际上是从关系R中选取使逻辑表达式F为真的元组。这是从行的角度进行的运算。,设有一个学生-课程关系数据库,包括学生关系Student、课程关系Course和选修关系SC。(下面的例子都针对这三个关系进行运算。)例1查询信息系(IS系)全体学生Sdept=IS(Student)或4=IS(Student)例2查询年龄小于20岁的元组Sage20(Student)或420(Student)。,补充例1:查询信息系的年龄小于20岁的学生,补充例1:查询信息系的年龄小于20岁的学生Sdept=ISSage20(Student),补充例1:查询信息系的年龄小于20岁的学生Sdept=ISSage20(Student)当然也可以表示为Sdept=IS(Student)Sage20(Student)(注:双目运算符的优先级低于单目运算符),2.投影(Projection)先介绍与投影有关的两个记号:一.(元组属性分量记号)设关系模式为R(A1,A2,An)。它的一个关系设为R。tR表示t是R的一个元组。tAi则表示元组t中相应于属性Ai的一个分量。,二.(元组属性列分量记号)若A=Ai1,Ai2,Aik,其中Ai1,Ai2,Aik是A1,A2,An中的一部分,则A称为属性列或域列。A则表示A1,A2,An中去掉Ai1,Ai2,Aik后剩余的属性组。tA=(tAi1,tAi2,tAik)表示元组t在属性列A上诸分量的集合。,关系R上的投影是从R中选择出若干属性列组成新的关系。记作:A(R)=tA|tR其中A为R中的属性列。基本思想是从关系中消除某些属性,投影也可能消除掉某些行。因为取消了某些属性列后,就可能出现重复行,应取消这些完全相同的行。,例3查询学生关系Student在学生姓名和所在系两个属性上的投影Sname,Sdept(Student)或2,5(Student),例4查询学生关系Student中都有哪些系,即查询学生关系Student在所在系属性上的投影:Sdept(Student),补充例2:(投影与选择的混合运算)查询信息系学生的姓名和年龄。,补充例2:(投影与选择的混合运算)查询信息系学生的姓名和年龄。Sname,SageSdept=IS(Student)(注:单目运算为右结合),3.连接连接也称为连接。它是从两个关系的笛卡尔积中选取属性间满足一定条件的元组。记作:RS=trts|trRtsStrAtsBAB其中A和B分别为R和S上度数相等且可比的属性组。是比较运算符。连接运算从R和S的笛卡尔积RS中选取(R关系)在A属性组上的值与(S关系)在B属性组上值满足比较关系的元组。,连接运算中有两种最为重要也最为常用的连接,一种是等值连接(equi-join),另一种是自然连接(Naturaljoin)。为“”的连接运算称为等值连接(equi-join)。它是从关系R与S的笛卡尔积中选取A、B属性值相等的那些元组。自然连接(Naturaljoin)是一种特殊的等值连接,它要求两个关系中进行比较的分量必须是相同的属性组,并且要在结果中把重复的属性去掉。一般的连接操作是从行的角度进行运算。但自然连接还需要取消了重复列,所以是同时从行和列的角度进行运算。,连接的计算首先根据连接的类型(连接、自然连接),确定结果的属性。计算过程类似二重循环。如P50.图2.6(c)(d)(e),补充例3:求选了2号课程的学生的学号和姓名。,补充例3:求选了2号课程的学生的学号和姓名。Sno,SName(StudentCno=2SC),补充例4:求选修数据库原理的学生的学号和姓名。Sno,SName(StudentSCCname=数据库原理Course),注意:自然连接在没有相同的属性组时退化为广义笛卡儿集运算。,4.除()先介绍与除有关的记号:(象集记号)给定一个关系R(X,Y),X和Y为属性组。我们定义,当tX=x时,x在R中的象集(ImagesSet)为:Yx=tY|tR,tX=x它表示R中属性组X上值为x的诸元组在Y上分量的集合。,补充例5:象集的计算。设R(A,B)如下AB-1aa1ab2st1mm求B1,计算过程考察r的每一个元组t如果tA=1,则把tB放入结果。得如下:B-aaabmm,除的定义:给定关系R(X,Y)和S(Y,Z),其中X,Y,Z为属性组。R中的Y与S中的Y可以有不同的属性名,但必须出自相同的域集。R与S的除运算得到一个新的关系P(X),P是R中满足下列条件的元组在X属性列上的投影:元组在X上分量值x的象集Yx包含S在Y上投影的集合。记作:RS=tX|tRY(S)Yx其中Yx为x在R中的象集,x=tX。,书例6.(p62)分析:R的A相当于X,B和C相当于YS的B和C相当于Y,D相当于Z(与结果无关)。除的结果只有A一个属性。a1出现在R的第1,4,7行,所以象集为(b1,c2),(b2,c3),(b2,c1)而S在(B,C)上的投影为(b1,c2),(b2,c1),(b2,c3)a1的象集包含量S在(B,C)上的投影,所以a1出现在结果中,类似的,a2,a3,a4的象集均不包含S在(B,C)上的投影。所以它们不出现在结果中。,例7.(不用临时关系,改用完整表达式)Sno,Cno(SC)CnoCno=1Cno=3(SC)可以看出,除运算有“包含”的语义。对于同一个查询,关系代数表达式可能不唯一。,关系运算的第二种划分方法:5种基本运算和3种附加运算。交()的基本运算表达:RS=R-(R-S)RS=S-(S-R)RS=(R-(R-S)(S-(S-R),连接的表达:RS=F(RS)F,除的表达:RS=x(R)-x(x(R)y(S)-R),2.5关系演算,关系演算是以数理逻辑中的谓词演算为基础的。按谓词变元的不同,关系演算可分为元组关系演算和域关系演算。本节我们通过两个实际的关系演算语言来介绍关系演算的思想。本节内容仅要求了解。,2.5.1元组关系演算语言ALPHA(简单了解)元组关系演算以元组变量作为谓词变元的基本对象。一种典型的元组关系演算语言是E.F.Codd提出ALPHA语言,这一语言虽然没有实际实现,但关系数据库管理系统INGRES所用的QUEL语言是参照ALPHA语言研制的,与ALPHA十分类似。,ALPHA语言主要有GET、PUT、HOLD、UPDATE、DELETE、DROP六条语句,语句的基本格式是:操作语句工作空间名(表达式):操作条件,一、检索操作检索操作用GET语句实现。(1)简单检索(即不带条件的检索)例1查询所有被选修的课程号码。GETW(SC.Cno)注意与“查询所有的课程号码”的区别。GETW(Course.Cno),(2)限定的检索(即带条件的检索)例2GETW(Student.Sno,Student.Sage):Student.Sdept=ISStudent.Sage20,(3)带排序的检索例4查询计算机科学系(CS)学生的学号、年龄,结果按年降序排序。GETW(Student.Sno,Student.Sage):Student.Sdept=CSDOWNStudent.Sage,(4)带定额(指定结果数量)的检索例6查询信息系(IS)年龄最大的学生的学号及其年龄,结果按年龄降序排序。GETW(3)(Student.Sno,Student.Sage):Student.Sdept=ISDOWNStudent.Sage,(5)用元组变量的检索格式:RANGE表名变量名元组变量两个用处:1.简化关系名;2.操作条件中使用量词时必须使用元组变量。一般情况下,操作条件中如果用到了不出现在结果表达式中的表时,必须使用量词。例如,一般连接查询常用到存在量词。,例7查询信息系学生的名字RANGEStudentXGETW(X.Sname):X.Sdept=IS,(6)用存在量词的检索注意语义要求,“有一个”,“任意”等语义。例8查询选修2号课程的学生的名字RANGESCXGETW(Student.Sname):X(X.Sno=Student.SnoX.Cno=2)(理解:存在一条选课记录SC(即X),使得X是要求的学生Student所选的,且X的课程号是2),(7)带有多个关系的表达式的检索例:查询成绩在90分以上的学生名字与课程名字。RANGESCSCXGETW(Student.Sname,Course.Cname):SCX(Student.Sno=SCX.SnoCSX.Cno=Course.CnoCSX.Grade=90)(注:结果表达式中出现的表不需要存在量词),(8)用全称量词的检索例:不选1号课程的学生的姓名,类似上例:GETW(Student.Sname):SCX(Student.Sno=SCX.SnoSCS.Cno=1)(理解:要求的学生不存在1号课程的选课记录),也可改为全称量词:RANGESCSCXGETW(Student.Sname):SCX(Student.SnoSCX.SnoCS.Cno1)(理解:对于要求的学生,每一条选课记录要么不是他选的,要么不是选的1号课程),(9)用两种量词的检索根据语义分清使用全称和存在量词的条件。例13查询选修了全部课程的学生姓名RANGECourseCXRANGESCSCXGETW(Student.Sname):CXSCX(SCX.Sno=Student.SnoSCX.Cno=CX.Cno)(理解:要求的学生,对每一门课程都存在相应的选课记录。),(10)用蕴函(Implication)的检索例14:查询最少选修了95002号学生所选全部课程的学生的学号。P:学生95002选修了课程CX。q:学生Y也选了课程CX。转换为CX(p-q)的问题。,RANGECorseCXSCSCXSCSCYGETW(Student.Sno):CX(SCX(SCX.Sno=95002SCX.Cno=CX.Cno)-SCY(SCY.Sno=Student.SnoSCY.Cno=CX.Cno),(11)集函数二、更新操作(知道就可以)修改插入删除,2.5.2域关系演算语言QBE与MSFoxpro的RQBE没有什么联系。关系演算的另一种形式是域关系演算。域关系演算以元组变量的分量即域变量作为谓词变元的基本对象。QBE是QueryByExample(即通过例子进行查询)的简称,其最突出的特点是它的操作方式。它是一种高度非过程化的基于屏幕表格的查询语言,用户通过终端屏幕编辑程序以填写表格的方式构造查询要求,而查询结果也是以表格形式显示,因此非常直观,易学易用。,QBE中用示例元素来表示查询结果可能的例子,示例元素实质上就是域变量。QBE操作框架如书图2-9所示。检索操作(通过书上给出的例子适当理解)例1求信息系全体学生的姓名,例2查询全体学生的全部数据。,例4查询计算机系的年龄大于19岁的学生的学号。,方法一一行表示“与”,“与”的表示,方法二两行表示“与”(使用相同的示例元素),“或”的表示。,例5查询计算机科学系或年龄大于19岁的学生的学号。,连接的表示。(涉及参与连接的所有表)例7查询选修1号课程的学生的姓名。,例8查询未选修1号课程的学生的姓名。,自表连接的表示。例9查询有两个人以上选修的课程号。,二.更新操作(略),作业,本章习题5。(P80),
展开阅读全文