物理数据库设计数据库是存储在物理设备上的逻辑数据库设.ppt

上传人:za****8 文档编号:14159737 上传时间:2020-07-08 格式:PPT 页数:10 大小:383.32KB
返回 下载 相关 举报
物理数据库设计数据库是存储在物理设备上的逻辑数据库设.ppt_第1页
第1页 / 共10页
物理数据库设计数据库是存储在物理设备上的逻辑数据库设.ppt_第2页
第2页 / 共10页
物理数据库设计数据库是存储在物理设备上的逻辑数据库设.ppt_第3页
第3页 / 共10页
点击查看更多>>
资源描述
第八章 物理数据库设计 数据库是存储在物理设备上的。逻辑数据库设计工作完成后,需 要为逻辑数据模型选择适合应用环境的物理结构,即存储结构与 存取方法。这个选择工作就是数据库的物理设计。由于物理结构 依赖于给定的DBMS和和硬件系统,因此设计人员必须了解所用的 DBMS的内部特征,特别是存储结构和存取方法;了解应用环境, 特别是应用的处理频率和响应时间要求;以及了解外存设备特性。 数据库物理设计的任务是对给定的逻辑数据模型选取适合应用环 境的物理结构,即在逻辑设计的基础上,为每个关系模式选择合 适的存储结构和存取方法,使数据库的事务能够高效率地运行。 许多关系数据库大量地屏蔽了内部物理结构,留给用户参与设计 的余地不多。一般的RDBMS留给用户参与物理设计的内容大致是 索引、聚集和分区的设计。 物理数据库设计阶段的设计过程主要包括以下三方面工作: (1)分析影响物理数据库设计的因素; (2)为关系模式选择存取方法; (3)设计关系、索引等数据库文件的物理存储结构。,H,第一节 影响物理数据库设计的因素 有许多物理数据库设计策略,选择原则是事务响应时间最 小、存储空间复杂性最小和事务吞吐率最大。 选择存取方法需要考虑以下影响事务效率的因素: 与数据库查询事务有关的因素 : 查询的关系; 查询条件所涉及的属性; 连接条件所涉及的属性; 查询的投影属性。 与数据库更新事务有关的因素: 被更新的关系; 每个关系更新操作的类型; 删除和修改操作条件所涉及的属性; 修改操作要改变的属性值。 每个事务在各个关系上运行的频率和时间约束。 由于在物理数据库设计阶段并不知道全部的数据库事务, 故上述信息不完全,所设计的物理数据库随着新事务的提 出要作适当的修改。,H1,第二节 为关系模式选择存取方法 存取方法是为存储在物理设备上数据提供快速存储和检索的能力。 有三类常用方法: (1)索引方法: 第九章介绍。 (2)HASH方法:第九章介绍。 (3)聚集方法: 这种方法对经常进行连接操作的若干个关系作专门的 存储。连接属性称为聚集键。这些关系具有相同聚集 键值的记录被物理地存储在一起。这种存储分布降低 了连接操作的访问磁盘次数。每个关系至多只能参与 一个聚集,但一个物理数据库可有多个聚集。 存取方法的选择实际上是下面的优化问题: 设Ti是在逻辑数据库上运行的事务集合, fi是各事务频率的集合; Cost()表示事务的运行开销,例如磁盘存取块数。 优化问题:为每个涉及的关系选择一个和数个存取方法, 最小化Cost=fi Cost(Ti),H2,一.索引存取方法的选择 索引设计是数据库物理设计的基本问题。有效的索引选择将提高 对数据库的存取效率。索引建立在关系的属性上,用于常用的查 询中。各种索引方法在第九章详述。这里介绍一个确定索引配置 方案的启发式算法: 首先根据前述的设计因素,用下边的策略确定候选索引: 若一个(或一组)属性经常出现在选择或连接操作的条件, 或作为投影属性使用,则可在这个(这组)属性上建立索引; 若一个属性经常作为最大值和最小值等聚集函数的参数, 可考虑在这个属性上建立索引。 然后,对每一个关系确定是否建立索引。若建立索引,要确定建 立多少个索引,这样就形成一个索引配置方案。计算每一个索 引配置方案对应的系统代价,即各事务运行开销的总和。 对多个方案的系统运行代价进行比较,从中选出最佳方案。,H21,二.HASH存取方法的选择 各种HASH方法在第九章详述 。 有些DBMS提供了HASH存取方法。 HASH方法的查询原理是按数据记录某些属性(称为HASH域)的 值用某种算法算出数据记录的存放地址。 选择HASH存取方法的规则是: 若一个关系的某属性子集经常出现在等值连接操作或等值比较 选择操作的条件中,而且满足下面两个条件之一,则可选择此法 如果关系的大小可以预知并且不变; 如果关系的大小动态改变,但DBMS提供了动态HASH存取方法. 例如,若两个关系经常进行同名属性A上的自然连接操作,并且都 在A上建立了HASH存取结构。则由于两关系在A等值的记录存放 在相同的地址,故连接操作的磁盘动作次数较少,响应较快。,H22,三.聚集存取方法的选择 第一步 确定聚集关系组。 用以下规则确定候选聚集关系组: 对于经常相互连接的关系组、经常相等比较的单个关系、 在某属性(子集)上重复率高的单个关系,可考虑作为聚集 关系组。 取消候选聚集关系组中不必要的关系: 把候选组内满足下列条件之一的关系除去: (1)经常进行全关系扫描; (2)更新操作频繁于连接操作。 第二步 确定优化的聚集方案。 不同的候选组可能相交,即有共同的关系,但每个关系至多 只能属于一个聚集组,故需制定多个聚集方案,在每个方案 中,每个关系最多只属于一个聚集组。然后对多个聚集方案 进行优选,选择出操作代价最低的聚集方案。,H23,第三节 物理存储结构的设计 物理存储结构的设计的目的是确定关系、索引、聚集等 数据库对象的存储结构,使空间利用率最大且操作开销 最小。不同的DBMS有不同的存储结构设计方法。下边 简单介绍ORACLE数据库管理系统的设计方法。具体技 术细节可阅读各版本的详细说明。,H3,0. ORACLE管理磁盘空间的方法 1. 物理存储块的设计 2. 数据域和数据段的设计,物理数据块,物理数据块,(连续)数据域,含n个物理数据块,物理数据块,物理数据块,数据段(与数据库对象相对应),数据库分区,文件,文件,数据库分区,物理数据库,物理存储记录是元组及存储信息. 数据库对象存储结构设计主要是 数据段,数据域,数据块参数选择,存储记录 用户数据 管理信息 存储记录 用户数据 管理信息,存储记录 用户数据 管理信息 存储记录 用户数据 管理信息,存储记录 用户数据 管理信息 存储记录 用户数据 管理信息,存储记录 用户数据 管理信息 存储记录 用户数据 管理信息,H30,ORACLE管理磁盘空间的方法,数据段(与数据库对象相对应),数据段(与数据库对象相对应),(连续)数据域,含m个物理数据块,文件由OS管理, 文件中的数据由oracle管理,在PCTfree较小或PCTused较大的情况下,有下面的性能: 块空间利用率高,关系占用块少,有利于提高整体扫描速度; 记录的扩展容易引起元组的跨块,导致访问速度低。 这种情况适合于主要操作是查询而不是更新的关系。,H31,物理存储块的设计 这个环节的设计主要是合理地确定下边两个参数的值: (1)pctfree是数据块内为存储记录的扩展而预留的空间百分比。 当块内自由空间百分比大于此值时, 块内记录可以扩展,否则不能扩展。 (2)pctused是数据块内数据量不得低于的百分比。 当块内已用空间百分比小于此值时,块加入自由链, 可以对块注入新记录,否则不可以。 两个参数的关系是:PCTused+PCTfree1,已用空间 百分比,100,0,A,B,记录可增加,pctused,记录可扩展,pctfree,X,域,数据域和数据段的设计 设计工作主要是确定下边下列参数: initial:_extent:段内第一个数据域的容量; nest_ extent : 段内第二个数据域的容量; min_ extent : 段内开始时数据域的数目; pctincrease : 段内从第三个域起容量增长的百分比。 当建立一个关系、索引、聚集等数据库对象时,首先分配 min_exetent个数据域,当存储的数据量不断增多时,系统 动态地为这个对象的数据段增添更多的数据域,这个过程 称为数据段的动态扩展。 为了提高系统效率,需要减少数据段的动态扩展,方法是: 估计数据库对象的初始容量并分配足够大的初始存储空间; 建立数据库对象时,选择适当的参数值为每个数据域分配 足够大的容量。,块,H32,块,块,块,域,块,块,块,块,域,块,块,块,块,数据段,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!