甲骨文《数据仓库概念》28页.ppt

上传人:zhu****ei 文档编号:3453710 上传时间:2019-12-15 格式:PPT 页数:28 大小:673.50KB
返回 下载 相关 举报
甲骨文《数据仓库概念》28页.ppt_第1页
第1页 / 共28页
甲骨文《数据仓库概念》28页.ppt_第2页
第2页 / 共28页
甲骨文《数据仓库概念》28页.ppt_第3页
第3页 / 共28页
点击查看更多>>
资源描述
,XuXin,PresalesConsultantOracle(China)Co.,Ltd.,数据仓库的概念,Whatis.,数据仓库(DataWarehouse)/数据集市(DataMart)决策支持系统(DecisionSupportSystem)联机分析处理(OLAP)/ROLAP/MOLAP元数据(MetaData)分析指标(Measure)/维(Dimension)星型模型(StarSchema)/雪花模型(SnowSchema)数据钻入/数据钻出(DrillDown/DrillUp)表旋转(TableRotation)数据挖掘(DataMining),数据仓库几大功能,Query/ReportDrillup/DrillDownCompareExceptionForcast,WhatifDataMining,数据仓库实施方法,建立数据仓库需要考虑的因素,扩展性灵活性集成性可靠性,数据仓库专家的建议,需要业务人员的积极参与通过原型设计验证需求确定数据仓库的范围,不要试图Warehouse所有数据为不同需求选择合适工具控制风险利用外部Consultant的经验重点放在不同系统的集成,建立数据仓库举例,UseaBuildingEstateOLTPdatabaseasanexampletoillustratetheconceptsandhowtobuildasuccessfulDataWarehousewhichusedtocheckandforecasttherentalrateandsellamountinHongKong.,步骤1:确定数据仓库的问题范围,列出4月份香港地区每日房屋销售情况找出销售额大于4百万的居民住宅项目比较Whampoo和Kornhill地区上月销售情况找出售屋数量最多的前3个地区截止到当月的累计销售数量用图表反映最佳销售模式时间序列分析,确定数据仓库的问题范围,确定业务需求和用户需求:用户查询执行的频度系统保留数据的年限用户主要希望从哪些角度,哪些层次分析数据数据源是哪些系统,步骤2:选择合适的软硬件平台,可靠的供应商数据建模和管理工具易用性开放集中管理性能并行处理,选择数据库平台的依据:,前3位的考虑因素:易用性92.4%集中管理65.2%可靠的供应商65.2%,数据仓库的考虑因素,(Source:DataWarehouseInstitute-February96),MOLAP还是ROLAP?,ROLAP和MOLAP的功能区别,TransactionSystems,DecisionSupportSystems,Strategic,Tactical,MDB,RDBMS,DataCache,linkage,步骤3:根据需要创建新的实体,#Code_no,No_of_transaction,Constructor_ID,Developer_ID,Buildingdate,Purchasedate,Purchaseprice,Address,Area,Apartment,#Code_no,#Transaction_no,Name/Company,HKID,ContactPhone#,ContactAddress,PurchaseDate,PurchasePrice,Owner,#Code_no,#Flat,#Transaction_no,Name,HKID,Occupy_type(P,R),ContactPhone#,ContactAddress,Date,Price,Occupant,Contractor_ID,CompanyName,Address,ContactPhone#,Constructor,#Code_no,#Flat,No_of_trans,Type,Floor,Area(Building),Area(Actual),FlatDetails,Developer_ID,CompanyName,Address,ContactPhone#,Developer,Day,Month,Quarter,Year,Time,Territory,District,Region,Building/Estate,Geographic,Location,Type,Size,Area,HousingTypes,步骤4:确定维表删除不必要的表,步骤5:建立层次结构,Date,1-Jan-94,13-Jun-95,12-Jan-96,12-Apr-96,15-Apr-96,20-Oct-96,20-Oct-96,12-Dec-96,1-Jan-97,31-Mar-97,15-Apr-97,?.,Time,Year,Quarter,Month,Day,TimeHierarchy,步骤6:确定属性,TypeSizeAreaClass:AttributesofHousingType,HousingType,Occupant,HousingTypedimensionlookuptable,Attributes,步骤7:建立FactTable,确定合适的粒度,Time,Location,Type,Area,OccupantName,PurchasePrice,Rent,?.,SalesFactTable,步骤8:建立数据仓库模型,BuildingEstateOLTPEnvironment,TimeLocationTypeAreaOccupantNamePurchasePriceRent?.,SalesFactTable,DayMonthQuarterYear,Time,TerritoryDistrictRegionBuilding/Estate,GeographicLocation,TypeSizeArea,HousingTypes,#Code_noNo_of_transactionConstructor_IDDeveloper_IDBuildingdatePurchasedatePurchasepriceAddressArea,Apartment,#Code_no#Transaction_noName/CompanyHKIDContactPhone#ContactAddressPurchaseDatePurchasePrice,Owner,#Code_no#Flat#Transaction_noNameHKIDOccupy_type(P,R)ContactPhone#ContactAddressDatePrice,Occupant,Contractor_IDCompanyNameAddressContactPhone#,Constructor,#Code_no#FlatNo_of_transHousingTypeFloorArea(Building)Area(Actual),FlatDetails,Developer_IDCompanyNameAddressContactPhone#,Developer,Transform,BuildingEstateDataWarehouseOLAPEnvironment,步骤9:数据仓库模型优化,TimeLocationTypeAreaOccupantNamePurchasePriceRent?.,SalesFactTable,TypeSizeArea,HousingTypes,TimeLocationTypeAreaOccupantNamePurchasePriceRent?.,SalesFactTable,DayMonthQuarterYear,Time,TerritoryDistrictRegionBuilding/Estate,GeographicLocation,TypeSizeArea,HousingTypes,Starschema,Snowflakeschema,数据仓库设计优化的原则,避免数据实时汇总(建立汇总表)减少表连接操作(不要超过3-5个)用IDcode作关键字减少I/O竞争利用分区技术提高性能和可管理性,估算数据仓库容量的算法,Estimatedsizeofdatabase=98*96*20*1000*0.75=141.12Mb,步骤10:从业务系统中抽取数据到数据仓库,数据抽取的要求:可访问各种数据源可满足时间要求可满足数据转换要求可检测源系统中数据的变化,步骤11:开发前端应用,步骤12:数据仓库的管理,安全管理备份和恢复高可用性数据时效,
展开阅读全文
相关资源
相关搜索

当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!