商务智能题库整理

上传人:lis****210 文档编号:203460106 上传时间:2023-04-24 格式:DOCX 页数:18 大小:103.35KB
返回 下载 相关 举报
商务智能题库整理_第1页
第1页 / 共18页
商务智能题库整理_第2页
第2页 / 共18页
商务智能题库整理_第3页
第3页 / 共18页
点击查看更多>>
资源描述
商务智能-复习提纲一选择题(第一次作业)1数据仓库是随着时间变化的,下面的描述不正确的是AA. 数据仓库随时间变化不断删去旧的数据内容B. 捕捉到的新数据会覆盖原来的数据C. 数据仓库随时间的变化不断增加新的数据内容D. 数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断地进行 重新综合2. OLAP在辅助决策时,基于用户建立的一系列假设驱动,通过OLAP来证实或 者推翻这些假设是个()的过程CA集成B转换C演绎D归纳3. 不同操作型系统之间的数据一般是相互独立、异构的。而数据仓库中的数据是 对分散的数据进行抽取、清理、转换和汇总后得到的,这样就保证了数据仓库的 数据关于整个企业的()DA时变性B非易失性C差异性D 一致性4. 如 下 图 所 示 操 作 是 OLAP 分 析 的 哪 种 操 作 ( D城市北京A 切片252732232$393450;4-13837294035上陣B 旋转C 下钻D 上钻5. 数据立方体中的数据单元格是一个数值函数,该函数可以对数据立方体求值,如下哪个函数可以用来对数据立方体进行度量( )CAsubstring()Brand()Csum()Dtrunc()6关于数据仓库数据的时变性,如下描述不正确的是DA 操作型系统存储的是当前数据,而数据仓库中的数据是历史数据B 数据仓库中的数据是按照时间顺序追加的,它们都带有时间属性C 数据仓库的数据时限一般要远远长于操作型数据的数据时限D 数据仓库对响应时间要求不严格,处理时间从几秒到几分钟,有时甚至几小时7. 数据仓库是面向主题的,逻辑意义上每一个商业主题都对应与企业决策包含的分析对象,一家保险公司的数据仓库的主题可能包含哪些 BA 顾客储蓄账B 顾客、账户、索赔C 顾客保险金额D 顾客账单8. 假如警察要得到某犯罪嫌疑人在指定时间段的通话记录最有可能在( C ) 系统中获得A 决策支持系统B 电信营业账务系统C 电信数据仓库系统D 元数据管理系统9下面关于数据粒度的描述不正确的是BA 数据综合度越高,粒度也就越大,级别也就越高B 数据越详细,粒度就越小,级别也就越高C 粒度是指数据仓库小数据单元的详细程度和级别D 粒度的具体划分将直接影响数据仓库中的数据量以及查询质量10. 数据仓库并非只是数据的简单累积,而是要经过一系列的处理过程,即 ETL,ETL 过程包括哪些 CA 数据操作、数据挖掘、数据转义B 数据存储、数据维护、数据分析C 数据抽取、数据转换、数据装载D 数据定义、数据建模、数据管理11. 企业要建立预测模型,需准备建模数据集,以下四条描述建模数据集正确的 AA 尽可能多的适合的数据B 得分集数据是建模集数据的一部分C 数据越多越好D 以上三条都正确12关于基本数据的元数据是指DA 基本元数据与数据源、数据仓库、数据集市和应用程序等结构相关的信息B 基本元数据包括日志文件和简历执行处理的时序调度信息C 基本元数据包括与企业相关的管理方面的数据和信息D 基本元数据包括关于装载和更新处理,分析处理以及管理方面的信息13数据立方体中的数据单元格中的数据可以通过如下哪些函数获得? AA 分布聚集函数 count()、sum()、min()、max()和代数聚集函数 avg()、stddev()B 分析函数C 分布聚集函数 count()、sum()、min()、max()D 聚集函数 avg()、stddev()14关于OLAP和OLTP的说法,下列不正确的是BA . OLTP以应用为核心,是应用驱动的BOLAP 事务量大,但事务内容比较简单且重复率高COLAP的最终数据来源与OLTP不一样DOLTP面对的是决策人员和高层管理人员15. 数据挖掘是通过( )的方式在海量数据中主动找寻模型,自动发掘隐藏在数据中的价值信息,OLAP分析结果为挖掘提供分析依据。CA 演绎B 集成C 归纳D 转换16. 数据仓库的逻辑模型雪花模型是星型模型的扩展,某些维表中的数据可以进一步分解到附加的表中, 其操作原理是( )CA. 减小数据粒度B便于数据集成C减少冗余,节省存储空间D.定义外键约束,方便数据操作17有关数据仓库的开发特点,不正确的描述是CA. 数据仓库的开发是一个不断循环的过程,是启发式的开发B. 在数据仓库环境中,并不存在操作型环境中所固定的和较确切的处理流,数据仓 库中数据C. 数据仓库开发要从数据出发D. 数据仓库使用的需求在开发初期就要明确18.()技术可用于数据挖掘过程展示、数据挖掘结果展示CA. 数据仓库B. ETLC可视化D数据挖掘19关于OLAP的特性,下面正确的是()快速性可分析性(3)多维性共享性DA. (3) (4)B. (2) (3) (4)C. (1) (2) (3) (4)D. (1) (2) (3)20.OLAP技术的核心是AA. 多维分析B在线性C. 互操作性D用户的快速响应21如下图所示数据仓库的逻辑模型是? B时间维轰时间_k&y季度月周部门维表部门_key ? 部门茗称 邂n类别/时间.k砒 鲫节_k“ 部门_ky 地区_k砒计量卑俭销售事窑表细节维更广细节_k、细节名品牌商品类型(供应商_k&y/转应商维先供应商_key 1商列-|_地区維恚地区key国彖省(或州)iiA. 星型模型B. 雪花模型C. 衍生模型D. 星系模型 22.数据立方体中的数据单元格和坐标分别被称为( )BA. 维,角度B. 度量,维C. 数据,多维数据D. 事实,取值二判断题T1.星型模型的核心是事实表,事实表把各种不同的维表连接起来F2决策是在充分的信息和知识基础上的判断,因此决策是没有风险的。T3数据仓库主要有面向主题、集成性、数据的非易失性、数据的时变性等特征。T4企业的数据处理大致分为两类,一类是从操作型处理,也称做联机事务处理, 另一类是分析型处理,一般针对某些主题的历史数据进行分析,支持管理决 策。T5在线分析处理比较常用的操作包括对多维数据的切片与切块、上钻与下钻以 及旋转等。T6业务系统一般存储细粒度的事务型数据,而数据仓库中的数据是用于查询、分 析,因此需要多种不同粒度的数据,这些不同粒度的数据可以通过对细粒度的 事务型数据进行聚合而产生。F7数据仓库只是数据的简单积累,不需要抽取、转换和装载的过程,即可完成数 据仓库数据的组装T8元数据是关于数据的数据,主要包括数据源的描述、数据的抽取规则、数据的 转换规则、数据加载频率、数据仓库模型等F9数据仓库的数据为历史数据,从来不需要更新F10数据仓库的数据量越大,其应用价值也越大T11 数据仓库是面向主题的、集成的、稳定的、随时间变化的数据集合,用以支 持管理决策的过程F12.OLAP 是用来协助企业对响应事件或事务的日常商务活动进行处理F13 数据仓库的维度建模方式与关系数据库的实体-关系建模无关纟维度分析撇开 原有的关系模型,单独构建事实表和维表。T14 对于企业而言,由于不同用户提供的数据可能来自不同的数据源擞据内容、 数据格式和质量千差万别,数据的准确性、真实性和完整性都不同,实施数 据共享和数据分析就需要对数据进行整合,有效的数据集成就显得十分重要F15数据立方体由3维构成,Z轴表示事实数据T16 数据是记录、描述和识别事物的符号,信息是经过某种提炼、加工和集成后 的数据。知识是对信息内容进行提炼、比较、挖掘、分析、概括、判断和推 论。T17数据仓库中的数据的装载方式分为初始装载、增量装载、完全刷新这几种方 式T18 商业智能系统与一般交易系统之间在系统设计上的主要区别在于:后者把结 构强加于商务之上,一旦系统设计完毕,其程序和规则不会轻易改变;而前 者则是一个学习型系统,能自动适应商务不断变化的要求F19 数据仓库“粒度”越细,记录数越少F20数据仓库的数据量越大,其应用价值也越大T21 商务智能指收集、转换、分析和发布数据的过程,目的是为了更好的决策F22数据仓库中间层OLAP服务器只能采用关系型OLAPT23数据仓库中事实表所指的事实数据指的是不同维度在某一取值下的度量。F24 数据是商务智能系统的基础,只能包括企业内部数据,内部数据包括企业各 种应用系统、办公自动化等产生的业务数据、文档等。F25.OLAP 是用来协助企业对响应事件或事务的日常商务活动进行处理T26 维是人们观察数据的特定角度,是考虑问题时的一类属性一 选择题(第二次作业)1.某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属 于数据挖掘的哪类问题? BA. 聚类B关联规则发现C.分类D自然语言处理2将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务CA. 数据流挖掘B. 频繁模式挖掘C. 数据预处理D. 分类和预测3评价一个数据挖掘项目的成败,主要看数据挖掘的结果是否解决了 CA. 部署问题B. 建模问题C. 业务问题D数据问题4如下缺陷记录表,条件项i2,结果项i3,i5的支持度,置信度是A缺陷记录产品编号缺陷il缺陷i2缺陷13缺陷i4缺陷15缺陷i61005ili52028Lli2i63032ili2i6413512i3i55169617812i3i57226ili2i3i5i68270i3i4i69369ili2i61039012i31511433il1412521Ll12i6A. 33.3%,50%B. 41.7%,100%C. 41.7%,83.4%D. 33.3%,71.53%5设X=1, 2,3是频繁项集,则可由X产生个关联规则BB. 6C. 5D. 46下面哪种不属于数据预处理的方法? BA. 离散化B. 估计遗漏值C. 变量代换D聚集7. 如图统计数据其中 a1a6 是对象 Jack、Mary 和 Tim 的属性,都为非对称二元变量,他们之间的距离用Jaccard系数计算分别为AA. d(Jack,Mary) =1/3,d(Jack,Tim)=2/3,d(Mary,Tim)=3/4B. d(Jack,Mary) =1/3,d(Jack,Tim)=1/3,d(Mary,Tim)=3/5C. d(Jack,Mary) =1/4,d(Jack,Tim)=2/5,d(Mary,Tim)=3/5D. d(Jack,Mary) =1/6,d(Jack,Tim)=1/3,d(Mary,Tim)=1/28. 假设从潜在的顾客群中抽取一定数量的样本进行市场推广,发现有30%的响应 者,而利用分类模型挑选同样数量的潜在客户进行推广,有65%的响应者,那 么此分类模型的提升度为BA.lift65%+30%= 95%B.lift =65%/30% =2.17C.lift =65%-30% =35%D.lift = 30%/65% = 0.469. 若关联规则 U-V 的支持度和置信度分别大于或等于用户指定的最小支持度min support和最小置信度min co nfide nee,则称关联规则U- V为CA. 弱关联规则B. 多层次关联规则C. 强关联规则D. 分离关联规则10. Hadoop重要的基础是? DA. 非关系型数据库B. Hive数据仓库C. ETL工具D. MapReduce编程框架和分布式文件系统HDFS12. K均值类别侦测要求输入的数据类型必须是AA. 数值型B. 逻辑型C. 整型D字符型13. ( )是一个观测值,它与其他观测值的差别如此之大,以至于怀疑它是由不 同的机制产生的DA. 质心B核心点C.边界点D离群点14. 当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离? BA. 关联分析B. 聚类C. 隐马尔可夫链D分类15. 通过引进表示样本间相似程度的度量标准把性质相似的对象归为一类,这些 度量标准称为聚类统计量,最常用的聚类统计量可分为( )和相似系数等, 这些统计量处理数值型数据比较有效DA. 无偏估计B概率C.置信度D距离16. 下面选项中 t 不是 s 的子序列的是 BA. s=t=B. s=t=C. s=t=D. s=t=17只有非零值才重要的二元属性被称作DA. 计数属性B. 对称属性C. 离散属性D. 非对称的二元属性18在完成了构造和评价一个回归模型后,可以AA.以给定的自变量的值估计因变量的值B. 估计未来所需样本的容量C. 以给定的因变量的值估计自变量的值D计算相关系数和判定系数19.Apriori 算法的最基本思想是找出所有的频繁项集,然后由频繁项集产生强关联规则,这些规则必须满足BA. 提升度大于1B. 最小支持度和最小置信度C. 置信度大于90%D. 支持度大于25%二判断题F1.离散属性总是具有有限个值T2置信度反映了关联规则的正确程度,即购买了项集U中的商品的顾客同时也购买了 V 中商品的可能性(条件概率)有多大T3频繁项集的任何子集也一定是频繁的,非频繁项集的超集一定是非频繁的T4.没有高质量的数据,就没有高质量的挖掘结果F5.Bayes 法是一种在已知后验概率与类条件概率的情况下的模式分类方法,待分样本的分类结果取决于各类域中样本的全体F6聚类(clustering)是这样的过程:它找出描述并区分数据类或概念的模型(或函数),以便能够使用模型预测类标记未知的对象类F7关联规则挖掘过程是发现满足最小支持度的所有项集代表的规则T8离群点可以是合法的数据对象或者值T9数据挖掘的目标不在于数据采集策略,而在于对于已经存在的数据进行模式的发掘F10决策树方法特别适合于处理数值型数据F11 回归分析通常用于挖掘关联规则F12 在聚类分析当中,簇内的相似性越大,簇间的差别越大,聚类的效果就越差T13 商业智能系统与一般交易系统之间在系统设计上的主要区别在于:后者把结构强加于商务之上,一旦系统设计完毕,其程序和规则不会轻易改变;而前者 则是一个学习型系统,能自动适应商务不断变化的要求T14序列模式挖掘是从序列数据库中发现事件之间在时序上的规律T15数据挖掘的主要任务是从数据中发现潜在的规则,从而能更好的完成描述数 据、预测数据等任务T16 分类和回归都可用于预测,分类的输出是离散的类别值,而回归的输出是连 续数值F17 离群点在数据挖掘时总是被视为异常、无用数据而丢弃F18.Web 数据挖掘是通过数据库中的一些属性来预测另一个属性,它在验证用户提出的假设过程中提取信息F19 决策树方法通常用于关联规则挖掘
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸设计 > 毕设全套


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!