2020智慧树知到《大数据算法》章节测试答案

上传人:lis****211 文档编号:116738124 上传时间:2022-07-06 格式:DOCX 页数:21 大小:30.33KB
返回 下载 相关 举报
2020智慧树知到《大数据算法》章节测试答案_第1页
第1页 / 共21页
2020智慧树知到《大数据算法》章节测试答案_第2页
第2页 / 共21页
2020智慧树知到《大数据算法》章节测试答案_第3页
第3页 / 共21页
点击查看更多>>
资源描述
智慧树知到大数据算法章节测试答案1.11. 以下关于大数据的特点,叙述错误的是()。答案:速度慢A、速度慢B、多元、异构C、数据规模大D、基于高度分析的新价值2. 在法华经中,“那由他”描写的“大”的数量级是()。答案:10八28A、10八7B、14C、10八28D、10八563. 以下选项中,大数据涉及的领域中包括()。答案:社交网络计算机艺术医疗数据A、社交网络B、医疗数据C、计算机艺术D、医疗数据4. 大数据的应用包括()。答案:推荐科学研究预测商业情报分析A、预测B、推荐C、商业情报分析D、科学研究5. 目前,关于大数据已有公认的确定定义。x6. 大数据种类繁多,在编码方式、数据格式、应用特征等方面都存在差异。()V1.21.大数据求解计算问题过程的第三步一般是()。答案:算法设计与分析A、判断可计算否B、判断能行可计算否C、算法设计与分析D、用计算机语言实现算法2. 在大数据求解计算问题中,判断是否为能行可计算的因素包括()。答案:资源约束数据量时 间约束A、数据量B、资源约束C、速度约束D、时间约束3. 大数据求解计算问题过程的第一步是确定该问题是否可计算。V4. 大数据计算模型与一般小规模计算模型一样,都使用的是图灵机模型。V1.31. 资源约束包括()。答案:网络带宽外存CPU内存A、CPUB、网络带宽C、内存D、外存2. 大数据算法可以不是()。答案:精确算法串行算法内存算法A、云计算B、精确算法C、内存算法D、串行算法3. 大数据算法是在给定的时间约束下,以大数据为输入,在给定资源约束内可以生成满足给定 约束结果的算法。x4. MapReduce是一种比较好实现大数据算法的编程架构,在生产中得到广泛应用。V5. 大数据算法是仅在电子计算机上运行的算法。x1.41.众包算法是用来解决()。答案:计算机计算能力不足或知识不足,需要人来帮忙A、访问全部数据时间过长B、数据难于放入内存计算C、单个计算机难以保存全部数据,计算需要整体数据D、计算机计算能力不足或知识不足,需要人来帮忙2. 大数据算法存在很多难题,对于访问全部数据时间过长的问题,采用的解决方案是()。答案: 读取部分数据A、将数据存储到磁盘上B、仅基于少量数据进行计算C、读取部分数据D、并行处理3. 大数据算法的()特点,使其与大数据算法密切相关的。答案:速度快数据量大A、数据量大B、基于高度分析的新价值C、速度快D、多样性、复杂性4. 为解决单个计算机难以保存全部数据的问题,通常会采用并行处理的技术,此技术会涉及到 时间亚线性算法。x1.51. 大数据算法涉及到外存的时候,通常要分析()。答案:IO复杂性A、时间空间复杂性B、IO复杂性C、结果质量D、通讯复杂性2. 下列选项中,属于智能仿生算法的是()。答案:遗传算法模拟退火算法A、遗传算法B、近似算法C、模拟退火算法D、数据流算法3. 在线算法/数据流算法是面向大数据速度快的特点提出的。()V4. 对于数据流算法或在线算法,经常要分析结果的近似比。()x5. 随机算法是利用随机化的方法来进行大数据处理,是大数据算法设计技术之一()V2.11. 计算在一个给定社交网络中平均每人的朋友个数,在不访问所有顶点的情况下,进行精确计 算最少需要访问()个顶点。答案:n-1AB、n + 1C、2nD、n-12. 亚线性是指()等的消耗是输入规模0。()答案:空间通讯时间IOA、时间B、空间C、IOD、通讯3. 性质检测算法属于亚线性空间算法的一类。(片2.21.在经典的水库抽样中,要求空间复杂性为O(k),是指与抽样大小有关,而与整个数据的数据量 无关。V2. 水库抽样算法的采样是均匀的。V2.31.以下()不是衡量分析近似解代价与优化解代价差距的方法。答案:绝对误差A、RatioBoundB、相对误差C、绝对误差D、(1-)-近似2. 利用平面图的直径近似算法得到的解,在最坏情况下,也不会小于最优解的()。答案:二分之一A、二分之一B、三分之一C、四分之一D、十分之一3. 采用平面图的直径近似算法的动机是无法在要求的时间内得到()。答案:精确解A、相似解B、完整解C、精确解D、近似解4. 在平面图的直径近似算法中,要求点之间的距离满足三角不等式是指在i、j、k三个点中,i到j的距离加上j到k的距离小于i到k的距离。x5. 近似算法能给出一个优化问题的优化解。x6. RatioBound越大,则近似解越坏。()V2.41.在判定问题的近似中,对于近似解需要区分的是()。答案:差得很远是A、是B、否C、差不离D、差得很远2. 全0数组判定的近似算法的证据引理是:如果一次测试以大于等于p的概率获得一个证据, 那么s=2/p轮测试得到证据的概率大于等于1/2ox3. 判定问题的近似解是指:输入满足某种性质或近似满足某种性质。x 3.11.Zipf原则是指典型的频率分布是高度偏斜的,存在很多频繁元素。()x2. 在数据流模型中,从数据流中可以计算简单的函数,如最大值、最小值、求和等,且处理这些 函数时通常使用单个寄存器so()V3. 数据流模型中,数据流是指来自某个域中的元素序列。()V4. 在数据流模型中,内存远远大于数据的规模。()x3.21.频繁元素计算算法又称为()算法。答案:MGA、MMB、MGC、GMD、MP2. 频繁元素计算算法有效的原因是源于()。答案:Zipf原则A、取近似解B、证据引理C、错误界限和k成反比D、Zipf原则3. 在频繁元素计算算法中,计数器x减少的次数依赖于有几个减少计数器的步骤。()V4. 在频繁元素计算算法中,当数据流中元素的总个数远大于估计值与真实值相差的最多值时, 可以得到频繁项一个好的估计。V3.31.时间亚线性算法的思想是:利用特定子图联通分量的数量估计最小生成树的()。答案:权重A、近似值B、精确值C、权重D、界限2. 求最小生成树是一个贪心法,可以用()算法来解决。答案:PrimeA、PrimeB、并行C、MGD、内存3. 对联通分量个数的估计可以利用随机化方法。V3.41.对于输入n个数的数组(x1,x2,x3,xn),输出:这个数组是否有序。远离意味着必须删除大于()个元素才能保证剩下的元素有序。答案:nA、-nB、nC、/nD、n/2. 如果一次测试以大于等于p的概率获得一个证据,那么s=2/p轮测试得到证据的概率大于 等于3/4。乂3. 关于证明如果输入远离有序,则存在大于n个“坏索引”的问题,可以采用证明其逆否命题 的方法。V4.11.下列选项中叙述正确的是()。DA、磁盘的访问可以随机读、随机取B、磁盘系统传输大规模连续的数据块的范围是18-32kC、磁盘访问比主存访问的速度快D、大多数程序在RAM模型上运行2. 对于大数据而言,标准计算理论模型失效的原因之一是内存是有限的,无法存储所有的内存。 ()V3. 当内存不够或者算法设计不好时,如果数据量达到一定规模以上运行时间会急剧增加。V4. 现代计算机有复杂的存储层次,存储单元的访问是以块为单位的数据移动。()V4.2.11.外存归并排序,以()为单位进行调度。答案:块A、比特Bs 兆C、块D、层2. 排序分为内部排序和外部排序,外部排序是因排序的数据很大,一次不能容纳全部的排序内 容,在排序过程中需要访问外存。()V1. 在外排序的快速排序中,分割元素的选择非常重要。答案:正确A、正确B、错误4.31.在内存中的二分搜索树中,通常使用()来维护树的平衡。()答案:旋转A、置换B、分裂C、旋转D、合并2. 二叉搜索树是在n个元素之间搜索的标准方法,一般把元素保存在根处。(片3. 为更快地保存外部搜索树,可采取按BFS的顺序将其分割。()V5.11. 如果T是一个(a,b)-树(aM2且bM2a-1),其根结点的度在()之间。答案:2到bA、2 到 aB、2 到 bC、a 至 ij bD、2 至 ij42. 在(a,b)-树中,a和b表示的是每个节点当中键值的上限和下限。(片3. B-树中右边的指针指向的是键值小于最右键值的子数。(片5.21.元素都在叶子中的B-树有时被称为()。答案:B+-树A、B+树B、B-+树C、B+-树D、B+-数2. 关于(a,b)一树的删除操作,删除操作出现问题的情形是:从叶子v删除元素后,v的儿子小于 a-1 个。()V3. 关于(a,b)-树的插入,插入涉及到的结点最多到树高+1O()V5.31.KD树在()层使用水平线。AA、偶数层B、奇数层C、最底层D、最高层2. KdB-树的插入可以使用()的方法。CA、近似B、置换C、对数D、重构3. 构建KDB-树时,完成网格建立之后,计算每个网格中点的个数,并且存储在()中。AA、外存B、数据库C、寄存器D、内存4. 基于位置的查找实际上是一种三维空间的查找。()X5. KD树可以看成是两个二叉树的交叠。()正确6.11. 为数T的每个结点标上子树大小的I/O复杂度为()。BA、IO(sort(N)B、O(sort(N)C、IO(scan(N)D、O(scan(N)2. 前序计数的I/O复杂度为()。BA、IO(sort(N)B、O(sort(N)C、IO(scan(N)D、O(scan(N)3. 对给定顶点邻接链表T,其一个欧拉回路可以以()IO复杂性求得。CA、O(sort(N)B、O(scan(N)C、O(scan(N)IOD、IO(scan(N)4. 外存算法最坏情况的I/O数位Q(N)()X5. 图中的独立集是指图当中点的集合,其任意两点之间不存在边。()正确6.21. 查找规模为N的表L中,每个独立集(MIS)的大小至少为()。DA、n + 1B、2nC、n/2D、n/32. 时间前向的处理方法是按照()来访问边。CA、欧拉回路B、表排序C、拓扑序D、结点序3. 求最大独立集的基本思想是使用贪心法。()正确6.31. 图算法包含三种计数,其中将图问题表示为有向无环图的估值问题 的是()。C入、自举B、缩图法C、时间前向处理D、连通分量2. 半外存算法是假设()。BA、边放在内存中,顶点在外面B、顶点放在内存中,边在外面C、顶点和边都放在内存当中D、顶点和边都不在内存当中3. 图的连通性算法可扩增为求图G最小生成树(MST)的算法。()正确4. 在求最小生成树时,压缩后图中某条边的权值等于该边代表的所有边的权值最大值。()X7.11. MapReduce是由()开发的分布式编程模型。BA、MicrosoftB、GoogleC、TencentD、AlibabaGroup2. 在实现MapReduce程序时,需要注意的事项不包括()。CA、避免创建对象B、避免缓冲C、避免通信D、避免Mappe和Reducer间的全局变量传递3. MapReduce的执行框架处理的内容包括()。ABCDA、调度B、数据分布C、将中间数据进行聚集、排序或洗牌D、进行错误处理4. 理想的可扩展性有()。BCA、数据加倍,运行时间减半B、数据加倍,运行时间加倍C、资源加倍,运行时间减半D、资源加倍,运行时间加倍5. Map()和Reduce()两个函数不能够并行运行。()X7.21. 在版本1的字数统计中,在Map里使用了一个数组H,其作用是为每一个出现的单词作()。BA、序列B、基数C、集合7.31. 大部分时候reducer不能用作combinero ()正确2. combiner的运行次数可能有多次。正确7.41. 关于单词共现矩阵的计算,说法正确的是()。ACDA、计算文本集合中词的共现矩阵B、词的个数如果为N,输出为M*N的矩阵C、是一种测量语义距离的方法D、语义距离可用于许多语言处理任务2. 用单词共现矩阵解决大规模计数问题的基本方法是()。ACA、Mapper生成部分计数B、Reducer生成部分计数C、Reducer聚合部分计数D、Mapper聚合部分计数3. “条纹法”的优点有()。A、易于实现B、对key-value对的排序和洗牌少得多C、潜在对象更大D、能更好地利用combiner4. 在“词对法中,每个mapper处理一个句子。()正确5. “词对法”的缺点是不易实现排序和洗牌代价高()X6. f(B|A)词对法必须确定所有a被传递到同一 combiner0 ()X8.11. 在repartitionjoin的改进中,说法错误的是()。AA、Map函数的输出键作为连接键B、Map函数的输出键变化为连接键和表名的组合。C、Partition函数中Hashcode仅从组合键的连接键计算D、Grouping函数仅根据连接键分组纪录2. 用MR进行多重集相似连接算法的常见计算包括()。BCDA、三角函数B、单元函数C、合取函数D、析取函数3. 自然连接是从两个关系的笛卡尔积中选取给定属性间满足一定条件的元组。()X4. 等值连接不必在结果中去掉重复的属性。()正确8.21. 在迭代MapReduce中,reduce的输出必须和map的输入兼容。()正确2. “推荐好友是图算法在社交网络中的一种实际用例。()正确8.31. 找到一个稠密图的最小生成树的算法易于并行化的原因是每个子图的()可以被并行计算。 DA、边B、顶点C、结点D、最小生成树2. 基于路径的算法的例子不包括()。CA、单源最短路径B、最小生成树C、分布式不动点运算D、拓扑排序3. 在基于路径的算法中,边的标记包括()。ABCA、代价B、距离C、相似性D、属性4. Dijkstra算法需要并行化。()X 9.11. 缓存迭代的方法是()。ACDA、在Mapper前加入输入缓存B、在Mappe后加入输出缓存C、在Reducer前加入输入缓存D、在Reducer后加入输出缓存2. MapReduce是一种非递归描述性语言的通用运行平台。()正确3. Reduce r输入缓存的条件是使用静态划分方法,即意味着没有新的结点。()正确9.21.关于并行节点计算,下列选项中关于节点叙述不准确的是()。DA、每一节点接受上一 superstep发出的消息B、执行相同的用户定义函数C、所有节点根据用户定义函数修改它的值D、没有额外工作要做时继续迭代2. Pregel系统中Master的作用不包括()。DA、维护 workerB、恢复workers产生的错误C、提供Web-UI监督工作进程工具D、与worker交流3. 并行结点计算的终止条件是()。BDA、消息传送到其他点后B、所有顶点同时变为非活跃状态C、迭代结束D、没有信息传递4. 用Pregel计算子图同构问题,其三个步骤是()。ABDA、查询分解B、搜索C、迭代D、Join5. Pregel的编程形式,在执行计算的机器上每一阶段都利用整个图的全部状态。()X10.11. 众包通过一系列的机制和方法来指导和协调()的行为,从而达到目的。CA、个人B、计算机C、群体D、软件2. 外包与众包的区别在于众包的参与者数量大且不固定的。()正确3. Wikipedia是众包案例的一种最成功的应用之一。()正确4. 众包极大程度地使用了人本计算,因此它基本上等同于人本计算。()X10.21. 人脸识别是利用众包改进图像()的例子。DA、分类B、区分C、确认D、搜索2. 下列属于众包应用的例子有()。ABCDA、验证码B、机器翻译C、图像搜索D、数据库查询3. 众包技术应用于广告中的情形之一是区分关键词与广告的相关程度。()V4. 目前众包技术已经可以判断两幅画在艺术风格上是否一致。()X10.31. 众包中质量控制/数据质量要考虑的问题不包括()。DA、可靠性B、垃圾结果检测C、标签共识D、界面和交互设计2. 众包中的参与者包括()。ABCA、请求者B、平台CsZ人D、评估者3. 在人机交互中从用户获取输入的方式有()。ABCDA、调查B、快速原型C、可用性测试D、认知走查4. 众包中工人的回报是多样的。()正确5. 难以核实主观任务是资格测试的缺点之一。()正确6. 任务分配的拉方法是指系统采取完全的控制将制定的任务分配给工人。()X10.41. 采用把大连通分量划分成高度连接的小连通分量基本思路的方法是()CA、CrowdDBB、混合人机工作流程顷双层法D、分批策略2. 用机器完成众包的优势有()。ABA、省钱B、省时C、数量大D、质量高3. 目前众包技术完全由计算机来完成。()X
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 办公文档 > 解决方案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!