22春“物联网工程”专业《大数据开发技术》在线作业含答案参考6

上传人:住在****她 文档编号:77339220 上传时间:2022-04-19 格式:DOCX 页数:4 大小:10.06KB
返回 下载 相关 举报
22春“物联网工程”专业《大数据开发技术》在线作业含答案参考6_第1页
第1页 / 共4页
22春“物联网工程”专业《大数据开发技术》在线作业含答案参考6_第2页
第2页 / 共4页
22春“物联网工程”专业《大数据开发技术》在线作业含答案参考6_第3页
第3页 / 共4页
点击查看更多>>
资源描述
22春“物联网工程”专业大数据开发技术在线作业答案参考1. 利用概率的性质计算近似值的随机算法是数值概率算法,运行时以一定的概率得到正确解的随机算法是蒙特卡罗算法。( )A.错误B.正确参考答案:B2. 聚类分析(Cluster analysis)简称聚类(Clustering),是把数据对象划分成子集(类)的过程,每个子集称为一个簇(Cluster)。( )A.对B.错参考答案:A3. Spark中DataFrame的( )方法是进行排序查询A.order byB.group byC.select byD.sort by参考答案:A4. 下面是贪心算法的基本要素的是( )。A.重叠子问题B.构造最优解C.贪心选择性质D.定义最优解参考答案:C5. RDD的sortBy排序默认是升序。( )T.对F.错参考答案:T6. RDD中combineByKey不允许返回类型与输入数据类型不同的返回值。( )A.正确B.错误参考答案:B7. Spark Streming中对DStream的任何操作都会转化成对底层RDDs的操作。( )A.正确B.错误参考答案:A8. 可视化工具包括( )。A.ExcelB.Google ChartC.GephiD.ppt参考答案:ABC9. 采用贪心算法的最优装载问题的主要计算量在于将集装箱依其重量从小到大排序,故算法的时间复杂度为( )。A.O(n2n)B.O(nlogn)C.O(2n)D.O(n)参考答案:B10. HDFS的命名空间包含( )A.节点B.目录C.文件D.块参考答案:BCD11. Spark SQL读取的数据源支持( )A.Hive表B.Parquent文件C.JSON数据D.关系数据库参考答案:ABCD12. Scala通过( )来定义变量A.valB.valC.defineD.def参考答案:A13. 数据仓库、专家系统产生于大数据发展的成熟期。( )A.正确B.错误参考答案:B14. TF-IDF中TF指的是( )A.词频B.词在文档中出现的次数C.逆文档概率D.词在文档集中出现的概率E.词在文档集中出现的概率参考答案:AB15. Gartner研究机构给出的大数据定义是大数据一般会涉及两种或两种以上的数据形式,它需要收集超过100TB的数据,并且是高速实时数据流; 或者是从小数据开始,但数据每年增长速率至少为60%。( )A.对B.错参考答案:B16. RDD的行动操作通过某种函数将一个RDD转换为一个新的RDD,但是转换操作是懒操作,不会立刻执行计算。( )A.正确B.错误参考答案:B17. Scala是Scalable Language的简写,是一门多范式的编程语言,设计初衷是不包括面向对象编程的特性。( )A.正确B.错误参考答案:B18. GraphX中graph.edges可以得到( )A.顶点视图B.边视图C.顶点与边的三元组整体视图D.有向图参考答案:B19. 以下哪个方法可以创建RDD( )A.parallelizeB.makeRDDC.textFileD.loadFile参考答案:ABC20. Storm框架是实时计算系统,所以不能使用数据库。( )A.正确B.错误参考答案:B
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 考试试卷


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!