南开大学22春《数据科学导论》综合作业一答案参考50

上传人:住在****他 文档编号:89473450 上传时间:2022-05-13 格式:DOCX 页数:12 大小:14.64KB
返回 下载 相关 举报
南开大学22春《数据科学导论》综合作业一答案参考50_第1页
第1页 / 共12页
南开大学22春《数据科学导论》综合作业一答案参考50_第2页
第2页 / 共12页
南开大学22春《数据科学导论》综合作业一答案参考50_第3页
第3页 / 共12页
点击查看更多>>
资源描述
南开大学22春数据科学导论综合作业一答案参考1. K-means算法采用贪心策略,通过迭代优化来近似求解。( )A.正确B.错误参考答案:A2. 数据挖掘方法侧重于从数据驱动的角度出发获取模式或规律。因此,针对海量人类移动数据,数据挖掘方法可以发挥其挖掘模式或规律的长处。( )T.对F.错参考答案:T3. 一元线性回归中,真实值与预测值的差称为样本的( )。A.误差B.方差C.测差D.残差参考答案:D4. 百度地图春节人口迁徙大数据在业界首次实现了全程、动态、即时直观地展现中国春节前后人口大迁徙的轨迹与特征。( )T.对F.错参考答案:T5. 下列两个变量之间的关系中,哪个是函数关系?( )A.人的性别和他的身高B.人的工资与年龄C.正方形的面积和边长D.温度与湿度参考答案:C6. 通常将统计指标的数值按时间顺序排列所形成的数列,称为时间序列。( )T.对F.错参考答案:T7. 函数可以看作是一段具有名字的子程序,在需要的地方调用执行,不需要在每个执行地方重复编写这些语句。( )A.正确B.错误参考答案:A8. 数据采集,又称数据获取,是大数据生命周期的第一个环节,通过RFID射频识别技术、传感器、交互型社交网络以及移动互联网等方式获得的各种类型的结构化、半结构化及非结构化的海量数据。( )T.对F.错参考答案:T9. 分拆方法是自底向上的方法。( )A.正确B.错误参考答案:B10. random库采用梅森旋转算法生成伪随机序列。( )A.正确B.错误参考答案:A11. 去除噪声使得数据光滑的技术主要有:( )A.分箱B.回归C.离群点分析参考答案:ABC12. 大话西游手游水陆大会怎么进场?大话西游手游水陆大会怎么进场?到皇宫找魏征13. 一个HDFS集群由一个( )和( )构成。此外,还有与这两个角色之间作为沟通桥梁的客户端(Client)。A.一个名字节点B.若干个名字节点C.一个数据节点D.若干个数据节点参考答案:AD14. 层次聚类适合规模较( )的数据集。A.大B.中C.小D.所有参考答案:C15. 地下城与勇士(DNF)TS 警告码(x,42, x)是什么意思?地下城与勇士(DNF)TS 警告码(x,42, x)是什么意思?建议您及时使用杀毒软件或者在这里下载腾讯游戏木马专杀工具进行查杀。如无法解决,可尝试暂时关闭杀软并重启机器后再试。16. 统计图表的可视化方法主要包括( )A.散点图B.折线图C.条形图D.饼图参考答案:ABCD17. 以下哪些不是缺失值的影响?( )A.数据建模将丢失大量有用信息B.数据建模的不确定性更加显著C.对整体总是不产生什么作用D.包含空值的数据可能会使建模过程陷入混乱,导致异常的输出参考答案:C18. 关联规则可以用枚举的方法产生。( )A.正确B.错误参考答案:A19. 实体识别属于以下哪个过程?( )A.数据清洗B.数据集成C.数据规约D.数据变换参考答案:B20. 梦幻西游手游洞察好吗?梦幻西游手游洞察好吗?洞察加的伤害,和面板伤害是相当的。那面板伤害的提高,一些无法破中防单位的情况就会发生变化,就会发生破防,破防后的没点单位伤害提升,是效益最大的。其实,最简单的比较,就是洞察,相当于35个高级强力兽决。21. 借助于大数据提供的( )和( ),政府可为农业生产进行合理引导,依据需求进行生产,避免产能过剩造成不必要的资源和社会财富浪费。A.消费能力B.趋势报告C.购物结果参考答案:AB22. 逗号分隔数值的存储格式叫做csv格式,csv格式一般用来表示二维数据。( )A.正确B.错误参考答案:A23. QQ炫舞连接下载服务器.QQ炫舞连接下载服务器.版本或者网络差异导致更新缓慢,或者优化个人网络。24. 数据清洗(Data Cleaning)的方法有( )A.填充空缺值B.清除数据中的噪声C.识别或删除离群点并解决不一致性参考答案:ABC25. 定义和使用函数的主要原因是函数执行速度更快。( )A.正确B.错误参考答案:B26. 什么情况下结点不用划分?( )A.当前结点所包含的样本全属于同一类别B.当前属性集为空,或是所有样本在所有属性上取值相同C.当前结点包含的样本集为空D.还有子集不能被基本正确分类参考答案:ABC27. k近邻法的基本要素包括( )。A.距离度量B.k值的选择C.样本大小D.分类决策规则参考答案:ABD28. 关于函数,以下描述错误的是( )。A.函数能完成特定的功能,对函数的使用不需要了解函数内部实现原理,只要了解函数的输入输出方式即可B.使用函数的主要目的是降低编程难度和代码重用C.函数是一段具有特定功能的、可重用的语句组D.Python中使用del关键字定义一个函数参考答案:D29. 下面关于网站内容管理系统的描述,不正确的是( )。A. 网站内容管理系统的缩写为CMSB. 将网站模板与网站内容相分离C. 只能管理结构化内容,不能管理非结构化内容D. 由文档模板、脚本语言或标记语言和数据库的集成构成参考答案:C30. 某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?( )A.关联规则发现B.聚类C.分类D.自然语言处理参考答案:A31. 在数据预处理时,无论什么情况,都可以直接将异常值删除。( )A.正确B.错误参考答案:B32. 数据科学具有广泛的应用领域,可以应用在社交网络、职业体育、政治竞选。( )A.正确B.错误参考答案:A33. 百度品牌专区的售卖方式跟关键词推广的方式一样,是按点击收费的。( )百度品牌专区的售卖方式跟关键词推广的方式一样,是按点击收费的。( )答案:错误34. NAS是一种采用直接与网络介质相连的特殊设备实现数据存储的模式。( )T.对F.错参考答案:T35. 在list对象中添加元素可以使用add( )函数,将要添加的值加入列表尾部。( )A.正确B.错误参考答案:B36. MapReduce中的Map和Reduce函数使用( )进行输入输出A.key/value对B.随机数值C.其他计算结果参考答案:A37. 下列标识符中哪个是不合法的?( )A.40tempB.tempStrC.listD._124参考答案:A38. Apriori算法的计算复杂度受( )影响。A.支持度阈值B.项数C.事务数D.事务平均宽度参考答案:ABCD39. 云存储中用户需要按需付费并使用存储服务。( )T.对F.错参考答案:T40. 医疗大数据特点:除了包含了大数据4个“V”的特点之外还有( )A.多态性B.时效性C.不完整性D.冗余性参考答案:ABCD41. 函数体现的是代码复用和模块化设计思想。( )A.正确B.错误参考答案:A42. 设X=1,2,3是频繁项集,则可由X产生( )个关联规则。A.4B.5C.6D.7参考答案:C43. 大话西游手游好心值怎么获得?大话西游手游好心值怎么获得?1、已经做过当前主线,帮助其他玩家过任务的玩家,在战斗胜利后,奖励50好心值2、捉鬼任务中,队伍中若有等级小于自己30级以上,且等级小鱼0转80级的玩家,则每完成一个捉鬼任务获得2好心值。3、以大号的身份参与双人五环,可获得100好心值。好心值上限:通过主线任务获得的好心值每日上限为200,通过捉鬼任务获得的好心值每日上限也为200,总共每日最多获得400好心值。44. Python内置的random库主要用于产生各种分布的真实随机数序列。( )A.正确B.错误参考答案:B45. 数据可根据产生主体的不同分为两类少量企业应用产生的数据和量个人用户产生的数据。( )T.对F.错参考答案:F46. 实体识别属于以下哪个过程?( )A.数据清洗B.数据集成C.数据规约D.数据变换参考答案:B47. continue语句只结束本次循环,而不终止整个循环;break语句结束整个循环过程。( )A.正确B.错误参考答案:A48. 朴素贝叶斯分类器有简单、高效、健壮的特点,但某些属性可能会降低分类器的性能。( )A.正确B.错误参考答案:A49. 平均减少的不纯度越大,则特征重要度越高。( )A.正确B.错误参考答案:A50. 末日求生沙盒游戏H1Z1解锁国区IP了?末日求生沙盒游戏H1Z1解锁国区IP了?答案:是。这款游戏在去年2月发布的时候开放大陆IP,后来锁区,2月17日开始,大陆IP登陆亚太区已经可以游戏。51. 以下不属于Python的关键字的是( )。A.markB.delC.returnD.global参考答案:A52. 编写HTML文件不能在哪个软件中编写?( )A.EditB.WordC.WPSD.Windows的画笔参考答案:D53. 组合数据类型可以分为三类:序列类型、集合类型和映射类型。( )A.正确B.错误参考答案:A54. 局部变量若与全局变量重名,则不能在函数内部创建和使用。( )A.正确B.错误参考答案:B55. 两个对象越相似,他们的相异度就越高。( )A.正确B.错误参考答案:B56. 上传物流服务数据有何作用?A.可以获得奖励;B.后期可能根据物流数据展示出此拍档的信誉,以吸引上传物流服务数据有何作用?A.可以获得奖励;B.后期可能根据物流数据展示出此拍档的信誉,以吸引客户C.后期可能根据物流数据展示出此拍档的物流服务能力,以吸引客户D.没有作用参考答案:ABC57. 距离度量中的距离可以是( )。A.欧式距离B.曼哈顿距离C.Lp距离D.Minkowski距离参考答案:ABCD58. 第一个提出大数据概念的公司是( )。A.麦肯锡公司B.谷歌公司C.微软公司D.脸谱公司参考答案:A59. 例如将工资收入属性值映射到-1,1或者0,1内属于数据变换中的( )。A.简单函数变换B.规范化C.属性构造D.连续属性离散化参考答案:B60. 下面哪一项不是中国发展大数据产业的基础( )。A.信息化积累了丰富的数据资源B.大数据技术创新取得明显突破C.大数据应用推动势头良好D.大数据产业支撑薄弱参考答案:D
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 考试试卷


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!