南开大学2021年12月《数据科学导论》期末考核试题库及答案参考60

上传人:住在山****ck 文档编号:85091440 上传时间:2022-05-05 格式:DOCX 页数:13 大小:15.21KB
返回 下载 相关 举报
南开大学2021年12月《数据科学导论》期末考核试题库及答案参考60_第1页
第1页 / 共13页
南开大学2021年12月《数据科学导论》期末考核试题库及答案参考60_第2页
第2页 / 共13页
南开大学2021年12月《数据科学导论》期末考核试题库及答案参考60_第3页
第3页 / 共13页
点击查看更多>>
资源描述
南开大学2021年12月数据科学导论期末考核试题库及答案参考1. K-means算法采用贪心策略,通过迭代优化来近似求解。( )A.正确B.错误参考答案:A2. Python程序可以在任何安装了Python解释器的操作系统环境中执行。( )A.正确B.错误参考答案:A3. 子集产生本质上是一个搜索过程,该过程可以从空集、随机产生的一个特征子集或者整个特征集开始。( )A.正确B.错误参考答案:A4. 相关性分析主要是分析个别独立变量之间线性相关程度的强弱,并用适当的统计指标表示出来的过程。( )A.正确B.错误参考答案:B5. 函数体现的是代码复用和模块化设计思想。( )A.正确B.错误参考答案:A6. 使用SVD方法进行图像压缩不可以保留图像的重要特征。( )A.正确B.错误参考答案:B7. 去除噪声使得数据光滑的技术主要有:( )A.分箱B.回归C.离群点分析参考答案:ABC8. Python中定义函数的关键字是( )。A.defB.defineC.functionD.defunc参考答案:A9. k值增大意味着整体模型变得复杂。( )A.正确B.错误参考答案:B10. 以下哪一项不是特征工程的子问题?( )A.特征创建B.特征提取C.特征选择D.特征识别参考答案:D11. 大话西游手游帮派贡献怎么得?大话西游手游帮派贡献怎么得?帮派贡献是非常重要的,如果你不重视他,那么属性肯定会比其他玩家少上一大截。帮派贡献的获得方式还是比较多的。1:帮派成员通过完成帮派任务获得2:参加帮派大战获得3:参加随机刷新的限时任务帮派强盗12. 第一个提出大数据概念的公司是( )。A.麦肯锡公司B.谷歌公司C.微软公司D.脸谱公司参考答案:A13. 用一个函数拟合数据来光滑数据称为回归。( )T.对F.错参考答案:T14. 赤池信息准则是衡量统计模型拟合优良性的一种标准。( )A.正确B.错误参考答案:A15. 医疗大数据特点:除了包含了大数据4个“V”的特点之外还有( )A.多态性B.时效性C.不完整性D.冗余性参考答案:ABCD16. 获取数据为数据分析提供了素材和依据,这里的数据只包括直接获取的数据。( )A.正确B.错误参考答案:B17. 信息熵越大,数据信息的不确定性越小。( )A.正确B.错误参考答案:B18. 离群点检测的应用包括( )等。A.欺诈检测B.入侵检测C.故障检测D.疾病的不寻常模式参考答案:ABCD19. Pearson相关系数是判断特征之间、以及特征和目标变量之间线性相关关系的统计量。( )A.正确B.错误参考答案:A20. 多层感知机的学习过程包含( )。多层感知机的学习过程包含( )。A.信号的正向传播B.信号的反向传播C.误差的正向传播D.误差的反向传播参考答案:AD21. 在有统计学意义的前提下,标准化偏回归系数的绝对值越大,说明相应的自变量对y的作用( )。A.越小B.越大C.无关D.不确定参考答案:B22. sigmoid函数属于阶跃函数,是神经网络中常见的激活函数。( )A.正确B.错误参考答案:B23. 以下选项中是Python中文分词的第三方库的是( )。A.turtleB.jiebaC.timeD.itchat参考答案:B24. 利用K近邻法进行分类时,使用不同的距离度量所确定的最近邻点都是相同的。( )A.正确B.错误参考答案:B25. 两个对象越相似,他们的相异度就越高。( )A.正确B.错误参考答案:B26. IPsec处于OSI七层模型的哪一层( )A、物理层B、链路层C、网络层D、应用层参考答案:C27. 函数的名称可以任意字符组合形成的。( )A.正确B.错误参考答案:B28. 大数据的最显著特征是( )。A.数据规模大B.数据类型多样C.数据处理速度快D.数据价值密度高参考答案:A29. 遍历循环for语句中,不可以遍历的结构是( )。A.字符串B.元组C.数字类型D.字典参考答案:C30. 系统日志收集的基本特征有( )。A.高可用性B.高可靠性C.可扩展性D.高效率参考答案:ABC31. 梦幻西游手游普陀用什么法宝好?梦幻西游手游普陀用什么法宝好?普陀作为一个治疗门派,不仅要考虑治疗量而且出手速度也是比较重要的。此外抗性也必须要考虑。乾坤玄火塔:祭起后让己方人物一定回合内增加愤怒。普陀的必备主动法宝,有了乾坤玄火塔普陀可以有稳定的愤怒值来放技能或特技。四象属性选择少阳,多一个回合就是多20多愤怒。无魂傀儡:对敌方单人使用,持续一定回合。被无魂傀儡影响的目标,出手时有一定几率随机使用门派法术。四象属性选择少阳,50%几率增加无魂傀儡一回合持续时间。碧玉葫芦:战斗中提升佩戴者的治疗强度。普陀的标配法宝,直接增加治疗强度。四象属性一般是选择少阳,提升1级法宝等级就相当于直接提升治疗量。也会有玩家选择太阴属性,2%几率触发治疗暴击。降魔斗篷:佩戴者受到法术攻击时,有几率降低部分伤害。现在耐加点的普陀都怕大龙的法伤,降魔斗篷可以降低所承受的伤害。四象属性建议选择少阳,触发法宝效果时临时提高10%法术防御2回合,这样会使得喜欢使用龙卷的龙宫更难打出致命伤害。风袋:战斗中提升佩戴者的速度。提高普陀的出手速度。四象属性建议选择少阴,提升佩戴者1%的法术躲避,普陀并不追求出手速度的极致,能躲避法术是增强普陀的生存能力。金甲仙衣:佩戴者受到物理攻击时,有几率降低部分伤害。增强普陀的生存能力,防止被点杀。四象属性建议选择太阴,佩戴者的宠物也受金甲仙衣的庇护,宠物被金甲仙衣保护的几率是主人的1/4。32. GFS中的文件切分成( )的块进行存储A.32MBB.64MBC.128MBD.1G参考答案:B33. 按照程序设计语言的发展历程进行分类,Python可以归类为( )。A.高级语言B.自然语言C.汇编语言D.机器语言参考答案:A34. 如何理解移动商务?如何理解移动商务?参考答案:移动商务是利用手机、PDA等无线终端设备并与互联网有机结合进行的电子商务活动。互联网技术、移动通信技术、短距离技术及其它技术的完善组合创造了移动商务。35. 以下选项中,不是Python对文件的打开模式的是( )。A.cB.r+C.wD.r参考答案:A36. 下列选项是BFR的对象是( )。A.废弃集B.临时集C.压缩集D.留存集参考答案:ACD37. 逗号分隔数值的存储格式叫做csv格式,csv格式一般用来表示二维数据。( )A.正确B.错误参考答案:A38. 关于Python中异常处理,以下描述错误的是( )。A.异常语句可以与else和finally关键字配合使用B.程序异常发生后经过异常处理,程序可以继续执行C.Python通过try、except等关键字提供异常处理功能D.编程语言中的异常和错误完全是相同的概念参考答案:D39. 大数据在电信中的应用有( )A.基于用户、业务及流量分级的多维管控机制B.精准的客户分析及营销C.利用位置和轨迹信息服务社会参考答案:ABC40. 以下哪项不是数据可视化工具的特性( )A.实时性B.简单操作C.更丰富的展现D.仅需一种数据支持方式即可参考答案:D41. 获取数据为数据分析提供了素材和依据,这里的数据只包括直接获取的数据。( )A.正确B.错误参考答案:B42. 下面Python关键字中,不用于表示分支结构的是( )。A.elseB.ifC.elseifD.elif参考答案:C43. 决策树分类时将该结点的实例强行分到条件概率大的那一类去。( )A.正确B.错误参考答案:A44. 对于分类数据,经常使用表格,来统计各种类别的数据出现的频率。( )A.正确B.错误参考答案:A45. Jaccard系数只关心个体间共同具有的特征是否一致这个问题。( )A.正确B.错误参考答案:A46. 简述数据可视化的流程和步骤。参考答案:数据可视化是对数据的综合运用,其操作包括数据获取、数据处理、可视化模式和可视化应用4个步骤。1)数据获取数据获取的形式多种多样,大致可以分为主动式和被动式两种。主动式获取是以明确的数据需求为目的,利用相关技术手段主动采集相关数据,如卫星影像、测绘工程等;被动式获取是以数据平台为基础,由数据平台的活动者提供数据来源,如电子商务网站、网络论坛等。2)数据处理数据处理是指对原始的数据进行分析、预处理和计算等步骤。数据处理的目标是保证数据的准确性、可用性等。3)可视化模式可视化模式是数据的一种特殊展现形式,常见的可视化模式有标签云、序列分析、网络结构、电子地图等。可视化模式的选取决定了可视化方案的雏形。4)可视化应用可视化应用主要根据用户的主观需求展开,最主要的应用方式是用来观察和展示,通过观察和人脑分析进行推理和认知,辅助人们发现新知识或者得到新结论。可视化界面也可以帮助人们进行人与数据的交互,辅助人们完成对数据的迭代计算,通过若干步,数据的计算实验,生产系列化的可视化成果。47. 在Python3.5中,集合类型的各个元素之间存在先后顺序。( )A.正确B.错误参考答案:B48. 发现满足最小支持度阈值的所有项集,这些项集被称为频繁项集。( )T.对F.错参考答案:T49. 程序设计语言中保留字也称为关键字,指被语言内部定义并保留使用的标识符。( )A.正确B.错误参考答案:A50. 通过构造新的指标线损率,当超出线损率的正常范围,则可以判断这条线路的用户可能存在窃漏电等异常行为属于数据变换中的( )。A.简单函数变换B.规范化C.属性构造D.连续属性离散化参考答案:C51. 下列不属于商业大数据类型的是( )A.传统企业数据B.机器和传感器数据C.社交数据D.电子商务数据参考答案:B52. 利用K近邻法进行分类时,k值过小容易发生过拟合现象。( )利用K近邻法进行分类时,k值过小容易发生过拟合现象。( )A.正确B.错误参考答案:A53. 以下属于关联分析的是( )。A.CPU性能预测B.购物篮分析C.自动判断鸢尾花类别D.股票趋势建模参考答案:B54. 网络营销渠道应具有的功能是( )A:配送功能B:订货功能C:结算功能D:市场拓展功能网络营销渠道应具有的功能是( )A:配送功能B:订货功能C:结算功能D:市场拓展功能答案:ABC55. 广义的Spark是指Spark生态系统,采用了四层架构。( )T.对F.错参考答案:T56. 一个HDFS集群由一个( )和( )构成。此外,还有与这两个角色之间作为沟通桥梁的客户端(Client)。A.一个名字节点B.若干个名字节点C.一个数据节点D.若干个数据节点参考答案:AD57. 整数和整数之间的运算结果一定的是整数。( )A.正确B.错误参考答案:B58. 网络营销规划的步骤依次是( )A:制定网络营销目标、评估企业外部环境、定位网络营销形象、安排预网络营销规划的步骤依次是( )A:制定网络营销目标、评估企业外部环境、定位网络营销形象、安排预算和组织资源B:定位网络营销形象、制定网络营销目标、评估企业外部环境、安排预算和组织资源C:评估企业外部环境、制定网络营销目标、定位网络营销形象、安排预算和组织资源D:安排预算和组织资源、制定网络营销目标、评估企业外部环境、定位网络营销形象答案:C59. 数据挖掘方法侧重于从数据驱动的角度出发获取模式或规律。因此,针对海量人类移动数据,数据挖掘方法可以发挥其挖掘模式或规律的长处。( )T.对F.错参考答案:T60. HDFS为海量的数据提供了存储。( )T.对F.错参考答案:T
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 大学资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!