南开大学21春《数据科学导论》离线作业1辅导答案89

上传人:住在****他 文档编号:98324574 上传时间:2022-05-29 格式:DOCX 页数:10 大小:13.08KB
返回 下载 相关 举报
南开大学21春《数据科学导论》离线作业1辅导答案89_第1页
第1页 / 共10页
南开大学21春《数据科学导论》离线作业1辅导答案89_第2页
第2页 / 共10页
南开大学21春《数据科学导论》离线作业1辅导答案89_第3页
第3页 / 共10页
点击查看更多>>
资源描述
南开大学21春数据科学导论离线作业1辅导答案1. 医疗健康数据的基本情况不包括以下哪项?( )A.诊疗数据B.个人健康管理数据C.公共安全数据D.健康档案数据参考答案:C2. 下面例子属于分类的是( )。A.检测图像中是否有人脸出现B.对客户按照贷款风险大小进行分类C.识别手写的数字D.估计商场客流量参考答案:ABC3. 一元线性回归中,真实值与预测值的差称为样本的( )。A.误差B.方差C.测差D.残差参考答案:D4. Apriori算法的计算复杂度受( )影响。A.支持度阈值B.项数C.事务数D.事务平均宽度参考答案:ABCD5. 下面哪一项不是中国发展大数据产业的基础( )。A.信息化积累了丰富的数据资源B.大数据技术创新取得明显突破C.大数据应用推动势头良好D.大数据产业支撑薄弱参考答案:D6. 层次聚类适合规模较( )的数据集。A.大B.中C.小D.所有参考答案:C7. k近邻法的基本要素包括( )。A.距离度量B.k值的选择C.样本大小D.分类决策规则参考答案:ABD8. 如何理解计算机网络?如何理解计算机网络?参考答案:计算机网络就是将地理位置不同、具有独立功能的多个计算机系统,用通信线路和通信设备连接起来,在网络软件支持下,实现数据通信和资源共享的系统。9. 交通数据涉及到交通车辆或者道路两旁安装的传感器生成和手机的数据集。( )T.对F.错参考答案:T10. 通常将统计指标的数值按时间顺序排列所形成的数列,称为时间序列。( )T.对F.错参考答案:T11. 地下城与勇士(DNF)SX警告码(2,xxx,0)是什么意思?地下城与勇士(DNF)SX警告码(2,xxx,0)是什么意思?您的电脑中存在非法模块,请重启电脑后登陆游戏,同时请不要使用第三方非法软件进行游戏,并建议您使用“腾讯游戏木马专杀”提高帐户安全性。12. 以下哪一项不是特征选择常见的方法?( )A.过滤式B.封装式C.嵌入式D.开放式参考答案:D13. Apriori算法的加速过程依赖于以下哪个策略?( )A.抽样B.剪枝C.缓冲D.并行参考答案:B14. 关联规则可以被广泛地应用于通信、金融、交通、健康医疗和Web用户行为分析等领域。( )A.正确B.错误参考答案:A15. 数据隐私和安全是大数据发展面临的挑战。( )T.对F.错参考答案:T16. PaaS是( )的简称A.软件即服务B.平台即服务C.基础设施即服务D.硬件即服务参考答案:B17. 列表(list),集合(set),和元组(tuple)都是序列数据类型。( )A.正确B.错误参考答案:B18. 给定一个数据集,如果存在某个超平面S能够将数据集的部分正实例点和负实例点正确的划分到超平面的两侧,则称该数据集是线性可分数据集。( )A.正确B.错误参考答案:B19. 某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?( )A.关联规则发现B.聚类C.分类D.自然语言处理参考答案:A20. 下列选项是BFR的对象是( )。A.废弃集B.临时集C.压缩集D.留存集参考答案:ACD21. NAS是一种采用直接与网络介质相连的特殊设备实现数据存储的模式。( )T.对F.错参考答案:T22. 数据变换(Data Transformation)的方法有( )A.光滑B.聚集C.数据泛化D.规范化参考答案:ABCD23. MapReduce中的Map和Reduce函数使用( )进行输入输出A.key/value对B.随机数值C.其他计算结果参考答案:A24. 时空数据是指带有地理位置与时间标签的数据。( )T.对F.错参考答案:T25. Python中操作集合时,可以使用哪个函数来对集合进行增加元素的操作?( )A.appendB.putC.popD.add参考答案:D26. 一般而言,信息增益越大,则意味着使用属性a来进行划分所获得的“纯度提升越大”,因此我们可用信息增益来进行决策树的最优特征选择。( )A.正确B.错误参考答案:A27. K-means聚类中K值选取的方法是( )。A.密度分类法B.手肘法C.大腿法D.随机选取参考答案:AB28. 决策树学习的算法通常是一个递归地选择最优特征,并根据该特征对训练数据进行分割,使得各个子数据集有一个最好的分类的过程,这一过程对应着特征空间的划分,也对应着决策树的构建。( )A.正确B.错误参考答案:A29. 对于项集来说,置信度没有意义。( )A.正确B.错误参考答案:A30. 在有统计学意义的前提下,标准化偏回归系数的绝对值越大,说明相应的自变量对y的作用( )。A.越小B.越大C.无关D.不确定参考答案:B31. 聚类的主要方法有( )。A.划分聚类B.层次聚类C.密度聚类D.距离聚类参考答案:ABC32. 原始数据的错误,异常值和冲突值必须被清理。典型的数据清洁操作包含三个阶段:审计数据发现差距,选择转换来修正差距,将转换应用到数据集。( )T.对F.错参考答案:T33. Python中定义函数的关键字是( )。A.defB.defineC.functionD.defunc参考答案:A34. 信息熵越小,样本结合的纯度越低。( )A.正确B.错误参考答案:B35. 拍档系统可以操作将客户的外汇款打给上游开盘工厂。( )拍档系统可以操作将客户的外汇款打给上游开盘工厂。( )参考答案:36. sigmoid函数属于阶跃函数,是神经网络中常见的激活函数。( )A.正确B.错误参考答案:B37. 地下城与勇士(DNF)TS 警告码(x,42, x)是什么意思?地下城与勇士(DNF)TS 警告码(x,42, x)是什么意思?建议您及时使用杀毒软件或者在这里下载腾讯游戏木马专杀工具进行查杀。如无法解决,可尝试暂时关闭杀软并重启机器后再试。38. 赤池信息准则是衡量统计模型拟合优良性的一种标准。( )A.正确B.错误参考答案:A39. GFS中的文件切分成( )的块进行存储A.32MBB.64MBC.128MBD.1G参考答案:B40. BFR聚类用于在( )欧氏空间中对数据进行聚类。A.高维B.中维C.低维D.中高维参考答案:A41. 关于Python中异常处理,以下描述错误的是( )。A.异常语句可以与else和finally关键字配合使用B.程序异常发生后经过异常处理,程序可以继续执行C.Python通过try、except等关键字提供异常处理功能D.编程语言中的异常和错误完全是相同的概念参考答案:D42. 内存分析数据量比BI分析数据量大。( )T.对F.错参考答案:F43. 多元线性回归是线性回归的扩充,其中涉及的属性多于两个,并且数据拟合到一个多维曲面。( )T.对F.错参考答案:T44. ECR系统由哪些部分组成的?ECR系统由哪些部分组成的?参考答案:ECR系统的基本结构包括两个部分,即基础设施和管理系统,其中,基础设施包括信息系统和物流系统,管理系统包括营销管理和组织革新。45. 以下哪个不是处理缺失值的方法?( )A.删除记录B.按照一定原则补充C.不处理D.随意填写参考答案:D46. 以下哪一项不属于数据变换?( )A.简单函数变换B.规范化C.属性合并D.连续属性离散化参考答案:C47. 获取数据为数据分析提供了素材和依据,这里的数据只包括直接获取的数据。( )A.正确B.错误参考答案:B48. 局部变量指在函数内部使用的变量,当函数退出时,变量依然存在,下次函数调用时可以继续使用。( )A.正确B.错误参考答案:B49. 当维度增加时,特征空间的体积增加得很快,使得可用的数据变得稠密。( )A.正确B.错误参考答案:B50. R语言是S语言的实现,是一种B编译语言。( )T.对F.错参考答案:F
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 考试试卷


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!