南开大学22春《数据科学导论》综合作业一答案参考30

上传人:住在****他 文档编号:89474660 上传时间:2022-05-13 格式:DOCX 页数:13 大小:14.01KB
返回 下载 相关 举报
南开大学22春《数据科学导论》综合作业一答案参考30_第1页
第1页 / 共13页
南开大学22春《数据科学导论》综合作业一答案参考30_第2页
第2页 / 共13页
南开大学22春《数据科学导论》综合作业一答案参考30_第3页
第3页 / 共13页
点击查看更多>>
资源描述
南开大学22春数据科学导论综合作业一答案参考1. 赤池信息准则是衡量统计模型拟合优良性的一种标准。( )A.正确B.错误参考答案:A2. 信息熵越小,样本结合的纯度越低。( )A.正确B.错误参考答案:B3. k近邻法的基本要素包括( )。A.距离度量B.k值的选择C.样本大小D.分类决策规则参考答案:ABD4. 聚类的主要方法有( )。聚类的主要方法有( )。A.划分聚类B.层次聚类C.密度聚类D.距离聚类参考答案:ABC5. 网络营销规划的步骤依次是( )A:制定网络营销目标、评估企业外部环境、定位网络营销形象、安排预网络营销规划的步骤依次是( )A:制定网络营销目标、评估企业外部环境、定位网络营销形象、安排预算和组织资源B:定位网络营销形象、制定网络营销目标、评估企业外部环境、安排预算和组织资源C:评估企业外部环境、制定网络营销目标、定位网络营销形象、安排预算和组织资源D:安排预算和组织资源、制定网络营销目标、评估企业外部环境、定位网络营销形象答案:C6. 对于多层感知机,( )层拥有激活函数的功能神经元。A.输入层B.隐含层C.输出层参考答案:BC7. 宁家骏委员指出,我国发展医疗服务业,同时发展智慧养老。( )T.对F.错参考答案:T8. 剪枝是决策树学习算法对付“过拟合”的主要手段。( )A.正确B.错误参考答案:A9. 函数是一段具有特定功能的、可重用的语句组,用函数名来表示并通过函数名进行功能调用。( )A.正确B.错误参考答案:A10. 设X=1,2,3是频繁项集,则可由X产生( )个关联规则。A.4B.5C.6D.7参考答案:C11. 开放云( )A.价值呈现:大数据应用价值呈现和创新不足B.应用建设:周期长、门槛高、多冗余、体验差C.组织流程:应用跨部门,缺乏流程贯串和使能业务生产D.生态建设:无法有效构建和融入新的数字生态圈参考答案:ABCD12. HDFS为海量的数据提供了存储。( )T.对F.错参考答案:T13. 哪一项不属于规范化的方法?( )A.最小最大规范化B.零均值规范化C.小数定标规范化D.中位数规范化参考答案:D14. 减少已分配但未使用的存储容量的浪费,在分配存储空间时,系统按需分配存储空间。( )T.对F.错参考答案:T15. 选择较小的k值,相当于用较小的邻域中的训练实例进行预测,学习的“近似误差”会减小,“估计误差”会增大,预测结果会对近邻的点实例点非常敏感。( )A.正确B.错误参考答案:A16. Pearson相关系数是判断特征之间、以及特征和目标变量之间线性相关关系的统计量。( )A.正确B.错误参考答案:A17. 特征的信息增益越大,则其越不重要。( )A.正确B.错误参考答案:B18. 以下哪一项不属于数据变换?( )A.简单函数变换B.规范化C.属性合并D.连续属性离散化参考答案:C19. 程序语句len(str(3.1415)的输出结果为( )。A.4B.5C.6D.7参考答案:C20. 可信度是对关联规则的准确度的衡量。( )可信度是对关联规则的准确度的衡量。( )A.正确B.错误参考答案:A21. 网络营销渠道应具有的功能是( )A:配送功能B:订货功能C:结算功能D:市场拓展功能网络营销渠道应具有的功能是( )A:配送功能B:订货功能C:结算功能D:市场拓展功能答案:ABC22. 不满足给定评价度量的关联规则是无趣的。( )A.正确B.错误参考答案:B23. 当特征为离散型时,可以使用信息增益作为评价统计量。( )A.正确B.错误参考答案:A24. 医疗大数据特点:除了包含了大数据4个“V”的特点之外还有( )A.多态性B.时效性C.不完整性D.冗余性参考答案:ABCD25. 通过变量标准化计算得到的回归方程称为( )。A.标准化回归方程B.标准化偏回归方程C.标准化自回归方程D.标准化多回归方程参考答案:A26. 决策树还可以表示给定特征条件下类的条件概率分布,这一概率分布定义在特征空间的一个划分上,将特征空间分为互不相交的单元或区域,并在每个单元定义一个类的概率分布就构成了一个条件概率分布。( )决策树还可以表示给定特征条件下类的条件概率分布,这一概率分布定义在特征空间的一个划分上,将特征空间分为互不相交的单元或区域,并在每个单元定义一个类的概率分布就构成了一个条件概率分布。( )A.正确B.错误参考答案:A27. 根据映射关系的不同可以分为线性回归和( )。A.对数回归B.非线性回归C.逻辑回归D.多元回归参考答案:B28. 在一元线性回归中,通过最小二乘法求得的直线叫做回归直线或( )。A.最优回归线B.最优分布线C.最优预测线D.最佳分布线参考答案:A29. 大话西游手游浣彩露有什么用?大话西游手游浣彩露有什么用?浣彩露是人物染色最主要的材料,仙人们浣形易色的必备品,据传为云霞仙子把流动的彩虹吸入琉璃瓶中而成的奇珍妙露。30. 获取数据为数据分析提供了素材和依据,这里的数据只包括直接获取的数据。( )A.正确B.错误参考答案:B31. 层次方法可以分为( )A.K均值算法B.K中心点算法C.凝聚法D.分裂法参考答案:CD32. 数据可根据产生主体的不同分为两类少量企业应用产生的数据和量个人用户产生的数据。( )T.对F.错参考答案:F33. 特征选择和降维都是用于减少特征数量,进而降低模型复杂度、防止过度拟合。( )A.正确B.错误参考答案:A34. 平均减少的不纯度越大,则特征重要度越高。( )A.正确B.错误参考答案:A35. Python文件的后缀名是( )。A.pyB.pdfC.pngD.pyl参考答案:A36. 末日求生沙盒游戏H1Z1解锁国区IP了?末日求生沙盒游戏H1Z1解锁国区IP了?答案:是。这款游戏在去年2月发布的时候开放大陆IP,后来锁区,2月17日开始,大陆IP登陆亚太区已经可以游戏。37. 聚类的主要方法有( )。A.划分聚类B.层次聚类C.密度聚类D.距离聚类参考答案:ABC38. 以下哪一种数据类型元素之间是无序的,相同元素在集合中唯一存在?( )A.元组B.字符串C.列表D.集合参考答案:D39. 数据产生方式变革中数据产生方式是主动的主要是来自哪个阶段( )。A.运营式系统阶段B.用户原创内容阶段C.感知式系统阶段参考答案:B40. 基于大数据的临床决策支持系统的架构包括( )A.支撑层B.大数据分析层C.网络层D.应用层参考答案:ABD41. 大话西游手游水陆大会怎么进场?大话西游手游水陆大会怎么进场?到皇宫找魏征42. 以下关于Python组合数据类型描述错误的是( )。A.序列类型可以通过序号访问元素,元素之间不存在先后关系B.组合数据类型可以分为3类序列类型、集合类型和映射类型C.Python组合数据类型能够将多个同类型或者不同类型的数据组织起来,通过单一的表示使数据操作更有序、更容易D.Python中字符串、元组和列表都是序列类型参考答案:A43. 事件是Flume的基本数据单位。( )T.对F.错参考答案:T44. 实体识别的常见形式:( )A.同名异义B.异名同义C.单位不统一D.属性不同参考答案:D45. 聚类的最简单最基本方法是( )。A.划分聚类B.层次聚类C.密度聚类D.距离聚类参考答案:A46. 以下程序语句中,哪个是正确利用切片语句取出字符串s=“pi=3.1415926”中的所有数字部分?( )A.s3-1B.s311C.s4-1D.s312参考答案:D47. 以下选项中不是Python关键字的是( )。A.whileB.exceptC.inD.do参考答案:D48. 单层感知机模型属于( )模型。A.二分类的线性分类模型B.二分类的非线性分类模型C.多分类的线性分类模型D.多分类的非线性分类模型参考答案:A49. 网民在搜索引擎输入关键词后,搜索引擎会返回的三大类相关信息是( )A:搜索引擎检索库中相关的网民在搜索引擎输入关键词后,搜索引擎会返回的三大类相关信息是( )A:搜索引擎检索库中相关的信息B:付费的推广信息C:开放平台信息D:网盟推广信息答案:ABC50. Python程序可以在任何安装了Python解释器的操作系统环境中执行。( )A.正确B.错误参考答案:A51. PaaS是( )的简称A.软件即服务B.平台即服务C.基础设施即服务D.硬件即服务参考答案:B52. 医疗健康数据的基本情况不包括以下哪项?( )A.诊疗数据B.个人健康管理数据C.公共安全数据D.健康档案数据参考答案:C53. 通过构造新的指标线损率,当超出线损率的正常范围,则可以判断这条线路的用户可能存在窃漏电等异常行为属于数据变换中的( )。A.简单函数变换B.规范化C.属性构造D.连续属性离散化参考答案:C54. 聚类是一种( )。A.有监督学习B.无监督学习C.强化学习D.半监督学习参考答案:B55. 下面关于网站内容管理系统的描述,不正确的是( )。A. 网站内容管理系统的缩写为CMSB. 将网站模板与网站内容相分离C. 只能管理结构化内容,不能管理非结构化内容D. 由文档模板、脚本语言或标记语言和数据库的集成构成参考答案:C56. 以下选项中,不是Python对文件的打开模式的是( )。A.cB.r+C.wD.r参考答案:A57. K-means聚类中K值选取的方法是( )。A.密度分类法B.手肘法C.大腿法D.随机选取参考答案:AB58. 发现满足最小支持度阈值的所有项集,这些项集被称为频繁项集。( )T.对F.错参考答案:T59. 以下哪一项不属于数据变换?( )A.简单函数变换B.规范化C.属性合并D.连续属性离散化参考答案:C60. 某个主题而在逻辑上或物理上划分出来的数据仓库中的数据子集称为( )。某个主题而在逻辑上或物理上划分出来的数据仓库中的数据子集称为( )。参考答案:数据集市
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 考试试卷


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!