南开大学22春“物联网工程”《数据科学导论》离线作业(一)辅导答案44

上传人:住在山****ck 文档编号:107623385 上传时间:2022-06-14 格式:DOCX 页数:7 大小:20.53KB
返回 下载 相关 举报
南开大学22春“物联网工程”《数据科学导论》离线作业(一)辅导答案44_第1页
第1页 / 共7页
南开大学22春“物联网工程”《数据科学导论》离线作业(一)辅导答案44_第2页
第2页 / 共7页
南开大学22春“物联网工程”《数据科学导论》离线作业(一)辅导答案44_第3页
第3页 / 共7页
点击查看更多>>
资源描述
书山有路勤为径,学海无涯苦作舟! 住在富人区的她南开大学22春“物联网工程”数据科学导论离线作业(一)辅导答案一.综合考核(共50题)1.设X=1,2,3是频繁项集,则可由X产生()个关联规则。A.4B.5C.6D.7参考答案:C2.在一元线性回归中,输入只包含一个单独的特征。()A.正确B.错误参考答案:A3.聚合方法是自底向上的方法。()A.正确B.错误参考答案:A4.关联规则的评价度量主要有()。A.支持度B.置信度C.准确率D.错误率参考答案:AB5.不满足给定评价度量的关联规则是无趣的。()A.正确B.错误参考答案:B6.实体识别的常见形式()A.同名异义B.异名同义C.单位不统一D.属性不同参考答案:D7.标准BP算法是在读取全部数据集后,对参数进行统一更新的算法。()A.正确B.错误参考答案:B8.支持度是衡量关联规则重要性的一个指标。()A.正确B.错误参考答案:A9.K-means算法采用贪心策略,通过迭代优化来近似求解。()A.正确B.错误参考答案:A10.决策树学习的算法通常是一个递归地选择最优特征,并根据该特征对训练数据进行分割,使得各个子数据集有一个最好的分类的过程,这一过程对应着特征空间的划分,也对应着决策树的构建。()A.正确B.错误参考答案:A11.下列选项是BFR的对象是()A.废弃集B.临时集C.压缩集D.留存集参考答案:ACD12.下面不是分类的常用方法的有()。A.K近邻法B.朴素贝叶斯C.决策树D.条件随机场参考答案:D13.聚类的最简单最基本方法是()。A.划分聚类B.层次聚类C.密度聚类D.距离聚类参考答案:A14.一元回归参数估计的参数求解方法有()。A.最大似然法B.距估计法C.最小二乘法D.欧式距离法参考答案:ABC15.对于多层感知机,()层拥有激活函数的功能神经元。A.输入层B.隐含层C.输出层参考答案:BC16.给定一组点,使用点之间的距离概念,将点分组为若干簇,不同簇的成员可以相同。()A.正确B.错误参考答案:B17.决策树的输入为训练集,输出为以node为根结点的一棵决策树。()A.正确B.错误参考答案:A18.什么情况下结点不用划分?()A.当前结点所包含的样本全属于同一类别B.当前属性集为空,或是所有样本在所有属性上取值相同C.当前结点包含的样本集为空D.还有子集不能被基本正确分类参考答案:ABC19.聚类是一种()。A.有监督学习B.无监督学习C.强化学习D.半监督学习参考答案:B20.以下哪一项不属于数据变换()A.简单函数变换B.规范化C.属性合并D.连续属性离散化参考答案:C21.考虑下面的频繁3-项集的集合:1,2,3,1,2,4,1,2,5,1,3,4,1,3,5,2,3,4,2,3,5,3,4,5;假定数据集中只有5个项,采用合并策略,由候选产生过程得到4-项集不包含()。A.1,2,3,4B.1,2,3,5C.1,2,4,5D.1,3,4,5参考答案:C22.BFR聚类用于()在欧氏空间中对数据进行聚类。A.高维B.中维C.低维D.中高维参考答案:A23.对于分类数据,经常使用表格,来统计各种类别的数据出现的频率。()A.正确B.错误参考答案:A24.数据库中相关联的两张表都存储了用户的个人信息,但在用户的个人信息发生改变时只更新了一张表中的数据,这时两张表中就有了不一致的数据,这属于()。A.异常值B.缺失值C.不一致的值D.重复值参考答案:C25.以下哪一项不属于数据变换?()A.简单函数变换B.规范化C.属性合并D.连续属性离散化参考答案:C26.每个类的先验概率可以通过属于该类的训练记录所占的比例来估计。()A.正确B.错误参考答案:A27.在k近邻法中,选择较小的k值时,学习的“近似误差”会(),“估计误差”会()。A.减小,减小B.减小,增大C.增大,减小D.增大,增大参考答案:B28.例如将工资收入属性值映射到-1,1或者0,1内属于数据变换中的()。A.简单函数变换B.规范化C.属性构造D.连续属性离散化参考答案:B29.某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?()A.关联规则发现B.聚类C.分类D.自然语言处理参考答案:A30.下面例子属于分类的是()。A.检测图像中是否有人脸出现B.对客户按照贷款风险大小进行分类C.识别手写的数字D.估计商场客流量参考答案:ABC31.K-means聚类是发现给定数据集的K个簇的算法。()A.正确B.错误参考答案:A32.通过变量标准化计算得到的回归方程称为()。A.标准化回归方程B.标准化偏回归方程C.标准化自回归方程D.标准化多回归方程参考答案:A33.通过构造新的指标-线损率,当超出线损率的正常范围, 则可以判断这条线路的用户可能存在窃漏电等异常行为属于数据变换中的()。A.简单函数变换B.规范化C.属性构造D.连续属性离散化参考答案:C34.数据库中相关联的两张表都存储了用户的个人信息,但在用户的个人信息发生改变时只更新了一张表中的数据,这时两张表中就有了不一致的数据,这属于()A.异常值B.缺失值C.不一致的值D.重复值参考答案:C35.考虑下面的频繁3-项集的集合:1,2,3,1,2,4,1,2,5,1,3,4,1,3,5,2,3,4,2,3,5,3,4,5假定数据集中只有5个项,采用合并策略,由候选产生过程得到4-项集不包含()A.1,2,3,4B.1,2,3,5C.1,2,4,5D.1,3,4,5参考答案:C36.什么情况下结点不用划分()A.当前结点所包含的样本全属于同一类别B.当前属性集为空,或是所有样本在所有属性上取值相同C.当前结点包含的样本集为空D.还有子集不能被基本正确分类参考答案:ABC37.探索性数据分析的特点是研究从原始数据入手,完全以实际数据为依据。()A.正确B.错误参考答案:A38.对于项集来说,置信度没有意义。()A.正确B.错误参考答案:A39.考虑下面的频繁3-项集的集合:1,2,3,1,2,4,1,2,5,1,3,4,1,3,5,2,3,4,2,3,5,3,4,5假定数据集中只有5个项,采用合并策略,由候选产生过程得到4-项集不包含()。A.1,2,3,4B.1,2,3,5C.1,2,4,5D.1,3,4,5参考答案:C40.在树的结构中,特征越重要,就越远离根节点。()A.正确B.错误参考答案:B41.Apriori算法的计算复杂度受()影响。A.支持度阈值B.项数C.事务数D.事务平均宽度参考答案:ABCD42.下列选项是BFR的对象是()。A.废弃集B.临时集C.压缩集D.留存集参考答案:ACD43.实体识别属于以下哪个过程()A.数据清洗B.数据集成C.数据规约D.数据变换参考答案:B44.贝叶斯定理是概率论中的一个结果,它与随机变量的条件概率以及联合概率分布有关。()A.正确B.错误参考答案:A45.子集产生本质上是一个搜索过程,该过程可以从空集、随机产生的一个特征子集或者整个特征集开始。()A.正确B.错误参考答案:A46.数据科学具有哪些性质()A.有效性B.可用性C.未预料D.可理解参考答案:ABCD47.特征选择的四个步骤中不包括()A.子集产生B.子集评估C.子集搜索D.子集验证参考答案:C48.多元线性回归模型中,标准化偏回归系数没有单位。()A.正确B.错误参考答案:A49.可信度是对关联规则的准确度的衡量。()A.正确B.错误参考答案:A50.数据科学具有广泛的应用领域,可以应用在社交网络、职业体育、政治竞选。()A.正确B.错误参考答案:A
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 大学资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!