南开大学22春“物联网工程”《数据科学导论》离线作业(一)辅导答案4

上传人:住在山****ck 文档编号:107306756 上传时间:2022-06-14 格式:DOCX 页数:7 大小:20.78KB
返回 下载 相关 举报
南开大学22春“物联网工程”《数据科学导论》离线作业(一)辅导答案4_第1页
第1页 / 共7页
南开大学22春“物联网工程”《数据科学导论》离线作业(一)辅导答案4_第2页
第2页 / 共7页
南开大学22春“物联网工程”《数据科学导论》离线作业(一)辅导答案4_第3页
第3页 / 共7页
点击查看更多>>
资源描述
书山有路勤为径,学海无涯苦作舟! 住在富人区的她南开大学22春“物联网工程”数据科学导论离线作业(一)辅导答案一.综合考核(共50题)1.决策树的输入为训练集,输出为以node为根结点的一棵决策树。()A.正确B.错误参考答案:A2.当训练集较大的时候,标准BP算法通常会更快的获得更好的解。()A.正确B.错误参考答案:A3.以下哪一项不属于数据变换()A.简单函数变换B.规范化C.属性合并D.连续属性离散化参考答案:C4.在树的结构中,特征越重要,就越远离根节点。()A.正确B.错误参考答案:B5.聚类的最简单最基本方法是()。A.划分聚类B.层次聚类C.密度聚类D.距离聚类参考答案:A6.K-means聚类是发现给定数据集的K个簇的算法。()A.正确B.错误参考答案:A7.以下属于关联分析的是()。A.CPU性能预测B.购物篮分析C.自动判断鸢尾花类别D.股票趋势建模参考答案:B8.以下哪一项不属于数据变换?()A.简单函数变换B.规范化C.属性合并D.连续属性离散化参考答案:C9.某商品的产量(X,件)与单位成本(Y,元/件)之间的回归方程为Y=100-1.2X,这说明()A.产量每增加一台,单位成本增加100元B.产量每增加一台,单位成本减少1.2元C.产量每增加一台,单位成本平均减少1.2元D.产量每增加一台,单位平均增加100元参考答案:C10.为了更加准确地描述变量之间的线性相关程度,可以通过计算相关系数来进行相关分析。()A.正确B.错误参考答案:A11.子集产生本质上是一个搜索过程,该过程可以从空集、随机产生的一个特征子集或者整个特征集开始。()A.正确B.错误参考答案:A12.BFR聚类用于()在欧氏空间中对数据进行聚类。A.高维B.中维C.低维D.中高维参考答案:A13.标准BP算法是在读取全部数据集后,对参数进行统一更新的算法。()A.正确B.错误参考答案:B14.以下哪些不是缺失值的影响()A.数据建模将丢失大量有用信息B.数据建模的不确定性更加显著C.对整体总是不产生什么作用D.包含空值的数据可能会使建模过程陷入混乱,导致异常的输出参考答案:C15.使用SVD方法进行图像压缩不可以保留图像的重要特征。()A.正确B.错误参考答案:B16.Pearson相关系数是判断特征之间、以及特征和目标变量之间线性相关关系的统计量。()A.正确B.错误参考答案:A17.贝叶斯定理是概率论中的一个结果,它与随机变量的条件概率以及联合概率分布有关。()A.正确B.错误参考答案:A18.多层感知机的学习过程包含()。A.信号的正向传播B.信号的反向传播C.误差的正向传播D.误差的反向传播参考答案:AD19.以下哪一项不是特征工程的子问题?()A.特征创建B.特征提取C.特征选择D.特征识别参考答案:D20.实体识别属于以下哪个过程?()A.数据清洗B.数据集成C.数据规约D.数据变换参考答案:B21.决策树内部结点表示一个类,叶结点表示一个特征或属性。()A.正确B.错误参考答案:B22.例如将工资收入属性值映射到-1,1或者0,1内属于数据变换中的()A.简单函数变换B.规范化C.属性构造D.连续属性离散化参考答案:B23.Jaccard系数只关心个体间共同具有的特征是否一致这个问题。()A.正确B.错误参考答案:A24.实体识别的常见形式:()A.同名异义B.异名同义C.单位不统一D.属性不同参考答案:D25.信息熵越小,样本结合的纯度越低。()A.正确B.错误参考答案:B26.利用K近邻法进行分类时,k值过小容易发生过拟合现象。()A.正确B.错误参考答案:A27.变量之间的关系一般可以分为确定性关系与()A.非确定性关系B.线性关系C.函数关系D.相关关系参考答案:A28.维克托迈尔-舍恩伯格在大数据时代:生活、工作与思维的大变革一书中,持续强调了一个观点:大数据时代的到来,使我们无法人为地去发现数据中的奥妙,与此同时,我们更应该注重数据中的相关关系,而不是因果关系。其中,数据之间的相关关系可以通过以下哪个算法直接挖掘?()A.K-meansB.Bayes NetworkC.C4.5D.Apriori参考答案:D29.下面不是分类的常用方法的有()A.K近邻法B.朴素贝叶斯C.决策树D.条件随机场参考答案:D30.利用K近邻法进行分类时,使用不同的距离度量所确定的最近邻点都是相同的。()A.正确B.错误参考答案:B31.选择较小的k值,相当于用较小的邻域中的训练实例进行预测,学习的“近似误差”会减小,“估计误差”会增大,预测结果会对近邻的点实例点非常敏感。()A.正确B.错误参考答案:A32.可信度是对关联规则的准确度的衡量。()A.正确B.错误参考答案:A33.两个对象越相似,他们的相异度就越高。()A.正确B.错误参考答案:B34.哪一项不属于规范化的方法?()A.最小最大规范化B.零均值规范化C.小数定标规范化D.中位数规范化参考答案:D35.一元线性回归中,真实值与预测值的差称为样本的()。A.误差B.方差C.测差D.残差参考答案:D36.决策树分类时将该结点的实例强行分到条件概率大的那一类去。()A.正确B.错误参考答案:A37.下列两个变量之间的关系中,哪个是函数关系?()A.人的性别和他的身高B.人的工资与年龄C.正方形的面积和边长D.温度与湿度参考答案:C38.具有双隐层的感知机足以用于解决任何复杂的分类问题。()A.正确B.错误参考答案:A39.关联规则的评价度量主要有()。A.支持度B.置信度C.准确率D.错误率参考答案:AB40.距离度量中的距离可以是()A.欧式距离B.曼哈顿距离C.Lp距离D.Minkowski距离参考答案:ABCD41.实体识别的常见形式()A.同名异义B.异名同义C.单位不统一D.属性不同参考答案:D42.系统日志收集的基本特征有()。A.高可用性B.高可靠性C.可扩展性D.高效率参考答案:ABC43.聚合方法是自底向上的方法。()A.正确B.错误参考答案:A44.Apriori算法的加速过程依赖于以下哪个策略?()A.抽样B.剪枝C.缓冲D.并行参考答案:B45.当维度增加时,特征空间的体积增加得很快,使得可用的数据变得稠密。()A.正确B.错误参考答案:B46.考虑下面的频繁3-项集的集合:1,2,3,1,2,4,1,2,5,1,3,4,1,3,5,2,3,4,2,3,5,3,4,5假定数据集中只有5个项,采用合并策略,由候选产生过程得到4-项集不包含()A.1,2,3,4B.1,2,3,5C.1,2,4,5D.1,3,4,5参考答案:C47.给定关联规则AB,意味着若A发生,B也会发生。()A.正确B.错误参考答案:B48.增加神经元的个数,无法提高神经网络的训练精度。()A.正确B.错误参考答案:B49.通过构造新的指标线损率,当超出线损率的正常范围,则可以判断这条线路的用户可能存在窃漏电等异常行为属于数据变换中的()。A.简单函数变换B.规范化C.属性构造D.连续属性离散化参考答案:C50.在一元线性回归模型中,残差项服从()分布。A.泊松B.正态C.线性D.非线性参考答案:B
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 大学资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!