资源描述
南开大学21秋数据科学导论离线作业2-001答案1. NoSQL(名词解释)参考答案:NoSQL是泛指非关系型、分布式和不提供ACID的数据库,它不是单纯地反对关系型数据库,而是强调键值存储和文档数据库的优点。2. 元组可以作为字典的键也可以作为字典的值。( )A.正确B.错误参考答案:A3. 数据变换(Data Transformation)的方法有( )A.光滑B.聚集C.数据泛化D.规范化参考答案:ABCD4. 百度品牌专区的售卖方式跟关键词推广的方式一样,是按点击收费的。( )百度品牌专区的售卖方式跟关键词推广的方式一样,是按点击收费的。( )答案:错误5. 平均减少的不纯度越大,则特征重要度越高。( )A.正确B.错误参考答案:A6. 实体识别的常见形式:( )A.同名异义B.异名同义C.单位不统一D.属性不同参考答案:D7. 下列不属于商业大数据类型的是( )A.传统企业数据B.机器和传感器数据C.社交数据D.电子商务数据参考答案:B8. 弹性是指有容错的机制,若一个RDD分片去失,Spark可以根据粗粒度的日志数据更新记录的信息重构它。( )T.对F.错参考答案:T9. Pearson相关系数是判断特征之间、以及特征和目标变量之间线性相关关系的统计量。( )A.正确B.错误参考答案:A10. 梦幻西游手游帮派技能上限是多少?梦幻西游手游帮派技能上限是多少?1、帮派技能上限为100级,角色最高学习到自身等级+102、帮派技能20级只需消耗银币学习,20级以上需额外消耗帮贡11. 层次方法可以分为( )A.K均值算法B.K中心点算法C.凝聚法D.分裂法参考答案:CD12. 下面例子属于分类的是( )。A.检测图像中是否有人脸出现B.对客户按照贷款风险大小进行分类C.识别手写的数字D.估计商场客流量参考答案:ABC13. 利用K近邻法进行分类时,k值过小容易发生过拟合现象。( )利用K近邻法进行分类时,k值过小容易发生过拟合现象。( )A.正确B.错误参考答案:A14. 原始数据的错误,异常值和冲突值必须被清理。典型的数据清洁操作包含三个阶段:审计数据发现差距,选择转换来修正差距,将转换应用到数据集。( )T.对F.错参考答案:T15. 通过变量标准化计算得到的回归方程称为( )。A.标准化回归方程B.标准化偏回归方程C.标准化自回归方程D.标准化多回归方程参考答案:A16. 我们需要对已生成的树( )进行剪枝,将树变得简单,从而使它具有更好的泛化能力。A.自上而下B.自下而上C.自左而右D.自右而左参考答案:B17. 怪物猎人OL游戏中的武器防具都是哪里来的?打怪掉落吗?怪物猎人OL游戏中的武器防具都是哪里来的?打怪掉落吗?在怪物猎人OL中,大部分武器和防具都只能通过收集相应的素材,在铁匠处进行制作,怪物不会掉落任何武器或者防具。18. 某商品的产量(X,件)与单位成本(Y,元/件)之间的回归方程为Y=100-1.2X,这说明( )。A.产量每增加一台,单位成本增加100元B.产量每增加一台,单位成本减少1.2元C.产量每增加一台,单位成本平均减少1.2元D.产量每增加一台,单位平均增加100元参考答案:C19. 集中趋势能够表明在一定条件下数据的独特性质与差异。( )集中趋势能够表明在一定条件下数据的独特性质与差异。( )A.正确B.错误参考答案:B20. 以下哪一项不属于数据变换?( )A.简单函数变换B.规范化C.属性合并D.连续属性离散化参考答案:C21. 以下选项中,不是Python对文件的打开模式的是( )。A.cB.r+C.wD.r参考答案:A22. 大数据在电信中的应用有( )A.基于用户、业务及流量分级的多维管控机制B.精准的客户分析及营销C.利用位置和轨迹信息服务社会参考答案:ABC23. 大话西游手游帮派贡献怎么得?大话西游手游帮派贡献怎么得?帮派贡献是非常重要的,如果你不重视他,那么属性肯定会比其他玩家少上一大截。帮派贡献的获得方式还是比较多的。1:帮派成员通过完成帮派任务获得2:参加帮派大战获得3:参加随机刷新的限时任务帮派强盗24. 数据产生方式变革中数据产生方式是主动的主要是来自哪个阶段( )。A.运营式系统阶段B.用户原创内容阶段C.感知式系统阶段参考答案:B25. 根据映射关系的不同可以分为线性回归和( )。A.对数回归B.非线性回归C.逻辑回归D.多元回归参考答案:B26. 实体识别属于以下哪个过程?( )A.数据清洗B.数据集成C.数据规约D.数据变换参考答案:B27. 列表是一个灵活的数据结构,数字、字符串、列表、字典都可以作为其中的元素。( )A.正确B.错误参考答案:A28. 层次聚类适合规模较( )的数据集。A.大B.中C.小D.所有参考答案:C29. 给定一个数据集,如果存在某个超平面S能够将数据集的部分正实例点和负实例点正确的划分到超平面的两侧,则称该数据集是线性可分数据集。( )给定一个数据集,如果存在某个超平面S能够将数据集的部分正实例点和负实例点正确的划分到超平面的两侧,则称该数据集是线性可分数据集。( )A.正确B.错误参考答案:B30. 空间视图提供了交通堵塞的概览。( )T.对F.错参考答案:T31. 剪枝是决策树学习算法对付“过拟合”的主要手段。( )A.正确B.错误参考答案:A32. 梦幻西游手游普陀用什么法宝好?梦幻西游手游普陀用什么法宝好?普陀作为一个治疗门派,不仅要考虑治疗量而且出手速度也是比较重要的。此外抗性也必须要考虑。乾坤玄火塔:祭起后让己方人物一定回合内增加愤怒。普陀的必备主动法宝,有了乾坤玄火塔普陀可以有稳定的愤怒值来放技能或特技。四象属性选择少阳,多一个回合就是多20多愤怒。无魂傀儡:对敌方单人使用,持续一定回合。被无魂傀儡影响的目标,出手时有一定几率随机使用门派法术。四象属性选择少阳,50%几率增加无魂傀儡一回合持续时间。碧玉葫芦:战斗中提升佩戴者的治疗强度。普陀的标配法宝,直接增加治疗强度。四象属性一般是选择少阳,提升1级法宝等级就相当于直接提升治疗量。也会有玩家选择太阴属性,2%几率触发治疗暴击。降魔斗篷:佩戴者受到法术攻击时,有几率降低部分伤害。现在耐加点的普陀都怕大龙的法伤,降魔斗篷可以降低所承受的伤害。四象属性建议选择少阳,触发法宝效果时临时提高10%法术防御2回合,这样会使得喜欢使用龙卷的龙宫更难打出致命伤害。风袋:战斗中提升佩戴者的速度。提高普陀的出手速度。四象属性建议选择少阴,提升佩戴者1%的法术躲避,普陀并不追求出手速度的极致,能躲避法术是增强普陀的生存能力。金甲仙衣:佩戴者受到物理攻击时,有几率降低部分伤害。增强普陀的生存能力,防止被点杀。四象属性建议选择太阴,佩戴者的宠物也受金甲仙衣的庇护,宠物被金甲仙衣保护的几率是主人的1/4。33. 常见的非结构化数据有( )A.web网页B.即时消息C.富文本文档D.实时多媒体数据参考答案:ABCD34. Apriori算法的加速过程依赖于以下哪个策略?( )A.抽样B.剪枝C.缓冲D.并行参考答案:B35. 购物篮问题是( )的典型案例A.数据变换B.关联规则挖掘C.数据分类参考答案:B36. 利用K近邻法进行分类时,使用不同的距离度量所确定的最近邻点都是相同的。( )A.正确B.错误参考答案:B37. 什么情况下结点不用划分?( )A.当前结点所包含的样本全属于同一类别B.当前属性集为空,或是所有样本在所有属性上取值相同C.当前结点包含的样本集为空D.还有子集不能被基本正确分类参考答案:ABC38. 地下城与勇士(DNF)TS 警告码(x,42, x)是什么意思?地下城与勇士(DNF)TS 警告码(x,42, x)是什么意思?建议您及时使用杀毒软件或者在这里下载腾讯游戏木马专杀工具进行查杀。如无法解决,可尝试暂时关闭杀软并重启机器后再试。39. 大话西游手游好心值怎么获得?大话西游手游好心值怎么获得?1、已经做过当前主线,帮助其他玩家过任务的玩家,在战斗胜利后,奖励50好心值2、捉鬼任务中,队伍中若有等级小于自己30级以上,且等级小鱼0转80级的玩家,则每完成一个捉鬼任务获得2好心值。3、以大号的身份参与双人五环,可获得100好心值。好心值上限:通过主线任务获得的好心值每日上限为200,通过捉鬼任务获得的好心值每日上限也为200,总共每日最多获得400好心值。40. 程序设计语言中保留字也称为关键字,指被语言内部定义并保留使用的标识符。( )A.正确B.错误参考答案:A41. 以下属于组织机构购买特征的是( )A:购买者数量多,分步分散B:受价格变化影响小C:购买过程更加感以下属于组织机构购买特征的是( )A:购买者数量多,分步分散B:受价格变化影响小C:购买过程更加感性D:购买频率更低答案:D42. Apriori算法的计算复杂度受( )影响。A.支持度阈值B.项数C.事务数D.事务平均宽度参考答案:ABCD43. 以下选项中是Python中文分词的第三方库的是( )。A.turtleB.jiebaC.timeD.itchat参考答案:B44. 聚合方法是自底向上的方法。( )A.正确B.错误参考答案:A45. 局部变量若与全局变量重名,则不能在函数内部创建和使用。( )A.正确B.错误参考答案:B46. k近邻法的基本要素包括( )。A.距离度量B.k值的选择C.样本大小D.分类决策规则参考答案:ABD47. 给定一个数据集,如果存在某个超平面S能够将数据集的部分正实例点和负实例点正确的划分到超平面的两侧,则称该数据集是线性可分数据集。( )A.正确B.错误参考答案:B48. 一般而言,信息增益越大,则意味着使用属性a来进行划分所获得的“纯度提升越大”,因此我们可用信息增益来进行决策树的最优特征选择。( )A.正确B.错误参考答案:A49. 数据库中相关联的两张表都存储了用户的个人信息,但在用户的个人信息发生改变时只更新了一张表中的数据,这时两张表中就有了不一致的数据,这属于( )。A.异常值B.缺失值C.不一致的值D.重复值参考答案:C50. 子集产生本质上是一个搜索过程,该过程可以从空集、随机产生的一个特征子集或者整个特征集开始。( )A.正确B.错误参考答案:A
展开阅读全文