新版用K均值法对自考考生流失的研究汇编

上传人:陈** 文档编号:26244358 上传时间:2021-08-07 格式:DOCX 页数:2 大小:20.35KB
返回 下载 相关 举报
新版用K均值法对自考考生流失的研究汇编_第1页
第1页 / 共2页
新版用K均值法对自考考生流失的研究汇编_第2页
第2页 / 共2页
亲,该文档总共2页,全部预览完了,如果喜欢就下载吧!
资源描述
新版用均值法对自考考生流失的研究汇编 摘要:高等教育自学考试是我国高等教育的一种重要形式,考生流失是自考的一种普遍现象。流失原因分析对自考管理方法的改革有着重要的意义。文章尝试采用聚类分析中K-Means方法对北京市自考考生流失的多重因素进行分析,揭示出自考考生流失的一些规律。 关键词:数据挖掘;K-均值;高等教育自学考试;考生流失;聚类 引言 数据挖掘指的是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘与知识发现技术是计算机领域一个非常有活力的研究课题,其研究成果已广泛应用于金融、医疗保健、零售、制造业、工程与科学等行业。考生流失是自考的一种普遍现象,分析流失原因对自考管理方法的改革有着重要意义。一些研究人员采用分类统计等研究方法,从公共课成绩入手分析流失的规律,对该问题进行了基础性的研究。本文采用数据挖掘中的聚类分析方法寻找高等教育自学考试考生各种属性和考生流失之间的联系,希望能为相关机构提供浓缩的数据归纳结果和有效的建议,更好地服务于教育机构,服务于考生。 1、流失定义与流失考生数据提取 自学考试的考试时间完全可以由考生自己选择,学制没有明确的期限,考生流失既不需要到相关部门认定,也不保证以后不会再来参加考试。也就是说不再参加考试的考生在学籍中不会有记载,而且过了很长时间后也许会重新参加考试。因此研究自学考试考生流失就必须对流失考生加以明确定义。 首先定义两个概念:“跨度”和“暂停期”。“跨度”定义为考生参加第一门课程考试与参加最后一门课程考试的时间间隔;“暂停期”定义为考生两门课程考试间隔的最大时间。 图1、图2分别是北京市12658名自考已毕业的考生“跨度”和“暂停期”的统计数据,其中专科8859人,他们中99.5以上的毕业生跨度为66个月,94.1以上的毕业生的暂停期为24个月;本科3799人,他们中99.3以上的毕业生跨度为66个月,95.0以上的毕业生的暂停期为24个月。因此在研究中定义66个月和24个月作为“跨度”和“暂停期”的流失阈值A和B。 自考考生流失的定义:跨度大于等于A且最后一门课程考试距当前最近一次考试时间大于等于B的考生即为流失考生。 根据上述定义,从还未毕业的18050名考生中筛选出12545名流失考生。总流失率为69.5。其中专科流失率为72,本科流失率为54.3。 注:本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 工作总结


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!