卫生信息分析

上传人:wu****ei 文档编号:253011880 上传时间:2024-11-27 格式:PPT 页数:34 大小:1.60MB
返回 下载 相关 举报
卫生信息分析_第1页
第1页 / 共34页
卫生信息分析_第2页
第2页 / 共34页
卫生信息分析_第3页
第3页 / 共34页
点击查看更多>>
资源描述
,Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,无忧,PPT,整理发布,Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,第十二章,卫生信息分析,第一节 卫生信息分析概述,第二节,卫生信息分析方法,第三节,卫生信息分析应用:症状监测,主要内容,信息分析的概念,信息分析(,information analysis,)的定义:信息分析是一种以信息为研究对象,根据拟解决的特定问题的需要,收集与之有关的信息进行分析研究,旨在得出有助于解决问题的新信息的科学劳动过程。,第一节 卫生信息分析概述,信息分析的步骤,课题选择,制订课题研究计划,信息收集,信息整理、鉴别与分析,报告编写,第一节 卫生信息分析概述,一、,时间序列分析,二、,关联规则挖掘,三、聚类分析,第二节,卫生信息分析方法,(一),时间序列分析概述,1.,时间序列数据,时间序列(,time series,)又称动态数列或时间数列,就是把所研究的事物在各个不同时间的统计指标的数值,按其发生时间先后顺序排列起来所形成的数列。,一、时间序列分析,全球霍乱发病例数报告,摘自,Global Health Observatory Data Repository,,,http:/apps.who.int/ghodata/?vid=2250,一、时间序列分析,2.,时间序列数据的种类,倾向变动,/,趋势变动,,用,T,(,Trend,),表示,,,统计数据在,长时间,内表现出的变化倾向,它按照某种规律持续上升或持续下降,或保持在某一水平上;,周期变动,,用,C,(,Cyclical,),表示,,,指,若干年,为周期的变化,周期长短不等,上下波动大小也不一致,但明显地呈现起伏变化;,季节变动,,用,S,(,Seasonal,),表示,,,指,每年,重复出现的周期变化,一般以月或季度为一个周期;,不规则变动,/,随机变动,,用,I,(,Irregular,),表示,指由各种,偶然,事件或影响因素引起的上述三类变化以外的任何变化。,一、时间序列分析,3.,时间序列分析的概念与原理,时间序列分析(,time series analysis,)就是根据系统观测得到的,时间序列数据,,应用数理统计方法(曲线拟合和参数估计)来建立,数学模型,,对时间序列数据加以分析处理,以预测未来事物的发展。,时间序列分析的基本依据是:,(,1,)承认事物发展的延续性。,(,2,)考虑到事物发展的,随机性,。,一、时间序列分析,4.,时间序列分析主要用,途,系统描述。,系统分析。,预测未来,。,决策和控制。,一、时间序列分析,(二),时间序列分析方法的种类,一、时间序列分析,(三),时间序列分析的基本步骤,收集数据:用观测、调查、统计、抽样等方法取得被观测系统时间序列动态数据。,整理数据:根据动态数据作相关图。,分析数据:对动态数据进行拟合或者修正。,一、时间序列分析,(四),时间序列数据的修正,算术平均法,分段平均法,移动平均法,指数平滑法,一、时间序列分析,(五),时间序列数据的拟合,多项式曲线法,指数曲线法,生长曲线法,一、时间序列分析,(一),关联规则挖掘概述,1.,关联规则及关联规则挖掘的定义,关联规则,(association rule),是指在同一个,事件,中出现的不同,项,的相关性,如顾客在商场购物可以看作是一个事件,所购买各种的商品就是其中的项,在这里的关联规则就是指在一次购物中所购商品的相关性。,关联规则反映了一个事件和,其他,事件之间依赖或依存的关系,如果我们确定两项或多项属性之间存在着关联,那么我们就可以根据其中一项的属性值来预测其,他,属性的值。,关联规则挖掘就是从大量的数据中挖掘出描述数据项之间相互联系有价值的知识。,二、关联规则挖掘,2.,关联规则挖掘的意义,购物篮分析,3.,关联规则的表现类型,关联规则是一种形如,X Y,的规则,其中,X,和,Y,是项目的集合。它说明如果,X,在数据库中发生,那么,Y,也会以一定的概率发生。,二、关联规则挖掘,根据规则中所处理的值类型:,布尔关联规则,(Boolean association rule),:,性别,=“,女,”,职业,=“,秘书,”,量化关联规则,(quantitative association rule),:,性别,=“,女,”avg,(收入),=2300,根据规则中涉及的数据维:,单维关联规则,(single dimensional association rule),:,啤酒,尿布,多维关联规则,(multi dimensional association rule),:,性别,=“,女,”,职业,=“,秘书,”,根据规则集所涉及的抽象层:,多层关联规则,(multilevel association rule),:,台式机,Sony,打印机,单层次关联规则,(single-level association rule),:,IBM,台式机,Sony,打印机,二、关联规则挖掘,(二),关联规则挖掘的基本过程,1.,找出所有频繁项集,根据定义,这些项集出现的频繁性至少和预定义的最小支持计数一样。,2.,由频繁项集产生强关联规则,根据定义,这些规则必须满足最小支持度和最小置信度。,支持度,:P(AB),,即,A,和,B,这两个项集在事务集,D,中同时出现的概率。,置信度,:P(B,A),,即在出现项集,A,的事务集,D,中,项集,B,也同时出现的概率。,支持度描述一个规则的重要性,而可信度描述规则发生的可能性。一般,我们用,0,和,100,之间的值表示支持度和置信度。,二、关联规则挖掘,(三),关联规则挖掘的,Apriori,算法,Apriori,算法由,Agrawal,等人于,1993,年提出,它是挖掘频繁项集的基本算法。其核心方法是基于频集理论的递归方法,针对的是在单维单层次布尔关联规则的挖掘,这是关联分析中最简单形式的关联规则挖掘。,具体做法就是:首先找出频繁,1-,项集,记为,L1,;然后利用,L1,来挖掘,L2,,即频繁,2-,项集;不断如此循环下去直到无法发现更多的频繁,K-,项集为止。每挖掘一层,LK,就需要扫描整个数据库一遍。,二、关联规则挖掘,(三),关联规则挖掘的,Apriori,算法,下面以超市商品的数据库为例来说明,Apriori,算法的基本操作。假设有,5,位顾客购买商品的清单如下表。,二、关联规则挖掘,某超市,5,位顾客购买商品清单,(三),关联规则挖掘的,Apriori,算法,二、关联规则挖掘,候选,1-,项集,面包,4,牛奶,4,尿布,4,啤酒,3,鸡蛋,1,可乐,1,频繁,1-,项集,面包,4,牛奶,4,尿布,4,啤酒,3,候选,2,-,项集,面包 牛奶,3,面包 尿布,3,面包 啤酒,2,牛奶 尿布,3,牛奶 啤酒,2,尿布 啤酒,3,候选,1-,项集,面包 尿布 牛奶,2,面包 尿布 啤酒,2,牛奶 尿布 啤酒,2,频繁,2,-,项集,面包 牛奶,3,面包 尿布,3,牛奶 尿布,3,尿布 啤酒,3,Apriori,算法的基本操作步骤举例,(四),关联规则的生成,同时满足最小支持度阈值和最小置信度阈值的规则称为强规则。对于给定的一个事务集,D,,挖掘关联规则就是支持度和可信度分别大于用户给定的最小支持度和最小可信度的强关联规则。,(五),关联规则挖掘在卫生信息分析中的实例,二、关联规则挖掘,(一),聚类分析的定义,聚类分析(,cluster analysis,)是将一组物理的或抽象的对象,根据它们之间的相似程度,分为若干组,使得同一个组内的数据对象具有较高的相似度,而不同组中的数据对象是不相似的。,聚类分析与分类,不同,:,对于分类问题,事先了解训练样本的分类属性,将数据对象分到不同的,已知,类中,如在人口统计中将每个调查对象分类到老年组、中年组等;而聚类分析,则是在划分的分类体系,未知,的情况下,将数据对象分组成不同类,需在训练样本中找到这个分类属性。,三、,聚类分析,(二),聚类分析的基本步骤,1.,计算对象间的相似性,2.,将聚类对象分到各个类别,三、,聚类分析,1.,计算对象间的相似性,通常就是利用(各对象间)距离来表示,相似性。,常用距离度量公式有欧几里得(,Euclidean,)距离公式。,三、,聚类分析,1.,计算对象间的相似性,上述的数据矩阵经过计算对象间的欧几里得距离之后,得到的是对象间的相似矩阵,。,三、,聚类分析,相似矩阵,2.,将聚类对象分到各个类别,层次方法,(hierarchical method),就是通过分解所给定的数据对象集来创建一个层次,直到满足某种条件为止。,自底向上,(,凝聚,):,从每个对象均作为一个单独的组开始,逐步将这些(对象)组进行合并,直到组合并在层次顶端或满足
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!