培训资料--spss统计软件培训数据分析

上传人:ra****d 文档编号:252583461 上传时间:2024-11-18 格式:PPT 页数:24 大小:789.50KB
返回 下载 相关 举报
培训资料--spss统计软件培训数据分析_第1页
第1页 / 共24页
培训资料--spss统计软件培训数据分析_第2页
第2页 / 共24页
培训资料--spss统计软件培训数据分析_第3页
第3页 / 共24页
点击查看更多>>
资源描述
Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,重庆市疾控慢病所 宿昆,*,SPSS,SPSS,Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,SPSS,统计软件数据分析,宿 昆,重庆市疾控慢病所,2024/11/18,重庆市疾控慢病所 宿昆,2,主要内容,统计描述,均数比较:t检验、方差分析,2 检验,简单线性回归,二分类Logistic回归,基于秩次的非参数检验,2024/11/18,重庆市疾控慢病所 宿昆,3,1.1,统计描述,连续变量的统计描述,分类变量的统计描述,2024/11/18,重庆市疾控慢病所 宿昆,4,1.2.1,连续变量的统计描述,集中趋势,:算术均数、中位数、几何均数、众数、调和均数等。,离散趋势,:全距、方差和标准差、百分位数、四分位数,/,间距、变异系数。,分布特征:对正态分布而言,偏度系数和峰度系数等。,其他趋势:单峰、双峰、对称、偏态,2024/11/18,重庆市疾控慢病所 宿昆,5,1.2.1 连续变量的统计描述续,算术均数,:,用于描述服从正态分布的变量值的平均水平。,中位数,:,用于描述服从偏态分布资料的平均水平。,几何均数,:,用于描述等比或等差数列变量值的平均水平。,方差,:,主要用于正态分布资料,;,标准差,:,主要用于正态分布资料,;,四分位数间距,:,主要用于偏态分布资料(,QP75,P25,),;,变异系数,:,用于度量单位不同或均数相差悬殊的资料,。,2024/11/18,重庆市疾控慢病所 宿昆,6,1.2.1 连续变量的统计描述续,SPSS中的相应功能:“频率过程,2024/11/18,重庆市疾控慢病所 宿昆,7,1.2.1 连续变量的统计描述续,SPSS中的相应功能:“描述过程,2024/11/18,重庆市疾控慢病所 宿昆,8,1.2.1 连续变量的统计描述续,SPSS中的相应功能:“探索过程,2024/11/18,重庆市疾控慢病所 宿昆,9,1.2.2,分类变量的统计描述,频数分布情况的描述:绝对频数、百分比,集中趋势的描述:众数,使用相对数进行深入描述:比、构成比、率,SPSS中的相应功能:“频率过程、“描述过程和“探索过程,2024/11/18,重庆市疾控慢病所 宿昆,10,1.2 比较均值,完全随机化设计单组计量资料的均数与总体均数比较的t检验,某个小区1000个6岁男孩的身高与重庆市所有6岁男孩的身高平均值的比较,配对设计两组相关计量资料均数间比较的t检验,自身配对:如治疗前后某项指标比较。,异体配对:如对两只兔子两种处理方法的结果比较。,完全随机化设计两组独立计量资料均数间比较的t检验,如男女BMI比较,完全随机化设计多组独立计量资料均数间比较的单因素ANOVA,如比较不同乡镇BMI,2024/11/18,重庆市疾控慢病所 宿昆,11,1.2 比较均值,2024/11/18,重庆市疾控慢病所 宿昆,12,1.3,2,检验,完全随机设计的单样本计数资料的率/构成比与总体率/构成比比较,完全随机设计的两(多)独立样本计数资料的率(构成比)比较,配对设计的两组相关样本计数资料的率/构成比比较与Kappa一致性检验,完全随机设计的分层2检验,2024/11/18,重庆市疾控慢病所 宿昆,13,1.4,简单线性回归模型,回归的最初含义:生物学含义,英国的遗传学家F.Galton和K.Pearson注意到一个有趣的现象,即父亲高,儿子也高,父亲矮,儿子也矮,但儿子的身高离平均水平更近些,即子代身高有向人群的平均身高回归(regression to the mean)的趋势,这就是“回归的生物学内涵,Galton称该现象为“普遍回归法那么(law of universal regression)。这是很自然的,否那么,岂不一代比一代无限制地远离平均值,导致身高两级分化?,回归的现在含义:完全不同了,回归分析是研究事物或现象之间的数量依存关系,控制/预测,2024/11/18,重庆市疾控慢病所 宿昆,14,1.4 简单线性回归模型续,模型,:,(,随机误差,),2024/11/18,重庆市疾控慢病所 宿昆,15,1.4 简单线性回归模型续,线性回归分析的一般步骤,(1),确定因变量和自变量,(2),绘制散点图,(3),从样本数据出发确定变量之间的数学关系式,并对回归方程的各个参数进行估计,.,(4),对回归方程进行各种统计检验,.:,回归方程的显著性检验;拟合优度检验;残差,(Y,的估计值,与实测值的差,),分析,(y/,残差,-x/X or),(5),利用回归方程进行预测与控制;,2024/11/18,重庆市疾控慢病所 宿昆,16,1.4 简单线性回归模型续,2024/11/18,重庆市疾控慢病所 宿昆,17,1.5,二分类,Logistic,回归,相关,(correlation),与回归,(regression),简介,在大量的医学研究中还需要对两个变量之间的关系进行量化研究,一是确定两个变量间是否有联系及联系的程度如何,二是定量地确定它们之间的互依关系,相关与回归就是研究这种关系的统计方法。,变量间的关系,(1),函数关系,(,确定性关系,):,如,:,圆面积和圆半径,.,(2),统计关系,(,非确定性关系,):,不象函数关系那样直接,但却普遍存在,且有强有弱,如,:,身高与体重,.(,变异,),相关和回归分析的研究对象,:,统计关系,2024/11/18,重庆市疾控慢病所 宿昆,18,1.5 二分类Logistic回归续,Logistic,回归:应变量为分类变量,自变量,:,连续,/,分类变量,研究该分类变量与一组自变量之间的关系,0/1,:治愈,/,未治愈,或患病,/,未患病,有序分类:治愈,/,好转,/,未治愈,无序分类:腺癌、鳞癌、大细胞癌,2024/11/18,重庆市疾控慢病所 宿昆,19,1.5 二分类Logistic回归续,模型中参数的意义,0,为常数项:自变量取值全为,0,时的基线状况,未必有实际意义,i,为偏回归系数,代表固定其它,Xj,时,,Xi,改变一个单位引起,logit(P),平均值的改变量,当其它自变量,(Xj),取值保持不变时,,Xi,取值增加一个单位引起,OR,自然对数值的变化量,因此在使用上,OR,值要远比,i,本身更常用,2024/11/18,重庆市疾控慢病所 宿昆,20,1.5,二分类,Logistic,回归,2024/11/18,重庆市疾控慢病所 宿昆,21,1.5 二分类Logistic回归续,哑变量,偏回归系数表示其它自变量Xj不变,Xi每改变一个单位,所导致logitP的平均变化量,x为连续性/二分类变量:没有问题,x为多分类变量:不太适宜,无序多分类:民族,各族之间不存在大小问题,有序多分类:家庭收入分为高、中、低三档,它们之间的差距无法准确衡量,在以上这些情况时,我们就必须将原始的多分类变量转化为数个哑变量Dummy Variable,,2024/11/18,重庆市疾控慢病所 宿昆,22,哑变量,每个哑变量只代表某两个级别或假设干个级别间的差异,这样得到的回归结果才能有明确而合理的实际意义,对于取值具有n个水平的自变量Xi,可以生成n-1个哑变量,模型中哑变量遵循“同进同出 的原那么,1.5 二分类Logistic回归续,2024/11/18,重庆市疾控慢病所 宿昆,23,1.6,基于秩次的非参数检验,完全随机化设计,单组样本,的基于秩次的非参数检验,完全随机设计,两组独立样本,的基于秩次的非参数检验,配对设计,两组相关样本,的基于秩次的非参数检验,完全随机设计,多组独立样本,的基于秩次的非参数检验,2024/11/18,重庆市疾控慢病所 宿昆,24,1.6 基于秩次的非参数检验续,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业管理 > 商业计划


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!