科研统计分析的原理与步骤课件

上传人:7**** 文档编号:250529517 上传时间:2024-11-03 格式:PPT 页数:33 大小:171.81KB
返回 下载 相关 举报
科研统计分析的原理与步骤课件_第1页
第1页 / 共33页
科研统计分析的原理与步骤课件_第2页
第2页 / 共33页
科研统计分析的原理与步骤课件_第3页
第3页 / 共33页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,科研统计分析的原则与步骤,刘启贵,科研统计分析的原则与步骤刘启贵,科研设计,在研究问题确立后,研究者按研究目的而进行科研设计,选择和确定具体的研究方法,科研设计也是科学研究中具体内容和方法的设想及计划安排,从而获得有意义的资料和结果。研究设计的主要内容有:,科研设计 在研究问题确立后,研究者按研究目的而,科研设计,实验设计其特点有人为的干预,即通过施加一个或多个因素,通过观实验观察评价这些因素那个起作用。,调查设计其特点无人为的干预,即用设计好的调查表,去了解现实的情况,分析相关因素的关系。,科研设计实验设计其特点有人为的干预,即通过施加一个或多个因,4,统计学分析,医学数据的统计处理涉及到医学专业知识、统计专业知识、处理数据的经验和技巧等,是一项综合的工作。,在数据处理过程中,,原始数据的采集和录入,数据的管理,恰当的选取统计方法,熟练使用统计软件等,,,都是必须重视的关键环节。,4统计学分析医学数据的统计处理涉及到医学专业知识、统计专业知,5,例,1,:,冠心病病人,编脂肪摄体重家族总胆,号入量指数史固醇,非冠心病人,编脂肪摄体重家族总胆,号入量指数史固醇,1,低,2,高,3,中, ,30,高,26.5,27.0,24.5,23.4,有,7.88,有,9.16,无,5.67,有,6.83,1,低,2,中,3,中, ,30,高,24.1,23.5,24.6,25.2,无,5.68,有,3.21,无,3.15,无,3.06,5例1:冠心病病人非冠心病人,6,或如下形式,:,编脂肪摄体重家族总胆冠心病,号入量指数史固醇否,1,低,2,高,3,中, ,30,高,1,低,2,中,3,中, ,30,高,26.5,27.0,24.5,23.4,24.1,23.5,24.6,25.2,有,7.88,1,有,9.16,1,无,5.67,1, ,有,6.83,1,无,5.68,0,有,3.21,0,无,3.15,0, ,无,3.06,0,6或如下形式:编脂肪摄体重家族总胆冠心病1,7,例,2,:,WBC,前 后,体温,前 后,病情,前后,阴阳性,前后,12.56,10.34,9.52,8.47,8.56,7.34,5.52,6.47,38.5,37.9,36.8,39.2,36.5,.37.0,35.9,36.2,7例2:WBC体温病情 阴阳性12.568.5,8,例,3,W,B,C,治疗前治疗后,1,天治疗后,3,天治疗后,7,天,12.56,10.34,9.52,8.47,8.56,7.34,7.52,6.47,6.56,6.34,7.52,7.47,5.56,7.34,6.52,6.40,8例3WBC12.,原始资料的收集和处理,通过各种测量、问卷、调查和观察等方法从研究对象处直接收集到的科研资料,称之为原始资料,也叫第一手资料,记录必须可靠,不可自行更改并应完整保存。在原始资料整理后再进一步分析资料的价值和意义。,原始资料的收集和处理 通过各种测量、问卷、调查和,原始资料的收集和处理,通常研究中得到的资料可分为计量资料(定量资料)和计数资料(定性资料),介于其中的为等级资料(半定量资料)。统计学分析定量资料和定性资料时选用的检验方法和计算公式都不同。分析整理研究资料多用计算的方法,如用百分率()、均数,、,标准差,、,标准误,还可用统计图和表格来归纳研究结果。,原始资料的收集和处理通常研究中得到的资料可分为计量资料(,原始资料的收集和处理,资料的要求,完整、准确、及时,原始资料的收集和处理资料的要求,原始数据的记录形式,医学研究的原始数据常列成类似下表的二维结构,即行与列结构的数据集形式。在表中,每一行称为一个记录(,record),,或一个观察单位(,case);,每一列称为一个变量(,variable),,用以表示变量、项目或观察指标等。,原始数据的记录形式 医学研究的原始数据常列成类似,科研统计分析的原理与步骤课件,原始数据录入,在进行统计分析前,原始数据需录入计算机。录人的文件类型大致有:,数据库文件,如,dBASE、FoxBASE、Lotus、EPI info、Excel,文件。文本文件(如,word,文件、,WPS,文件等)等,统计应用软件的相应文件,如,SPSS,数据文件、,SAS,数据文件、,STATA,数据文件等。目前,上述文件类型绝大多数都可以相互转换。,原始数据录入 在进行统计分析前,原始数据需录入计算机。录人,原始数据录入,录人数据时,应遵循,便于录入,便于核查,便于转换,便于分析,的原则。,1.便于录入是指尽可能地减少录入工作量,2.,便于核查是指一定要设有标识变量,以方便数据核查,3.,便于转换是指录入数据时要考虑不同软件对字节和字符的要求,4.,便于分析是指每项研究最好录成一个数据文件,录入的格式最好满足各种统计分析的需要,这样才能保证分析数据时的高效和全面。,原始数据录入录人数据时,应遵循便于录入,便于核查,便于转换,,数据处理中的几个问题,数据核查,数据录入后,首先须对数据进行核查,以确保录入数据的准确性和真实性。核查准确性可分两步进行。,第一步 逻辑检查,通过运行统计软件中的基本统计量过程,列出每个变量的最大值和最小值,如果某变量的最大值或最小值不符合逻辑,则数据有误。,数据处理中的几个问题 数据核查 数据录入后,首先须对数据,数据处理中的几个问题,第二步 数据核对,将原始数据与录入的数据一一核对,错者更正。有时,为慎重起见,采用双份录入的方式,然后用程序作一一比较,不一致者一定是录错的数据。,数据核查的另一项任务是对数据的真实性作出初步判断,数据处理中的几个问题第二步 数据核对,将原始数据与录入的数,数据处理中的几个问题,离群数据的处理,当个别数据与群体数据严重偏离时,被称为离群数据(,outlier,),或极端数据(,extreme value,)。,统计软件一般都有判断离群数据的方法。判断离群数据有多种方法,最常用的方法是采用箱式图来判定.,数据处理中的几个问题离群数据的处理 当个别数据与群体数据严,科研统计分析的原理与步骤课件,数据处理中的几个问题,若有离群数据出现,可分为两种情况处理。,1.如果确认数据有逻辑错误,又无法纠正,可直接删除该数据。例如,若某一数据中某病例的身高变量为,“,1755,”,cm,,,且原始记录亦如此,又无法再找到该病例时,显然这是一个错误的记录,只能删除。,数据处理中的几个问题若有离群数据出现,可分为两种情况处理。,2.若数据并无明显的逻辑错误,可将该数据剔除前后各做一次分析,若结果不矛盾,则不剔除;若结果矛盾,并需要剔除,必须给以充分合理的解释,例如用何种方法确定偏离数据,该数据在实验中何种干扰下产生等,2.若数据并无明显的逻辑错误,可将该数据剔除前后各做一次分析,数据处理中的几个问题,统计方法前提条件的检验,应用参数方法进行假设检验往往要求数据满足某些前提条件,如两个独立样本比较,t,检验或多个独立样本比较的方差分析,均要求方差齐性,因此需要做方差齐性检验。如果要用正态分布法估计参考值范围,首先要检验资料是否服从正态分布。在建立各种多重回归方程时,常需检验变量间的多重共线性和残差分布的正态性。,数据处理中的几个问题 统计方法前提条件的检验,科研资料的分析,研究问题的目的在于认识客观规律。试验只在少数受试者身上(样本)进行,而结论却要推至研究对象的全体(总体)。由于生物的变异性大,个体差异普遍存在,所以研究资料只有通过统计学方法来进行分析才能找出规律性的答案,得到有意义的结论。,科研资料的分析 研究问题的目的在于认识客观规律。试验,选择统计方法的思路,数据处理中,正确选择统计方法至关重要。选择统计方法可以沿着以下思路进行:,第一个层面:看属于三种资料类型中的哪,一种;,第二个层面:看单因素还是多因素;,第三个层面:看单样本、两样本或多样本;,第四个层面:看是否是配对或配伍设计;,第五个层面:看是否满足检验方法所需的,前提条件;,选择统计方法的思路数据处理中,正确选择统计方法至关重要。选择,分析目的,比较差异:比较两组或多组均值、率或中位数有无差异(单因素单指标)。,研究相关与回归:每两个变量间的变化是否有关系,其数量上的函数形式如何(两个指标或多个指标之间关系)。,多因素分析:研究多个因素对一个变量的影响。,分析目的 比较差异:比较两组或多组均值、率或中位数有无差异(,计量资料或等级资料比较差异,t,检验,t,检验,F,检验,配对,t,检验,配伍,F,检验,秩和检验,偏态分布或等级资料,正态分布,频数表,5点法,最小值,P25,M,P75,最大值,正态分布,等级资料,偏态分布,统计推断,统计描述,计量资料或等级资料,计量资料或等级资料比较差异 t检验秩和检验偏态分布或等级资料,计数或分类资料比较差异,样本与总体率的比较,u,样本率与构成的比较,2,配对差异性比较,2,趋势性,2,检验,率,构成比,相对比,(,OR,值,或,RR,值),统计推断,统计描述,计数资料,计数或分类资料比较差异 样本与总体率的比较u率统计推断统计描,相关与回归,当资料是正态分布时:研究两者在变化时的关联或趋势用相关系数,r,,若问数量上的函数关系用普通线性回归。,当资料不是正态分布时:研究两者在变化时的关联或趋势用等级相关,r,s,,,若问数量上的函数关系用秩回归。,相关与回归当资料是正态分布时:研究两者在变化时的关联或趋势用,相关与回归,曲线回归分析 分析两变量的回归关系时,若两变量呈曲线趋势,可按曲线类型选择指数曲线、多项式曲线、生长曲线、,Logistic,曲线等。也可选用非线性回归分析方法。,若因变量,Y,为生存时间,并含有截尾数据,自变量只有一个处理因素,可选用,Kaplan-Meier,法做生存分析,。,相关与回归曲线回归分析 分析两变量的回归关系时,若两变量呈,多变量分析,多变量资料大致可规结为有无因变量两种类型。,因变量,Y,是连续性正态分布,用多重线性回归或多重线性逐步回归。,因变量,Y,是两分类的(发生与不发生),,且以分析危险因素为主要目的,,用,Logistic,回归分析。,若因变量,Y,为分类变量(二分类或多分类),且以判别分类为主要目的,自变量近似满足多元正态分布,可选用选用判别分析,。,因变量,Y,是时间变量(随访资料),用,COX,回归分析。,多变量分析多变量资料大致可规结为有无因变量两种类型。,多变量分析,无因变量的多变量分析 欲将变量或观察单位划分为性质相近的,k,类,可选用聚类分析。若将,n,个观察单位聚为,k,类,则选样品(,Q,型)聚类方法;若将,m,个观察单位聚为,k,类,则选指标(,R,型)聚类方法,为达到既降低变量维数,又对变量进行分类的目的,选用主成份分析或因子分析。,多变量分析无因变量的多变量分析 欲将变量或观察单位划分为性,归纳,选统计方法,1,看目的,2,看资料,3,看条件,没有对错之分,只有效率高低的区别,因此选用效率不高或低的方法,就是不恰当的,应选用高效率的方法,提高研究结论的可靠性与质量。,归纳选统计方法,谢 谢,谢 谢,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!