大学现代统计分析方法概述课件

上传人:7**** 文档编号:251907481 上传时间:2024-11-11 格式:PPTX 页数:20 大小:345.07KB
返回 下载 相关 举报
大学现代统计分析方法概述课件_第1页
第1页 / 共20页
大学现代统计分析方法概述课件_第2页
第2页 / 共20页
大学现代统计分析方法概述课件_第3页
第3页 / 共20页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2019/1/31,http:/ 从高斯(C.F.Gauss),2,http:/ 对统计分析方法的应用应从实际,4,常用统计分析方法举例,正态分布,区间估计和假设检验,回归分析,方差分析,http:/ 回归分析方差,5,正态分布,正态分布(,normal distribution,)又名高斯分布(,Gaussian distribution,),是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。因其曲线呈钟形,因此人们又经常称之为钟形曲线。,其数学定义如下:,若随机变量,X,的密度函数为,则称,X,服从正态分布,称,X,为正态变量,记作,。,正态分布,的分布函数为,http:/ 正态分布(normal distribut,6,正态分布的历史,正态分布最早是棣莫佛在,1734,年发表的一篇关于二项分布文章中提出的。拉普拉斯在,1812,年发表的,分析概率论,(,Theorie Analytique des Probabilites,)中对棣莫佛的结论作了扩展。现在这一结论通常被称为棣莫佛拉普拉斯定理。,拉普拉斯在误差分析试验中使用了正态分布。勒让德于,1805,年引入最小二乘法这一重要方法;而高斯则宣称他早在,1794,年就使用了该方法,并通过假设误差服从正态分布给出了严格的证明。,http:/ 正态分布是很多统计方法的理论基础,正,8,区间估计和假设检验,参数的区间估计和假设检验是两种最重要的统计推断形式,掌握这两种方法对做出正确的统计推断至关重要,区间估计,设,是总体的一个参数,,是样本,所谓区间估计就是要找两个统计量,和,,使得,,在得到样本观测值之后,就把,估计在区间,内,假设检验,假设检验是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。其基本原理是先对总体的特征做出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受做出推断,http:/ 参数的区间估计和假设检验是两种最,9,区间估计,置信区间:,设,是总体的一个参数,其参数空间为,,,是来自该总体的样本,,,若有两个统计量,和,若对任意的,,有,,则称随机区间,为,的置信水平,的置信区间,对给定的一个,为,置信水平,的频率解释:,在大量重复使用,的置信区间,时,每次得到的样本观测值是不同的,,从而每次得到的区间估计值也是不一样的,对一次具体的观测值而言,,可能在,内,也可能不在。平均而言,在这大量的区间估计观测值中,至少有,包含,http:/ 假设检验的基本思想是小概率反证法思,11,参数的区间估计与假设检验的关系,参数的区间估计与假设检验的关系,参数的区间估计与参数的假设检验虽然提法不同,但解决问题的途径是相通的,统计推断的思想方法是一样的,都是基于样本信息来推断总体的性质,即用部分来推断总体。它们都是选取一个统计量,然后使这个统计量落在某个已知区间上的概率很小由此得到的结果,1,、参数估计解决的是多少,(,或范围,),问题,假设检验则判断结论是否成立。前者解决的是定量问题,后者解决的是定性问题。,2,、两者的要求各不相同。区间估计确定在一定概率保证程度下给出未知参数的范围。而假设检验确定在一定的置信水平下,未知参数能否接受已给定的值。,3,、两者对问题的了解程度各不相同。进行区间估计之前不了解未知参数的有关信息,而假设检验对未知参数的信息有所了解,但做出某种判断无确切把握。因而在实际应用中,究竟选择哪种方法进行统计推断,需要根据实际问题的情况确定相应的处理方法,二者之间的联系,二者之间的区别,http:/ 参数的区间估计与假设检验的关,12,回归分析,回归分析的概念及分类,回归分析(,regression analysis),是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。运用十分广泛,回归分析按照涉及的自变量的多少,可分为一元回归分析和多元回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析,回归分析提出的背景,早在,19,世纪,英国生物学家兼统计学家高尔顿在研究父与子身高的遗传问题时,观察了,1078,对父与子,用,x,表示父亲身高,,y,表示成年儿子的身高,发现将(,x,y,)点在直角坐标系中,这,1078,个点基本在一条直线附近,并求出了该直线的方程,这便是子代的平均高度有向中心回归的意思,使得一段时间内人的身高相对稳定。之后回归分析的思想渗透到数理统计的其他分支中。随着计算机的发展,各种统计软件的出现,回归分析的应用越来越广泛,http:/ 回归分析的概念及分类 回归分析(regres,13,回归分析的主要内容:,从一组数据出发确定某些变量之间的定量关系式,即建立数学模型并估计其中的未知参数。估计参数的常用方法是最小二乘法。,对这些关系式的可信程度进行检验。,在许多自变量共同影响着一个因变量的关系中,判断哪个(或哪些)自变量的影响是显著的,哪些自变量的影响是不显著的,将影响显著的自变量选入模型中,而剔除影响不显著的变量,通常用逐步回归、向前回归和向后回归等方法。,利用所求的关系式对某一生产过程进行预测或控制。回归分析的应用是非常广泛的,统计软件包使各种回归方法计算十分方便,回归分析的应用:,应用回归分析模型可以探求出两个变量之间的影响关系,最初时在身高遗传问题上应用一元线性回归分析模型,随着社会的不断发展,系统的复杂性不断增加,应用一元线性回归分析已经不能满足需求,于是出现了多元线性回归分析以及多元非线性回归分析模型。这些分析模型在分析复杂系统下一种现象的影响因素方面有很好的应用性,目前研究的方面包括临床统计数据分析、多因素影响下的回归分析、经济增长下的多因素影响分析等,涉及到经济社会发展的多个方面,http:/ 所谓一元线性回归分析,就是研究具,15,方差分析,方差分析(,Analysis of variance,,简称,ANOVA,)是将总变异分裂为各个因素的相应变异,做出其数量估计,从而发现各个因素在变异中所占的重要程度,而且除了可控制因素所引起的变异后,其剩余变异又可提供试验误差的准确而无偏的估计,作为统计假设测验的依据,方差分析是判断多组数据(,K3,)之间平均数差异是否显著的一种假设测验方法。,2,个样本平均数可用,t,或,U,测验的方法来评定其差数的显著性。如果有,K,个平均数,且,K3,,若仍然用两两比较的方法来测验,则需要作,K(K-1)/2,次测验,如果,K,10,,则需要,45,次测验,不但测验程序繁琐,而且在理论上,其显著水平已经扩大了。因此,对于多样本平均数的假设测验,需采用一种更为合适的统计方法,即方差分析法(,Fisher,1923,),http:/ 方差分析(Analysis of vari,16,方差分析的分类,方差分析主要有单因素方差分析、多因素方差分析以及协方差分析三种,单因素方差分析是用来研究一个控制变量的不同水平是否对观测变量产生了显著影响。这里,由于仅研究单个因素对观测变量的影响,因此称为单因素方差分析,单因素方差分析,在观测变量总离差平方和中,如果组间离差平方和所占比例较大,则说明观测变量的变动主要是由控制变量引起的,可以主要由控制变量来解释,控制变量给观测变量带来了显著影响;反之,如果组间离差平方和所占比例小,则说明观测变量的变动不是主要由控制变量引起的,不可以主要由控制变量来解释,控制变量的不同水平没有给观测变量带来显著影响,观测变量值的变动是由随机变量因素引起的,单因素方差分析原理:,http:/ 方差分析主要有单因素方差分析、多因素方差分析,17,单因素方差分析基本步骤:,1,、提出原假设:,H,0,无差异;,H,1,有显著差异,2,、选择检验统计量:方差分析采用的检验统计量是,F,统计量,即,F,值检验。,3,、计算检验统计量的观测值和概率,P,值:该步骤的目的就是计算检验统计量的观测值和相应的概率,P,值。,4,、给定显著性水平,并做出决策,单因素方差分析的进一步分析:,在完成上述单因素方差分析的基本分析后,可得到关于控制变量是否对观测变量造成显著影响的结论,接下来还应做其他几个重要分析,主要包括方差齐性检验、多重比较检验。,方差齐性检验是对控制变量不同水平下各观测变量总体方差是否相等进行检验。,SPSS,单因素方差分析中,方差齐性检验采用了方差同质性(,homogeneity of variance,)检验方法,其原假设是:各水平下观测变量总体的方差无显著差异。,多重比较检验利用了全部观测变量值,实现对各个水平下观测变量总体均值的逐对比较。由于多重比较检验问题也是假设检验问题,因此也遵循假设检验的基本步骤。,http:/ 基本思想:多因素方差分析用来研究两个及,19,协方差分析,基本思想:不论是单因素方差分析还是多因素方差分析,控制因素都是可控的,其各个水平可以通过人为的努力得到控制和确定。但在许多实际问题中,有些控制因素很难人为控制,但它们的不同水平确实对观测变量产生了较为显著的影响,原理:协方差分析将那些人为很难控制的控制因素作为协变量,并在排除协变量对观测变量影响的条件下,分析控制变量(可控)对观测变量的作用,从而更加准确地对控制因素进行评价,http:/ 基本思想:不论是单因素方差分析还是多因素方,20,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!