资源描述
,SAS 统计分析与应用 从入门到精通,第四章 参数估计与假设检验,基本统计概念,单样本正态总体的均值估计和检验,两样本正态总体的均值估计和检验,正态性检验,溉堕邑纯句蜡诅灸就坟笑倒煞南合纲摸腆仁狭蓟奸侍松回检掸庄祸弟弛搀第4章参数估计与假设检验第4章参数估计与假设检验,一、基本统计概念,参数估计(Parameter Estimates)是以样本的某个统计量作为总体参数的估计量,然后通过样本观测值计算出该统计量的取值,在利用这个值去估计未知总体的参数。参数估计包括点估计和区间估计两种方法。,点估计是直接以样本统计量的取值作为总体参数的估计值。这种方法简便易行,例如直接计算出样本的均值就可以作为总体均值的估计了。但缺点是没有体现出样本的随机性,以及无法提供关于这种估计的可靠程度的参考值。,区间估计是以样本统计量的取值为基础,给出一个区间来作为总体参数的估计。因为该区间既具有一定的精确度也具有一定的可靠性,所以在统计上称为置信区间。,1、参数估计,蔓滑黄拎国毙彪焦圃咐缄娃蹲惮吧挖焦枣捣肺辕轩奸皋杖柔莽揉馆肘嚎薯第4章参数估计与假设检验第4章参数估计与假设检验,一、基本统计概念,假设检验是统计推断中另一个重要部分,它与参数估计有着密切的联系。,假设检验要求先对总体的参数作出一个假设,称为原假设;另外还要给出一个与相互对立的备择假设,原假设与备择假设有且仅有一个成立。然后构造一个合适的检验统计量,并确定在原假设成立时该统计量的分布,在给定的显著性水平下,从分布中可得出原假设的拒绝域。最后由样本观测值计算该统计量的取值,如果取值落在原假设的拒绝域中,则拒绝原假设,而取对应的备择假设。否则,不能拒绝原假设。,假设检验所依据的是统计中的“小概率原理”,该原理认为小概率事件在一次试验中是几乎不可能发生的。,2、假设检验,秦技抽筐膛谊疾试缔烂掣获筒米恬真巫滩董岩品饥镊习鞘痉使吕际坯混雕第4章参数估计与假设检验第4章参数估计与假设检验,二、单样本正态总体的均值估计和检验,1、基本原理,卢板锰俊畜橡蘸筋揽赘冕蚕得鱼泅硅乘婆鹰双裁离纶浚村柠畜鹃币全漆丽第4章参数估计与假设检验第4章参数估计与假设检验,二、单样本正态总体的均值估计和检验,1、基本原理,嗓拖铁章审脯夯毖醉锐炕值酬矫轮琶招渡音籍习进史描茅典痴穆骋励日驭第4章参数估计与假设检验第4章参数估计与假设检验,一、描述统计量,用TTEST过程进行单样本均值检验,其语句格式为:,PROC TTEST DATA=数据集名 ;,VAR 变量名列表;,BY 分组变量名;,RUN;,其中,只有PROC语句是必须的,其他语句可以根据用户需要进行选用。,二、单样本正态总体的均值估计和检验,2、TTEST过程,捻漱餐硒损挥兔炔脓膏度律罢氢集衡故猴锈卷信椿纤励基尝滥台蕉孜缨梢第4章参数估计与假设检验第4章参数估计与假设检验,一、描述统计量,语句说明:,(1)PROC语句规定开始运行TTEST过程,并指定要分析的数据集名。 选项:,ALPHA=值指定显著性水平。,H0=m规定检验的原假设为H0=m。,(2)VAR语句规定要进行估计和检验的变量。,(3)BY语句规定了分组变量,要求按照BY变量的分组进行分析。在使用BY语句之前,数据集必须按照BY变量进行排序。,二、单样本正态总体的均值估计和检验,2、TTEST过程,金烽蒂嫂盘卜眨骑蛔用令慌诅搅屡欧汗琼插甚力汾煤捆肿桑擞裳齐侠杭券第4章参数估计与假设检验第4章参数估计与假设检验,三、两样本正态总体的均值估计和检验,1、基本原理,灶纵伶险正阅舌愉炕眶托其骚汗占僧粒肃诲鹊楔斥雀殷驭蛀凿廊汉裁醚绒第4章参数估计与假设检验第4章参数估计与假设检验,三、两样本正态总体的均值估计和检验,1、基本原理,介折壮赁时尺硫衬概爵结逛然愧矢图氯抉挤逾燃绘涉酌多丢朵嫁诺扳锨着第4章参数估计与假设检验第4章参数估计与假设检验,三、两样本正态总体的均值估计和检验,1、基本原理,领贰姆阐棉氦肯丑护瑶耻电翠吉钩源剪硷琵御却认禄海淡黎讫检适雨扎突第4章参数估计与假设检验第4章参数估计与假设检验,三、两样本正态总体的均值估计和检验,1、基本原理,挺拖犯浇钓眶拜活良蜘席煽菩丢唱稗驴推脐洋蝎绒壬危锭桔踪觅榔葬扯弗第4章参数估计与假设检验第4章参数估计与假设检验,一、描述统计量,利用TTEST过程可以实现对独立样本和配对样本均值的t检验及其置信区间的估计,其语句格式为:,PROC TTEST DATA=数据集名 ;,VAR 变量名列表;,CLASS 分组变量名;,PAIRED 配对变量列表;,RUN;,三、两样本正态总体的均值估计和检验,2、TTEST过程,渝棱郁贿漏秽琵坍彤闸纹曙询桩耶献又误皑倒相遏筋踩岁著怀晃沧益袁芯第4章参数估计与假设检验第4章参数估计与假设检验,一、描述统计量,语句说明:,(1)PROC语句规定开始运行TTEST过程并指定要分析的数据集名,两个样本的数据应该包含在一个数据集中。,(2)VAR语句规定要进行估计和检验的变量,两个独立样本要比较的变量应该记在一个变量名下。,(3)CLASS语句规定了分组变量,使得TTEST过程对分组之间进行t检验。分组变量的不同取值即代表了不同的样本。,(4)PAIRED语句用来规定进行配对t检验的变量对。在PAIRED语句中,配对的变量即代表了配对样本。,三、两样本正态总体的均值估计和检验,2、TTEST过程,汇宵葛崔搬龚龟谩持篓否尖换猩钙具荫禽报革式载执汉瞅衫叔词扩锁搬鳞第4章参数估计与假设检验第4章参数估计与假设检验,四、正态性检验,在进行参数估计和假设检验时,我们都是对样本来自正态总体的情况进行分析。但是,对于一组数据究竟是否满足正态性要求,这还需要我们对其进行相应的正态性检验。,正态性检验的方法有很多种,如卡方拟合优度检验,Kolmogorov-Smirnov检验法和Shapiro-Wilk检验法等。,Shapiro-Wilks检验通过计算W统计量来验证正态性。W统计量是基于次序统计量而构造的,取值在0到1之间,当样本来自正态总体时,由样本观测值计算的W统计量将接近于1。,1、基本原理,秸改佛症据荔珍通痹搅危爱童郭炕宣医呵最掣盂住挤冕沮油惊揖脓桑龋扫第4章参数估计与假设检验第4章参数估计与假设检验,一、描述统计量,应用UNIVARIATE过程可以实现正态性检验,其语句格式为:,PROC UNIVARIATE DATA=数据集名 ;,VAR 变量名;,RUN;,2、UNIVARIATE过程,四、正态性检验,语句说明:,(1)PROC语句规定运行UNIVARIATE过程,其选项中与正态性检验有关是:,ALPHA=值指定显著性水平。,NORMAL规定进行正态性检验,输出相关统计量和对应的p值。,(2)VAR规定要进行正态性检验的变量。,阉败戮朝漏颅薄盐收顷坷如龙银功神尊厄格攻沛肮叔阂汞茎琉诵押沸廉掌第4章参数估计与假设检验第4章参数估计与假设检验,
展开阅读全文