多元描述统计分析和均值的比较检验课件

上传人:494895****12427 文档编号:241288033 上传时间:2024-06-15 格式:PPT 页数:64 大小:1.27MB
返回 下载 相关 举报
多元描述统计分析和均值的比较检验课件_第1页
第1页 / 共64页
多元描述统计分析和均值的比较检验课件_第2页
第2页 / 共64页
多元描述统计分析和均值的比较检验课件_第3页
第3页 / 共64页
点击查看更多>>
资源描述
多元描述统计分析和均值的比较检验多元描述统计分析和均值的比较检验地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。教师教师主讲教师:沈主讲教师:沈琪琪E-mail:课程介绍课程介绍6/15/20242教师课程介绍8/9/20232地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。教材教材多元统计分析与多元统计分析与SPSS应用,汪冬华等主编,华东理工大学应用,汪冬华等主编,华东理工大学出版社,出版社,2010年年教参书籍教参书籍应用统计学,张建同、孙昌言、王世进应用统计学,张建同、孙昌言、王世进主编,清华大学出版主编,清华大学出版社,社,2010年。年。应用多元统计分析,(德)沃尔夫冈应用多元统计分析,(德)沃尔夫冈哈德勒,(比)利奥波哈德勒,(比)利奥波德德西马西马著,陈诗一著,陈诗一译,北京大学出版社,译,北京大学出版社,2011年年。应用统计学,马庆国应用统计学,马庆国编著,科学出版社,编著,科学出版社,2005年。年。应用多元统计分析应用多元统计分析朱建平朱建平主编,科学出版社,主编,科学出版社,2006年。年。多元统计分析,何晓群多元统计分析,何晓群编著,人民大学出版社,编著,人民大学出版社,2008年。年。课程介绍课程介绍6/15/20243教材课程介绍8/9/20233地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。课堂资料下载课堂资料下载内容:补充资料、课件、案例讨论、教学大内容:补充资料、课件、案例讨论、教学大 纲、复习要点等。纲、复习要点等。公共公共Email:M密码:密码:Msta2013课程介绍课程介绍6/15/20244课堂资料下载课程介绍8/9/20234地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。内容安排内容安排第一讲第一讲多元描述统计分析和均值的比较检验多元描述统计分析和均值的比较检验 第二讲第二讲方差分析方差分析 第三讲第三讲相关分析相关分析 第四讲第四讲聚类分析聚类分析 第五讲第五讲判别分析判别分析 第六第六讲主成分分析主成分分析 第七第七讲因子分析因子分析 第八第八讲典型相关分析典型相关分析 实验教学实验教学课堂教学中穿插实验教学课堂教学中穿插实验教学教学内容安排教学内容安排课程介绍课程介绍6/15/20245内容安排第一讲多元描述统计分析和均值的比较检验第二讲方差分地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。n多元统计分析是运用数理统计方法来研究解决多指标问题的理论和方法。n近30年来,随着计算机应用技术的发展和科研生产的迫切需要,多元统计分析技术被广泛地应用于多个领域,已经成为解决实际问题的有效方法。n随着Internet的日益普及,各行业、单位生成、收集、存储和处理数据的能力大大提高,数据量与日俱增,大量复杂信息层出不穷。引言引言6/15/20246多元统计分析是运用数理统计方法来研究解决多指标问题的理论和方地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。引言引言n显然,大量信息在给人们带来方便的同时也带显然,大量信息在给人们带来方便的同时也带来一系列问题。来一系列问题。l信息量过大,超过了人们掌握、消化的能力;l一些信息真伪难辩;l信息组织形式的不一致性导致难以对信息进行有效统一处理;l传统的数据库技术和数据处理手段已经不能满足要求;l在Internet中进行信息的查找如大海捞针。6/15/20247引言显然,大量信息在给人们带来方便的同时也带地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。引言引言n多元分析的开端1928年Wishart发表论文多元正态总体样本协差阵的精确分布;n20世纪30年代R.A.Fisher、H.Hotelling、S.N.Roy、许宝騄等人作了一系列得奠基性工作;n20世纪40年代在心理、教育、生物等方面有不少得应用,但由于计算量大,使其发展受到影响;n20世纪50年代中期,随着电子计算机得出现和发展,使多元分析方法得到广泛得应用;n20世纪60年代通过应用和实践又完善和发展了理论,由于新的理论、新的方法不断涌现又促使它的应用范围更加扩大;n20世纪70年代初期在我国才受到各个领域的极大关注。n在20世纪末与本世纪初,多元统计与人工智能和数据库技术相结合,已在经济、商业、金融等行业得到了成功的应用。6/15/20248引言多元分析的开端1928年Wishar地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。引言引言一一统计学的生命力在于应用统计学的生命力在于应用统计学的发展过程中可以看出统计学产生于应统计学的发展过程中可以看出统计学产生于应用,它在应用中诞生,在应用中成熟、独立,在应用,它在应用中诞生,在应用中成熟、独立,在应用中扩充自身的方法内容,同时扩展了应用领域,用中扩充自身的方法内容,同时扩展了应用领域,又在应用中与其他学科紧密结合形成新的边缘学科。又在应用中与其他学科紧密结合形成新的边缘学科。它的生命力在于应用。它的生命力在于应用。6/15/20249引言一统计学的生命力在于应用地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。二二多元统计分析方法的应用多元统计分析方法的应用 引言引言6/15/202410二多元统计分析方法的应用引言地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。引言引言应用实例城镇居民消费水平通常用八项指标来描述,如人均粮食支出、人均副食支出、人均烟酒茶支出、人均衣着商品支出、人均日用品支出、人均燃料支出、人均非商品支出。这八项指标存在一定的线性关系。为了研究城镇居民的消费结构,需要将相关强的指标归并到一起,这实际就是对指标进行聚类分析。6/15/202411引言应用实例城镇居民消费水平通常用八项指标来地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。在企业经济效益的评价中,涉及到的指标往往很多,如百元固定资产原值实现产值、百元固定资产原值实现利税、百元资金实现利税、百元工业总产值实现利税、百元销售收入实现利税、每吨标准煤实现工业产值、每千瓦时电力实现工业产值、全员劳动生产率、百元流动资金实现产值。如何将这些具有错综复杂关系的指标综合成几个较少的因子,既有利于对问题进行分析和解释,又能便于抓住主要矛盾做出科学的评价。可用主成分分析和因子分析法。引言引言应用实例6/15/202412在企业经济效益的评价中,涉及到的指标往往很多,地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。第一讲第一讲(一)多元描述统计分析(一)多元描述统计分析descriptivestatistics沈沈琪琪6/15/202413第一讲(一)多元描述统计分析descriptives地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。描述统计描述统计基本概念n总体总体是根据一定目的确定的所要研究的事物的全体。它是由客观存在的、具有某种共同性质的许多个别事物构成的整体。n总体单位总体单位(简称单位)是组成总体的各个个体。n样本样本是由总体的部分单位组成的集合。n标志标志总体各单位普遍具有的属性或特征。6/15/202414描述统计基本概念总体是根据一定目的确定的所要研究的事物的全地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。n说明现象的某一数量特征的概念也被称为变量变量,变量的具体取值是变量值变量值,统计数据就是统计变量的具体表现。n连续型变量连续型变量是指变量的取值在数轴上连续不断,无法一一列举,即在一个区间内可以取任意实数值。n离散型变量离散型变量是指变量的其取值是整数值,可以一一列举。描述统计描述统计基本概念6/15/202415说明现象的某一数量特征的概念也被称为变量,变量的具体取值是变地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。描述统计描述统计数据n统计数据统计数据是总体单位标志或统计指标的具体数量表现。定类尺度定类尺度定序尺度定序尺度定距尺度定距尺度定比尺度定比尺度6/15/202416描述统计数据统计数据是总体单位标志或统计指标的具体数量表现地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。n横截面数据横截面数据又称为静态数据,它是指在同一时间对同一总体内不同单位的数量进行观察而获得的数据。描述统计描述统计数据n时间序列数据时间序列数据又称为动态数据,它是指在不同时间对同一总体的数量表现进行观察而获得的数据。6/15/202417横截面数据又称为静态数据,它是指在同一时间对同一总体内不同单地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。描述统计描述统计数据n多元数据的表格形式多元数据的表格形式设p个变量来记录事物的特征,对于每个个体或单位,记录下这些变量的测量值。我们用记号表示第i个样本上第j个变量的测量值,即x xij ij=第第j j个变量的第个变量的第i i项测量值项测量值6/15/202418描述统计数据多元数据的表格形式设p个变量来记录事物的特征,地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。描述统计描述统计数据n多元数据的矩阵形式多元数据的矩阵形式X=(xij)np6/15/202419描述统计数据多元数据的矩阵形式X=(xij)np8/9/地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。n例题分析例题分析描述统计描述统计数据消费者物价指数(CPI)是反映与居民生活有关的产品及劳务价格统计出来的物价变动指标,通常作为观察通货膨胀水平的重要指标。商品零售价格指数是反映一定时期内商品零售价格变动趋势和程度的相对数。两者都能为研究市场流通、进行国民经济核算提供依据。6/15/202420例题分析描述统计数据消费者物价指数(CPI)是反映与居民生地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。样本数据的矩阵形式为:描述统计描述统计数据6/15/202421样本数据的矩阵形式为:描述统计数据8/9/202321地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。描述统计描述统计统计量n样本均值样本均值矩阵形式其中,6/15/202422描述统计统计量样本均值矩阵形式其中,8/9/202322地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。n样本协方差样本协方差描述统计描述统计统计量矩阵形式其中,事实上,sjk是变量j和k的协方差当j=k时,sjj是变量j的方差,也常记为sjk=skj,即S是对称矩阵。6/15/202423样本协方差描述统计统计量矩阵形式其中,事实上,sjk是变量地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。n样本相关系数样本相关系数描述统计描述统计统计量矩阵形式其中,R也为对称矩阵6/15/202424样本相关系数描述统计统计量矩阵形式其中,R也为对称矩阵8/地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。描述统计描述统计数据标准化n标准差标准化公式标准差标准化公式其中,此时6/15/202425描述统计数据标准化标准差标准化公式其中,此时8/9/202地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。描述统计描述统计SPSS应用SPSS应用应用6/15/202426描述统计SPSS应用SPSS应用8/9/202326地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。描述统计描述统计统计图表n统计表:统计表:把统计数据按一定的顺序排列在表格上,就形成了统计表。它清楚地、有条理地显示统计资料,直观地反映统计分布特征,是统计分析的一种重要工具。6/15/202427描述统计统计图表统计表:把统计数据按一定的顺序排列在表格上地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。描述统计描述统计统计图表n利用统计图表示数据时,首先要确定数据所属类型是定性数据还是定量数据n定性数据常用的图形表示:l条形图l饼图l环形图n定性数据常用的图形表示:l直方图l茎叶图l箱线图l散点图l气泡图l雷达图6/15/202428描述统计统计图表利用统计图表示数据时,首先要确定数据所属类地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。描述统计描述统计案例分析案例案例6/15/202429描述统计案例分析案例8/9/202329地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。第一讲第一讲(二)均值的比较检验(二)均值的比较检验沈沈琪琪6/15/202430第一讲(二)均值的比较检验沈琪8/9/202330地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。推断样本与总体或者两个总体之间的差异是否显著均值的比较检验均值的比较检验作用6/15/202431推断样本与总体或者两个总体之间的差异是否显著均地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。均值的比较检验均值的比较检验实例n在企业市场结构的研究中,起关键作用的指标有市场分额、企业规模、资本收益率、总收益增长率等。为了研究市场结构的变动,研究人员通常需要将调查所得的数据与历史数据进行比较。通过均值比较检验,就能比较出现在的市场结构与过去是否存在显著性差异。n在临床上,医生需要对病人治疗前后的状况进行控制。例如通过对比一组病人使用某种药物后的身体指标,可以判断该药物对病人是否有效,效果是否显著。6/15/202432均值的比较检验实例在企业市场结构的研究中,起关键作用的指标地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。均值的比较检验均值的比较检验内容一一单一样本的均值检验单一样本的均值检验二二独立样本的均值检验独立样本的均值检验三三配对样本的均值检验配对样本的均值检验6/15/202433均值的比较检验内容一单一样本的均值检验二独立样本地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。-检验样本所在总体的均值与给定的已知值之间是否存在显著性差异单一样本均值的检验单一样本均值的检验6/15/202434-检验样本所在总体的均值与给定的已知值之间是地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。n只对单一变量的均值加以检验n如检验今年新生的统计学平均成绩是否和往年有显著差异;推断某地区今年的人均收入与往年的人均收入是否有显著差异等等。n要求样本数据来自于服从正态分布的单一总体n假设的基本形式:n当然也可以有单侧检验的假设形式。单一样本均值的检验单一样本均值的检验6/15/202435只对单一变量的均值加以检验单一样本均值的检验8/9/2023地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。单一样本均值的检验单一样本均值的检验基本步骤n提出假设n确定检验统计量n若总体方差已知,此时可构造标准正态分布Z检验统计量n通常总体方差都是未知的,此时总体方差由样本方差代替,采用t分布构造t检验统计量n其中S为样本标准差,定义为n做出统计推断6/15/202436单一样本均值的检验基本步骤提出假设8/9/202336地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。!注意!注意在SPSS中,给出的是总体方差未知时的t检验统计量,因为通常总体方差是未知的。单一样本均值的检验单一样本均值的检验6/15/202437!注意在SPSS中,给出的是总体方差未知时的t检验统计量,因地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。n以学生的身高为例,已知某年级15个学生的身高数据,如表所示,检验其平均身高是否与整个年级的平均身高165cm相同序号序号序号序号1 12 23 34 45 56 67 78 89 9101011111212131314141515身高身高身高身高17175 517174 416168 817173 316164 416169 917170 016166 615158 816165 515156 615152 215156 616168 816160 0单一样本均值的检验单一样本均值的检验案例6/15/202438以学生的身高为例,已知某年级15个学生的身高数据,如表所示,地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。n提出假设:n确定检验统计量:由于总体方差未知,因此采用t检验统计量n经计算得:=164.93,S=7.126,df=15-1=14,则n该例为双侧检验,显著性水平=0.05,查t分布表可得临界值。,说明t值落在接受区域内,即原假设与样本描述的情况无显著差异,不能拒绝原假设。因此可以得出结论:15个学生的平均身高与整个年级的平均身高无显著差异。单一样本均值的检验单一样本均值的检验案例6/15/202439提出假设:单一样本均值的检验案例8/9/202339地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。-比较两个独立没有关联的正态总体的均值是否有显著性差异独立样本均值的检验独立样本均值的检验6/15/202440-比较两个独立没有关联的正态总体的均值是否有地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。n独立样本的均值检验,实质是总体均值是否相等的显著性检验n如分析两个地区居民的人均收入、人均消费等指标是否存在显著性差异;男生与女生的身高是否存在显著性差异。n要求两个样本来自的总体为正态分布,且相互独立n如果两总体相互独立,则分别从两总体得到的样本也相互独立。n因为要检验两总体的均值是否相等,需要通过样本进行检验,所以称为独立样本的均值检验。独立样本均值的检验独立样本均值的检验6/15/202441独立样本的均值检验,实质是总体均值是否相等的显著性检验独立样地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。n提出假设n确定检验统计量n需要分为总体方差、是否已知两种情况进行讨论n做出统计推断独立样本均值的检验独立样本均值的检验步骤6/15/202442提出假设独立样本均值的检验步骤8/9/202342地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。n若总体方差已知,可构造标准正态分布Z检验统计量独立样本均值的检验独立样本均值的检验检验统计量6/15/202443若总体方差已知,可构造标准正地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。独立样本均值的检验独立样本均值的检验检验统计量n若总体方差未知,可构造t检验统计量n当时,构造的t检验统计量为:nn式中,、分别为两样本标准差。6/15/202444独立样本均值的检验检验统计量若总体方差地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。n当时,构造的t检验统计量为:n检验统计量仍服从t分布,其修正的自由度为:独立样本均值的检验独立样本均值的检验检验统计量6/15/202445当时,构造的t检验统计量为地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。n在统计分析中,如果两个总体的方差相等,则称之为满足方差方差齐性。性。n确定两个独立样本的方差是否相等,是构造和选择检验统计量的关键,因此在决定要用哪一个t统计量公式前,必须进行方差齐性的检验。nSPSS中利用LeveneF方差齐性检验方法检验两个独立总体的方差是否存在显著性差异。!注意!注意独立样本均值的检验独立样本均值的检验6/15/202446在统计分析中,如果两个总体的方差相等,则称之为满足方差齐性。地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。n提出假设n确定检验统计量n采用的是F检验统计量n做出统计推断n拒绝域为:方差齐性的检验步骤方差齐性的检验步骤6/15/202447提出假设方差齐性的检验步骤8/9/202347地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。n仍以学生的身高为例,比较男生和女生的平均身高是否相等。男生男生12345678身高175174168164173169170166女生女生1234567身高158165156152156160168独立样本均值的检验独立样本均值的检验实例6/15/202448仍以学生的身高为例,比较男生和女生的平均身高是否相等。男生1地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。独立样本均值的检验独立样本均值的检验实例n第一步,进行方差齐性检验n已知:n1=8,n2=7。经计算:n于是,检验统计量F的值为:n取显著性水平=0.05,查F分布表得临界值为n说明F值落在接受区域内,即不能拒绝原假设,认为男生的身高的方差与女生的身高的方差无显著差异。6/15/202449独立样本均值的检验实例第一步,进行方差齐性检验8/9/20地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。n第二步,在方差齐性的假定下,进行均值的比较检验n此时,n取显著性水平=0.05,进行双侧检验,查t分布表可得临界值。,说明t值落在拒绝区域内,应该拒绝原假设。因此可以得出结论:男生和女生的平均身高有显著差异。独立样本均值的检验独立样本均值的检验实例6/15/202450第二步,在方差齐性的假定下,进行均值的比较检验独立样本均值的地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。-比较两个配对总体的均值是否有显著性差异配对样本均值的检验配对样本均值的检验6/15/202451-比较两个配对总体的均值是否有显著性差异配对地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。指不同的均值来自具有配对关系的不同样本,此时样本之间具有相关关系,配对样本的两个样本值之间的配对是一一对应的,并且两个样本具有相同的容量。如,一组病人治疗前和治疗后身体的指标;一个年级学生的期中成绩和期末成绩等等。配对样本均值的检验配对样本均值的检验n什么是配对样本什么是配对样本6/15/202452指不同的均值来自具有配对关系的不同样本,此时样本之间具有相关地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。n配对样本的数据形式配对样本的数据形式配对样本均值的检验配对样本均值的检验观察序号观察序号观察序号观察序号样本样本样本样本1 1 1 1样本样本样本样本2 2 2 2差值差值差值差值1x x 1 1y y 1 1D D1 1=x x 1 1-y y 1 12x x 2 2y y 2 2D D2 2=x x2 2-y y 2 2MMMMMMMMMMMMMMix x i iy y i iD Di i=x xi i -y y i iMMMMMMMMMMMMMMnx x n ny y n nD Dn n=x xn n-y y n n6/15/202453配对样本的数据形式配对样本均值的检验观察序号样本1样本2差值地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。配对样本均值的检验配对样本均值的检验n基本思想基本思想n配对样本均值的检验就是根据两个配对样本,推断两个总体的均值是否存在显著性差异。n其基本思想是:先求出每对配对样本的观测值之差,形成一个新的单样本,再对差值求均值,检验差值的均值是否为0。n若两个样本的均值没有显著性差异,则样本之差的均值就接近为0,这类似于单一样本均值的检验。n配对样本均值的检验也叫作配对样本的检验(Paired-SamplesTTest)。6/15/202454配对样本均值的检验基本思想配对样本均值的检验就是根据两个配对地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。n检验步骤检验步骤n提出假设n确定检验统计量n做出统计推断配对样本均值的检验配对样本均值的检验6/15/202455检验步骤提出假设配对样本均值的检验8/9/202355地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。配对样本均值的检验配对样本均值的检验n检验统计量检验统计量n配对样本均值检验要求两个样本的差值服从正态分布。n总体差值D服从正态分布,为总体差值的均值。nt检验统计量为:n式中,S为样本差值的标准差,定义为:。6/15/202456配对样本均值的检验检验统计量配对样本均值检验要求两个样本的差地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。配对样本均值的检验配对样本均值的检验n例题分析例题分析n一个以减肥为主要目标的健美俱乐部声称,参加其训练班至少可以使减肥者平均体重减重8.5kg以上。为了验证该宣称是否可信,调查人员随机抽取了10名参加者,得到他们的体重记录如下表:在在在在 =0.05=0.05的的的的显显著性水平下,著性水平下,著性水平下,著性水平下,调查结调查结果是否支持果是否支持果是否支持果是否支持该该俱俱俱俱乐乐部的声称?部的声称?部的声称?部的声称?训练前训练前训练前训练前94.594.5101101110110103.5103.5979788.588.596.596.5101101104104116.5116.5训练后训练后训练后训练后858589.589.5101.5101.59696868680.580.5878793.593.59393102102左侧检验左侧检验左侧检验左侧检验6/15/202457配对样本均值的检验例题分析一个以减肥为主要目标的健美俱乐地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。配对样本均值的检验配对样本均值的检验样本差值计算表样本差值计算表样本差值计算表样本差值计算表训练前训练前训练前训练前训练后训练后训练后训练后差值差值差值差值D Di i94.594.5101101110110103.5103.5979788.588.596.596.5101101104104116.5116.5858589.589.5101.5101.59696868680.580.5878793.593.593931021029.59.511.511.58.58.57.57.511118 89.59.57.57.5111114.514.5合计合计合计合计98.598.5n配对样本的配对样本的t检验检验(例题分析例题分析)6/15/202458配对样本均值的检验样本差值计算表训练前训练后差值Di94.5地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。配对样本均值的检验配对样本均值的检验n差值均值n差值标准差n配对样本的配对样本的t检验检验(例题分析例题分析)6/15/202459配对样本均值的检验差值均值差值标准差配对样本的t检验地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。配对样本均值的检验配对样本均值的检验n配对样本的配对样本的t检验检验(例题分析例题分析)H H0 0:m m m m1 1m m m m2 2 8.58.5HH1 1:m m m m1 1m m m m2 28.58.5a a a a=0.05=0.05,df=10-1=9df=10-1=9临界值临界值临界值临界值(s):(s):n检验统计量:n决策:n结论:n在=0.05的水平上不拒绝H0不能认为该俱乐部的宣称不可信-1.833-1.833t t0 0拒绝域拒绝域拒绝域拒绝域.05.056/15/202460配对样本均值的检验配对样本的t检验(例题分析)H0:地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。配对样本均值的检验配对样本均值的检验n说明说明SPSS统计软件中,检验程序的输出结果中如果未标明是单侧还是双侧检验,其所显示的P值均是双侧检验的结果。若使用者欲进行的是单侧检验,其程序与双侧检验相同,但所得到的P值须自行除以2,再与显著性水平相比较。不过,就假设检验而言,大部分都属于双侧检验的假设,故不需再除以2。6/15/202461配对样本均值的检验说明SPSS统计软件中,检验地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。配对样本均值的检验配对样本均值的检验现以T表示所用的检验统计量,t表示根据样本计算得到的检验统计量的值。现分别考虑左侧检验和右侧检验,单侧检验的P值见下表:其中,P值(双侧)是SPSS软件运行假设检验程序的结果假假设当当t0时t0时P值(双(双侧)/21-P值(双(双侧)/21-P值(双(双侧)/2P值(双(双侧)/2n说明说明6/15/202462配对样本均值的检验现以T表示所用的检验统计量,t表示根据样本地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。Excel中的统计函数ZTESTZTEST计算计算计算计算Z Z检验的检验的检验的检验的P P值值值值TDISTTDIST计算计算计算计算t t分布的概率分布的概率分布的概率分布的概率TINVTINV计算计算计算计算t t分布的临界值分布的临界值分布的临界值分布的临界值TTESTTTEST计算计算计算计算t t分布检验的分布检验的分布检验的分布检验的P P值值值值FDISTFDIST计算计算计算计算F F分布的概率分布的概率分布的概率分布的概率FINVFINV计算计算计算计算F F分布的逆函数分布的逆函数分布的逆函数分布的逆函数(临界值临界值临界值临界值)FTESTFTEST计计计计算算算算F F检检检检验验验验(两两两两个个个个总总总总体体体体方方方方差差差差比比比比的的的的检检检检验验验验)单尾概率单尾概率单尾概率单尾概率6/15/202463Excel中的统计函数ZTEST计算Z检验的P值8/9/2地势坤,君子以厚德载物。地势坤,君子以厚德载物。天行健,君子以自强不息。天行健,君子以自强不息。第一讲结束了!第一讲结束了!6/15/202464Q&A?第一讲结束了!8/9/202364
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!