心理学统计-第七部分--非参数统计课件

上传人:文**** 文档编号:242773210 上传时间:2024-09-03 格式:PPT 页数:54 大小:1.02MB
返回 下载 相关 举报
心理学统计-第七部分--非参数统计课件_第1页
第1页 / 共54页
心理学统计-第七部分--非参数统计课件_第2页
第2页 / 共54页
心理学统计-第七部分--非参数统计课件_第3页
第3页 / 共54页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第十九章 二项分布,第十九章 二项分布,1,A基本概念,二项分布的来源,二项分布的正态近似,比率z检验,A基本概念二项分布的来源,2,本书前面的章节主要介绍了参数统计的方法,如果变量为,等距或等比,数据,且数据分布服从,正态分布(或t分布等),,那么我们可以采用,参数统计,方法进行分析。,如果,所有数据,都是,称名或者顺序,数据,或者等距/等比数据,不满足参数统计的分布假设,,就需要采用非参数统计方法。,比如,期末考试6道判断题,一个学生她答对多少道题才算她考试通过呢?,本书前面的章节主要介绍了参数统计的方法,如果变量为等距或等比,3,对于这样的问题,即使这个学生完全不会,那她也很可能蒙对3道题,那她蒙对4道、5道、6道的概率是多少呢?,根据,概率的乘法原则,,几个独立事件同时出现的概率等于这些事件发生概率之积。,这样做对X道题的概率为,这个公式代表的分布称为,二项分布,。,对于这样的问题,即使这个学生完全不会,那她也很可能蒙对3道题,4,当一个事件或者观察可以被分类到两个具有一定发生概率的类别中的一个且是唯一一个时(男女、对错等),就可能产生一个,二项分布,,也成为,伯努利分布,;这样的事件被称为,二分事件,。,对应的两个类别的概率通常用P和Q表示,,P+Q=1,.,扔硬币就是一个典型的二分事件,P=Q=0.5,随着,试验次数(扔的次数)N增加,,二分事件所对应的发生概率,P和Q不会变化,。,通常把第一类别(概率P的时间)的实验次数称为X,即二项分布的变量。,当一个事件或者观察可以被分类到两个具有一定发生概率的类别中的,5,上面的问题中,,P=Q,,做对X道判断题的概率分布如下图所示。,随着试验的总次数,N增加,,,二项分布越来越接近正态分布,。,上面的问题中,P=Q,做对X道判断题的概率分布如下图所示。,6,如果考试题目为单选题(三选一),,P不等于Q,,则二项分布,不对称。,即使P不等于Q,但,只要N足够大,,二项分布也越来越对称,越来越,接近正态分布,。,如果考试题目为单选题(三选一),P不等于Q,则二项分布不对称,7,N足够大的标准:,如果,P=0.5,,当,N大于25,时,二项分布近似于正态分布;,如果,P不接近0.5,时,,NPQ最少是9,时才可将二项分布近似为正态分布。,N足够大的标准:,8,总之,对于二分事件,,只要N足够大,,二项分布就接近于一个,均值为NP,,,标准差为 的正态分布。,如果期末考试题为判断题,总题数50,该同学做对多少道才算她通过呢?,一般来说,只要她做的题目数大于一半,且概率足够小(0.5或P100时可不做连续性校正。,计算检验统计量,16,做出统计推断,Z分数落在拒绝区域外,接受零假设,即婴儿对面孔没有注意偏好。,做出统计推断,17,符号检验的,前提假设,:,二分事件,:每个简单事件或者试验只属于两个分类中的一个或另一个,而不会同时在两个分类或第三个分类中,P+Q=1;,独立事件,:实验中的每次试验互不干扰;,固定过程,:P和Q在实验的每轮试验中保持不变;,正态近似,:如果N不够大,需要查符号检验对应的表格,不能用正态逼近;,任意分布检验,:因变量分布可不是正态分布。,符号检验的前提假设:,18,在二分事件中,最常见的就是,赌徒谬误,,即认为事件的概率会在一串某一分类的结果接连出现后改变来弥补损失以保证分类间的平衡。,比如,我们知道扔硬币很多次,正面朝上的次数和背面朝上的次数将接近相等,所以当连续几次都是正面朝上时,我们会觉得下次背面朝上的概率会变大,这就是赌徒谬误。,实际上,由于每次抛硬币都是与之前无关的独立事件,因此正面朝上的概率不会变。,在二分事件中,最常见的就是赌徒谬误,即认为事件的概率会在一串,19,符号检验的应用,当只知道配对观测值的差异方向而不知道差异量或者差异量远不能近似于正态分布时,不能采用配对t检验,应该采用符号检验;,当配对t检验和符号检验都可以应用时,符号检验比配对t检验的统计检验力要低。,之前讲过的皮尔逊相关和斯皮尔曼等级相关的关系与此类似。,符号检验的应用,20,第二十章 卡方检验,第二十章 卡方检验,21,A基本概念,卡方分布,期望频次和观测频次,卡方统计量,卡方临界值,各种不同的单因素卡方检验,A基本概念卡方分布,22,上一章中我们介绍了,二分事件,的计数数据服从,二项分布,,可以采用,符号检验,对二者差异进行检验。,比如从我们心理学院的两个专业中找30名同学去参加义务劳动,师范类找了20个人,非师范类找了10个人,非师范生认为挑选不公平,剥夺了他们为社会做贡献的权利,那么这次挑选真的不公平吗?,上一章中我们介绍了二分事件的计数数据服从二项分布,可以采用符,23,我们可以通过符号检验来分析,零假设:两个专业同学被选的机会均等,即P=0.5,显著水平选择0.05双侧,N=30,近似于正态分布,0.05显著水平下,拒绝区域为大于1.96或者小于-1.96,我们可以通过符号检验来分析,24,采用连续性校正的公式,做出统计推断,接受零假设,两个专业的学生被选的概率是相等的。,采用连续性校正的公式,25,如果上边的问题变了,30志愿者不分专业从大一、大二、大三三个年级中挑选,结果大一15人、大二10人、大三5人,这样的挑选平等吗?,很显然,上边的事件也不再是二分事件,它涉及到了三个类别,相应的分布也不再是二项分布,而是多项分布。,在二项分布中,各个值对应的概率我们可以轻松求得,但是在处理二分事件时,我们依然将它近似为正态分布;,对于多项分布,计算则比较复杂,这样就更需要采用近似的方法进行分析。,如果上边的问题变了,30志愿者不分专业从大一、大二、大三三个,26,在参数统计中比较一个变量两个水平之间的差异可以用两样本t检验和方差分析,F值为t值的平方,服从F分布,F检验可用于处理多水平间的差异。,类似的,二项分布近似的正态分布可以处理二分事件间的差异,对其平方得到的分布可以处理多个类别间的差异。,在参数统计中比较一个变量两个水平之间的差异可以用两样本t检验,27,假设平方前的z分数服从正态分布,那么z的平方会服从另外一种不同的数学分布,即,卡方分布,。,假设平方前的z分数服从正态分布,那么z的平方会服从另外一种不,28,卡方分布的形状是由它的自由度决定的。卡方分布的,自由度,等于类别数减1,即k-1。,从上图可以看出,除非自由度非常大,否则所有的,卡方分布会倾向于正偏态,。,与F检验类似,卡方检验也是,单侧,的。,卡方分布的形状是由它的自由度决定的。卡方分布的自由度等于类别,29,对于二分事件,分子部分X-NP。NP代表的概率为P的情况下该类别的,期望频次f,e,,而X代表,实际或观测到的频次f,o,。,对于k种类别的情况,,对于二分事件,30,卡方检验的自由度为k-1,通过查表确定拒绝区域,卡方检验的自由度为k-1,通过查表确定拒绝区域,31,前边的那个问题,零假设:志愿者是随机选的,即三个年级的学生被选中的概率相等,均为1/3。,自由度为3-1=2,卡方临界为5.99,计算统计量小于临界值,接受零假设,志愿者的挑选各年级是机会平等的。,前边的那个问题,零假设:志愿者是随机选的,即三个年级的学生被,32,如果卡方计算值大于临界值,也就是,显著,的,意味着在,期望频次和实际频次,之间存在,不匹配,。,但是要确切知道到底是那两组存在差异,还需要进一步的分析(,两两进行符号检验或卡方检验,对进行Bonferroni校正,)。,如果卡方计算值大于临界值,也就是显著的,意味着在期望频次和实,33,前边我们讲的是单因素卡方检验,也称为,拟合度检验,,经常用于测量实际频次和基于理论的或假设的总体分布的期望频次之间的拟合度。,实际应用中存在以下几种情况:,1、,检验无差假说,:也就是假定期望频次相等,如前边的挑选志愿者的例子;,前边我们讲的是单因素卡方检验,也称为拟合度检验,经常用于测量,34,2、,检验假设分布的概率,卡方分布拟合度最初的应用就是基于某个连续变量的样本分布来检验它的总体分布形态。,比如检验期末考试成绩是否服从正态分布。选取100个学生,如果服从正态分布,那么将会有34个人的z分数在01之间,大约13个人落在12之间,3个人落在2以上,负数区域有同样的人数,这就是期望频次。把100名同学的成绩转化为z分数,统计出实际频次。然后用卡方检验来分析。,如果显著,则不服从正态分布;否则,服从。,2、检验假设分布的概率,35,B基本统计过程,二因素列联表,关联皮尔逊卡方检验,卡方检验的假设,B基本统计过程二因素列联表,36,A部分我们对单因素卡方检验进行了介绍,在实际的心理学研究中往往会牵涉到两个以上的变量之间的关系。所以二因素卡方检验要比单因素卡方检验更为常用。,比如,我们想看一下学生对授课教师的性别是否存在某种偏好。这样就涉及到两个两个变量学生的性别和老师的性别。,A部分我们对单因素卡方检验进行了介绍,在实际的心理学研究中往,37,两个课堂的情况如下表所示,两个课堂老师分别为男和女,各30人,男老师班上5个男生25个女生,女老师班上15个男生15个女生。下表称为,列联表或交叉分类表,男老师,女老师,行之和,男学生,5,15,20,女学生,25,15,40,列之和,30,30,60,两个课堂的情况如下表所示,两个课堂老师分别为男和女,各30人,38,从上表可以看出,大多数男生选了女老师课堂,大多数女生选了男老师课堂,这似乎体现了一种相关,即异性偏好。,但这是否是一种随机产生的巧合呢?,我们可以采用,关联皮尔逊卡方检验,来决定是否决绝零假设。,在二因素卡方检验中,零假设是两个变量之间没有关系,即一个变量在不同类别中的分布不会随另一个变量不同水平的变化而变化。换句话说,零假设认为两个变量相互独立,互不影响。因此关联皮尔逊卡方检验也被称为,独立性卡方检验,。,从上表可以看出,大多数男生选了女老师课堂,大多数女生选了男老,39,在独立性卡方检验中,自由度等于两个变量自由度之积,,df=(R-1)(C-1),,本例中等于1,在0.05显著水平下卡方检验的拒绝区域为大于3.84。,统计量的计算依然采用公式,其中k为单元格数目,也就是类别数目,期望频次为,在独立性卡方检验中,自由度等于两个变量自由度之积,df=(R,40,男老师,女老师,行之和,男学生,5(10),15(10),20,女学生,25(20),15(20),40,列之和,30,30,60,括号内计算得到的期望频次,则,做出推断,课堂上教师的性别与选课同学的性别存在相关,学生选课时对授课教师性别存在异性偏好。,男老师女老师行之和男学生5(10)15(10)20女学生25,41,卡方检验的,前提假设,:,互斥互补的类别,:每个观测值都会落入一个而且仅可以落入一个类别中;,观测值相互独立,:可通过让每个被试只代表一次观测值来满足;,期望频次的大小,:比较保守的规则是每个期望频次都大于5(df=1时,都要大于10);相对宽松的规则是每个期望频次都大于1,并且不多于20%的期望频次小于5.,卡方检验的前提假设:,42,第二十章 顺序数据的统计检验,第二十章 顺序数据的统计检验,43,前两章我们讲了对于二分事件和N分事件,其数据为,计数,数据,这样的情况,不符合参数统计的假设,,比较各个类别之间的差异我们可以采用符号检验和卡方检验。,在教育心理学的很多研究中,其数据也不遵从等距,或者其分布为较强的偏态分布,这时我们可以这些数据用顺序数据来表达,采用非参数统计的方法来分析。,五名男生期末考试成绩为98,96,94,90,80,六名女生 成绩为97,95,93,92,91,89,问10名同学成绩存在性别差异吗?,前两章我们讲了对于二分事件和N分事件,其数据为计数数据,这样,44,对于这样一个问题,我们不能确定数据是否服从正态分布,因此无法采用两样本t检验,这时可以采用,秩和检验,。,秩和即秩次之和或等级之和。,秩次,即按大小排序后的序号,一般从大到小排序。,括号里就是每个数据对应的秩次,男:,98(1),96(3),94(5),90(9),80(11),女: 97(2),95(4),93(6),92(7),91(8),89(10),对于这样一个问题,我们不能确定数据是否服从正态分布,因此无法,45,排序之后,将,容量较小,的样本中各数据的等级相加,用T表示。,T=1+3+5+9+11=19,查秩和检验表,若T=T,2,,则表明两样本具有统计学意义。,查下表可知,在双侧0.05显著水平下, T=T,1,,男女生期末考试成绩存在差异。,在上边的例子中,,两个样本量均小于10,.,排序之后,将容量较小的样本中各数据的等级相加,用T表示。,46,心理学统计-第七部分-非参数统计课件,47,当,两个样本量均大于10,时,,秩和T,的分布,接近于正态分布,。其平均数为,标准差为,n,1,为较小的样本量,这样z分数等于,心理学统计-第七部分-非参数统计课件,48,假设11个男生成绩排名为1,3,5,6,9,11,16,20,21,22,23,12名女生成绩排名为2,4,7,8,10,12,13,14,15,17,18,19,正态分布平均数为132,标准差为16.25,秩和T为137,则z=0.311.96,所以男女生成绩无差异。,假设11个男生成绩排名为1,3,5,6,9,11,16,20,49,比较来自,两个被试组的数据,差异时,如果数据总体服从正态分布,我们可以采用两独立样本t检验来分析;如果两组数据总体不服从正态分布,可采用,秩和检验,来分析。,两组数据可以来自两组被试,也可以来自,一组被试的两次测量,,如果数据服从正态分布,则可采用配对t检验来分析;如果不服从正态分布,则可采用,Wilcoxon符号等级检验,法来分析。,比较来自两个被试组的数据差异时,如果数据总体服从正态分布,我,50,如果被试样本,N=25,,该方法具体步骤如下:,第一步:求出成对观测数据的差d,i,,并将d,i,的绝对值按大小顺序编上等级(从小到大);,第二步:等级编号完成以后恢复正负号,分别求出正等级之和T+和负等级之和T-,选择T+和T-中较小的一个作为Wilcoxon检验统计量T;,第三步;作出判断。,根据显著性水平查附表,得到临界值T,,若TT,,则拒绝原假设H,0,。,如果被试样本NT临界,两次无显著差异,。,T+=8+4+3+7+9=31,53,当,N25,时,一般认为T的分布近似于正态分布,当N25时,一般认为T的分布近似于正态分布,54,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!