资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,统计软件与分析,DID YOU KNOWN?,关系图,什么是统计,?,1.,统计工作,对数据资料搜集、整理和分析,2.,统计资料,统计工作的成果,3.,统计学,研究客观事物数量方面和数量关系的方法论科学,为何学习统计,时代的呼唤,教育研究的科学性、严密性、实证性;,克服中国人拍脑子做事情的思维习惯;,质性研究与量化研究的统一,21,世纪必备技能。,统计的思维方法,就象读和写的能力一样,有朝一日会成为效率公民的必备能力,Statistical thinking would one day be as necessary for efficient citizenship as the ability to read and write.,H.G.Wells,统计学的应用领域,统计学,经济学,管理学,卫生,教育学,社会学,流行统计软件,SAS,SPSS,BMDP,SYSTAT,EPINFO,和,EPMAP,EXCEL,大家有疑问的,可以询问和交流,可以互相讨论下,但要小声点,统计分析前的准备,数据的输入,数据的转换,文件格式的转换,变量的分组,变量的计算与变换,变量的分类,定量变量,连续的:收入、身高、温度,离散的:家庭人数、考试不及格的次数、发生交通事故的次数,定性变量,次序变量:对学校的喜欢程度(非常喜欢、比较喜欢、一般、比较不喜欢、非常不喜欢),职业技能水平(高级、中级、低级、没水平),名义变量:性别(男、女),种族(汉、蒙、满,),婚姻状况(未婚、已婚、离婚、丧偶),数据的基本处理,排序,选择,拆分,计算变量,转换变量,可视化离散,替换缺省值,分类汇总,排秩,课前复习,分数练习,问卷处理,样本数(一),组别差异比较:,各组至少,20,个以上;,要求很低也要,15,个以上;,理想:,30,个以上,样本数(二),样本数(三),样本抽样数与总体人数并非成比例关系;,一般问卷调查研究中,正式抽样数最好在,350,以上;,AIRSSINA,与,GAY:10%,;,总体小于,500,,,20%,以上;,再少,,30%,以上;,抽样样本数愈多推论的效度愈可靠,抽样方法,如何选择一个用于代表总体的样本?,数目;,方法。,如何抽样?,统计学的内容,描述性统计分析,频数分布表,正态分布,数据如果符合正态分布,那就具备了一般统计分析的充分条件。,偏态数据,推断统计,推断统计是用已收集和分析过的样本数据去推断总体值的统计方法。,差异推断统计:均数差异,联合推断统计:相关推断,置信区间,置信区间是指由,样本统计量,所构造的总体参数的估计区间。在统计学中,一个,概率,样本的置信区间(,Confidence interval,)是对这个样本的某个总体参数的,区间估计,。置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度。置信区间给出的是被测量参数的测量值的可信程度,即前面所要求的“一定概率”。这个概率被称为置信水平。,举例来说,如果在一次大选中某人的支持率为,55%,,而置信水平,0.95,上的置信区间是(,50%,60%,),那么他的真实支持率有百分之九十五的机率落在百分之五十和百分之六十之间,因此他的真实支持率不足一半的可能性小于百分之五。如例子中一样,置信水平一般用百分比表示,因此置信水平,0.95,上的置信空间也可以表达为:,95%,置信区间。置信区间的两端被称为置信极限。对一个给定情形的估计来说,置信水平越高,所对应的置信区间就会越大。,小概率事件(,0.05,),0.05,显著;,0.01,高度显著;,0.001,极其高度显著,小概率事件是几乎不可能发生的事情,在一次试验或观察中小概率事件发生了,于是我们有理由怀疑这一假设的真实性,拒绝原假设。,原假设:没有差异,/,没有关联,差异推断统计,单样本均值差数检验,独立双样本均值差数检验,相关双样本均值差数检验,独立多样本均值差数检验,练习题,用“多变量入门练习数据”,分析身高,160,以上(包含,160,)与,160,以下,体重上是否存在差异?,用,”,六班成绩,”,中的期中数学年级平均分为,87.16.,试分析,3,班的“期中数学”成绩与之相比有无差异?,6,个班之间的情况又是如何?,用,ch6,中的数据中是,10,个运动员新旧训练成绩,试分析新训练法有推广价值吗?,联合推断统计,双变量,偏相关,相关系数,r,问卷的基本分析,问卷的项目分析、效度检验、信度检验作为编制正式问卷的依据。,效度检验:整张问卷的可靠程度;,信度检验:一致性;,项目分析:主要测验个别题项的适切性或可靠程度。,难度,鉴别度,极端组法,同质性检验,
展开阅读全文