远程班统计-禤宇明.ppt

上传人:zhu****ei 文档编号:5410156 上传时间:2020-01-28 格式:PPT 页数:163 大小:1.06MB
返回 下载 相关 举报
远程班统计-禤宇明.ppt_第1页
第1页 / 共163页
远程班统计-禤宇明.ppt_第2页
第2页 / 共163页
远程班统计-禤宇明.ppt_第3页
第3页 / 共163页
点击查看更多>>
资源描述
1 心理统计学 禤宇明脑与认知科学国家重点实验室中国科学院心理研究所2009 10 数据公式 什么是统计 2 描述事实推论做决策阿甘智商75 他的智力正常吗 为什么需要统计学 3 1 1数据分类称名 等级 等距 等比数据1 2数据整理直方图1 3数据的描述集中量数 均数 中数 众数离中量数 方差 标准差 变异系数地位量数 四分位数 百分位数相关系数 积差相关 一 数据与整理 4 变量 尺度 数据 身高高 矮 中等个头180cm变量variable 事物的某种特征 这种特征在不同个体之间有差异尺度scale 量表 测量的标准数据data 测量的结果对同一个研究对象 用不同的尺度进行测量 也可以得到不同的结果 6 数据的分类 计数数据测量数据连续 离散称名数据 类别等级数据 顺序等距数据等比数据 7 四类数据的比较 8 真题 体温计测得的体温数据是 06单选 运动员在比赛中所获得的 名次 属于 07单选 A 等比数据B 等级数据C 分类数据D 等距数据对于等距数据的运算 通常 08单选 A 不可加减乘除B 可加减乘除C 可乘除 不可加减D 可加减 不可乘除 9 思考题 军衔百分制的考试成绩重量长度智商7点量表 10 数据的表示方法 测量数据等级数据把1 2 2 2 3 3 4 5变成等级数据 23453 2 5 3 499999 11 1 2数据的整理 直方图次数多边形图 组距分组的步骤 P32 1 求全距R Max Min2 定组数3 定组距组距是一个组的上限与下限之差组距 最大值 最小值 组数4 写出精确组限5 求组中值 精确上限 精确下限 26 归类划记7 登记次数 定量数据的图表展示 直方图histogram 次数多边形 频数分布图的形态 正态分布 正偏态分布右偏分布 右尾巴比较长 负偏态分布 左尾巴比较长 左偏分布 J型分布 U型分布 反J型分布 思考题 在某小镇对下面变量进行调查父母双方均小于25岁的家庭中所有成员的身高已婚夫妇的身高全体居民的身高所有小汽车的高度把变量与其直方图相匹配 并解释理由 205080 英寸 思考题 1960和1980年 对美国妇女进行调查 你有几个孩子 结果如下所示 变量是离散的还是连续的 画直方图 9或更多可以 可以取为9 从图中能得出什么结论 24 1 3数据的描述 描述统计统计量数 定义 性质 用法集中量数算术平均数 中数 众数 加权平均数 几何平均数差异量数 离中量数 全距 平均差 方差 标准差 差异系数地位量数中 位 数 四分位数 十分位数 百分位数 25 算术平均数 又叫均数 算术平均数 缩写设一组数据为x1 x2 xn 26 中数 Median Md或Mdn 中数 一组数据中按从小到大排序后 处于中间位置上的变量值将全部数据排序后 如果项数是奇数 则正中央的那一项即为中位数例 4 7 8 9 10 11 12 13 14Mdn 10如果项数是偶数 则正中央的那两项的平均值即为中位数例 2 3 5 7 8 10 15 19Mdn 7 8 2 7 5 众数 Mode Mo 众数 一组数据中出现次数最多的数如2 3 5 3 4 3 6的众数为3卡尔 皮尔逊1894如果次数分布最多的有两个数 而且两个数是相邻的 那么一般取两者的平均值作为众数 如果这两个数不相邻 那么一般需要报告两个众数 而且认为该组数据是双峰 bimodal 分布的 平均数 中数和众数的关系 在一个正态分布中 三者相等在正偏态分布中 M Md Mo在负偏态分布中 M Md Mo 平均数 支点两端的力矩相等中数 两侧数据个数相同 把分布曲线下面积平分 众数 出现次数最多 峰值所在位置 30 方差和标准差Variance StandardDeviation 31 标准差的应用 差异系数 Coefficientofvariation 32 变异系数指出了标准差对于平均值的大小 用于比较不同总体或样本数据的离散程度 同一样本不同测量的变异的比较 如相同班级不同科目的变异的比较 不同样本同一测量的变异的比较 如不同年级同一科目变异大小的比较 33 例 已知某小学一年级学生的平均体重为25公斤 体重的标准差是3 7公斤 平均身高110厘米 标准差为6 2厘米 问体重与身高的离散程度哪个大 解 CV体重 3 7 25 100 14 8 CV身高 6 2 110 100 5 64 所以 体重的离散程度比身高的离散程度大 例 通过同一个测验 一年级学生的平均分数为60分 标准差为4 02分 五年级学生的平均分数为80分 标准差为6 04分 问这两个年级的测验分数中哪一个离散程度大 解 CV一年级 4 02 60 100 6 7 CV五年级 6 04 80 100 7 55 所以 五年级的测验分数的分散程度大 地位量数 四分位数 Quartile 将数据划分为4部分 每部分各占25 的数据项 这种划分的临界点即为四分位数 三个四分位数分别为 Q1 Q2 Q3十分位数 Decile 将数据划分为10个部分 每部分占十分之一的数据项 其划分的临界点为十分位数百分位数 Percentile 第p百分位是这样一个值 它使得至少有p 的数据小于或等于这个值 且至少有 100 p 的数据项大于或等于这个值 35 四分位差 四分位差 Quartiledeviation Q Q3 Q1 2 百分位数的应用 常用于确定正常值范围 如医学参考值范围referenceranges习惯上确定95 也可用80 90 99 的人的界线双侧参考值 计算P2 5和P97 5白细胞总数过高过低均属异常单侧参考值 计算P5或P95肺活量 过低为异常尿铅 过高为异常 平均数的特点 一组数据的每一个数与平均数的差 离均差 的总和等于零一组数据的每一个数加上常数C 其平均数为原来的平均数加常数C一组数据的每一个数乘以常数C 其平均数为原来的平均数乘常数C一组数据的每一个数与常数C的差的平方和不小于该组数据的每一个数与平均数的差的平方和 标准差的性质 一组数据的每一个数据都加常数C后标准差不变一组数据的每一个数据都乘常数C后标准差变为原来的C倍 40 真题 以下统计量中 用于描述一组数据集中趋势的是 07单选 A 全距B 方差C 标准差D 平均数中数 06名词解释 众数 08名词解释 如果某同学在标准化测验中的分数位于75的百分等级 这意味着 01单选 A 参加测验的人中 有75 被数分数高于该同学B 参加测验的人中 有25 被数分数高于该同学C 参加测验的人中 有75 被数分数低于该同学D 该同学正确回答了75 的测验题某研究测量了某组学生的身高和体重 已知平均身高165cm 标准差10cm 平均体重50kg 标准差4kg 试比较身高与体重分布的离散程度 02简答 思考题 不做运算比较下面两个数列的平均数10 7 8 3 5 910 7 8 3 5 9 11 思考题 以下每组数的平均数均为50 哪组数在平均数附近的散布程度最大 哪组最小 A0 20 40 50 60 80 1000 48 49 50 51 52 1000 1 2 50 98 99 100B47 49 50 51 5346 48 50 52 5446 49 50 51 54 不需要计算完成以下题目 构造10个数使这些数的SD尽可能地大并且满足每个数要么是1要么是5每个数要么是1要么是9每个数要么是1要么是5或者9 其中至少有2个数是5重复上题 要求SD尽可能小 思考题 如图为对某口服药物进行的两项研究 一项研究中服用该药会增加血压10mm左右 在另一项研究中 服用该药约会增加血压10 哪一幅图对应哪一项研究 什么是相关 事物之间的关系因果关系 共变关系和相关关系因果 A B下雨地上会湿共变 C A C B婴儿身高和树苗高度的关系相关 指两类现象在发展变化的方向和大小方面存在一定的关系 不能确定是否为因果关系 但不存在共变关系广告费支出与商品销售额的关系 47 相关系数 相关系数 两列变量间相关程度的数量化指标总体 样本r r 1几个概念完全相关 1 00或1 00不完全相关 0 r 1不 零 相关 r 0正相关 两个变量的变化方向一致 0 r 1负相关 两个变量的变化方向相反 1 r 0 48 计算相关系数时应注意的问题 相关系数受样本容量n的影响如果n很小 可能完全没有相关的两事物 却计算出较大的相关系数 一般以N大于30为宜相关系数不是等距数据也不是比例数据计算相关系数要求成对数据没有线性相关 不一定没有关系 可能是非线性的相关系数的计算不受以下因素影响互换两个变量某一变量的所有值都增加同一数值某一变量的所有值都乘以同一正数相关系数大小与相关程度描述P151 52 相关系数及其适用条件 积差相关 两列正态等距 等比变量等级相关斯皮尔曼等级相关 两列非正态等距 等比变量或两列等级变量肯德尔和谐系数 多列等级变量 评分者信度 质量相关点二列相关 一列正态 一列二分名义变量二列相关 两列正态 但其中一列正态变量被人为分成两类多系列相关 两列正态 但其中一列正态变量被人为分成多类品质相关四分相关 两列正态 但都被人为地分成两类 相关 两列真正的二分类别变量列联相关 任意R C列联表 2列以上 积差相关系数 r 0 36 0 73vs 0 96 59 真题 两个正态数据 其中一个人为分成两类 06单选 对两列线性相关的等级数据计算关联程度应采用 08单选 A 皮尔逊相关B 斯皮尔曼相关C 点二列相关D 二列相关一列等距正态变量的测量数据 另一列二分名义变量的资料 若两列变量线性相关 应使用 计算其相关系数 03单选 A 积差相关B 点二列相关C 二列相关D 斯皮尔曼等级相关 2 1数据分布正态分布二项分布2 2参数估计 二 数据分布与参数估计 60 连续型随机变量分布 不可能一一列举可能的取值取任一指定实数值的概率为0我们对落入某个区间内的概率更感兴趣 62 正态分布 特点钟形分布 两头低 中间高有其概率密度函数 简记为X N 2 X服从参数为 的正态分布数据分布与标准差的关系 正态 概率密度 曲线的特点 概率密度曲线和x轴之间的面积等于1概率P x1 x x2 关于x 对称对任意h 0 有P h x P x h 当x 时有最大值x离 越远 f x 的值越小并逐渐趋向0这表明对于同样长度的区间 当区间离 越远 X落入区间上的概率越小 如果固定 改变 的值 则图形沿x轴平移 而不改变形状如果固定 改变 由于最大值可知当 越小时图形就变得越尖 因而x落在 附件的概率就越大 标准正态分布 0 1时 有 X落入区间 x1 x2 的概率是P大于x1小于x2的数据占所有数据的P 百分比 年龄在20 30之间的人口占总人口的百分之 区间 x1 x2 所对应的面积是P 正态分布的标准化 71 标准分数 又称为Z分数 以标准差为单位 反映了一个原始分数在团体中所处的位置Z分数的性质Z分数的平均数为0Z分数的标准差为1 标准分数的应用 比较分属性质不同的观测值在各自数据分布中相对位置的高低 如 某人Z身高1 70 0 5 Z体重65 1 2 则该人在某团体中身高稍偏高 而体重更偏重些当已知各不同质的观测值的次数分布为正态时 可用Z分数求不同的观测值的总和或平均值 以表明在总体中的位置 P100例4 10 标准正态分布表 P 449 仅给出Z为正值时的P和对应的Y当Z为负值时利用对称性求相应的P和Y对于X N 2 先化为标准正态分布再查表p 0 z Z P 例 X N 0 1 求以下概率1 P 0 1 写出以下区间如果X N 2 X N 0 1 平均数左右1个标准差平均数左右z个标准差 需要记住的一些Z值 资料 例如根据我国国家体委 原教育部 卫生部1978年至1980年对全国16个省市20余万名青少年儿童进行的 中国青少年儿童身体形态 机能 素质调查研究 的资料 其中18 25岁男青年的平均身高是170 5厘米 标准差5 75厘米 这可以作为确定我国城市成年男性平均身高的重要依据 姚明的身高为226cm 求所对应的Z 以及身高在226cm以上的成年男性所占的比例 姚明 如果上天再给我一次机会我不要2米26身高但除了打篮球 长得高还有什么好处呢 上面的空气新鲜一些 这是姚明的回答 一组测验分数服从正态分布 其平均数为65分 标准差为5分 则分数在60 65之间的人数占总人数的百分比为 07单选 A 15 8 B 34 1 C 50 0 D 68 3 某测验分数服从正态分布 其平均分数为65分 标准差5分 问分数在60与70分之间的人数占全体老先生总人数的百分比为 01单选 A 15 8 B 34 1 C 50 0 D 68 3 80 假设成人智商服从均数为100 标准差为15的正态分布 如果智商大于160的都是天才 那么请问100万人里有几个天才 某市参加数学奥林匹克业余学校入学考试的人数为2800人 只录取学生150人 该次考试的平均分为75分 标准差为8 问录取分数应定为多少 解 考试成绩服从正态分布 即X N 75 82 转换成标准正态分布Z N 0 1 根据题意招生人数的概率为P Z Z0 150 2800 0 05357P 0 Z Z0 0 5 0 05357 0 44643查正态分布表 得Z0 1 6112X0 75 1 6112 8 87 8894 88 例在某年高考的平均分数为500 标准差为100的正态总体中 某考生得到650分 设当年高考录取率为10 问该生成绩能否入围 解 该生的标准分数为Z 650 500 100 1 5查正态分布表 当Z 1 5时 p 0 433从低分到高分的顺序中他处于93 3 的位置从高分到低分的顺序中他处于6 7 的位置 85 二项分布binomialdistribution 离散型分布的一种每次随机试验只有两种可能的结果 A及 P A p P 1 p q 0 p 1 n次独立试验下 事件A发生的次数为x的概率分布 86 当n趋向于无穷大时 二项分布趋向于正态分布二项分布的均值 数学期望 方差和标准差 87 真题 若随机变量X服从二项分布 即X B 200 1 2 则该分布的数学期望为 02单选 A 200B 150C 100D 50某测验包含32道四择一选择题 若受测者随机作答 其成绩分布的方差应变 04单选 A 10B 8C 6D 4某测验包含32道四选一的选择题 若受测者随机做答 成绩分布的平均数 即期望 应为 05单选 A 4B 6C 8D 1016个4选1的选择题 随机做答的 成绩分布的方差是 06单选 88 抽样与抽样分布 总体 population 要研究的事物或现象的全体个体 unit 组成总体的每个元素 成员 总体容量 populationsize 一个总体中所含个体的数量样本 sample 从总体中抽取的部分个体样本容量 samplesize 样本中所含个体的数量抽样 sampling 为推断总体的某些重要特征 需要从总体中按一定抽样技术抽取若干个体的过程参数 parameter 反映总体数据特征的量数统计量 statistic 反映样本数据特征的量数统计量是样本的函数 只依赖于样本 样本均值 样本方差等都是统计量 89 90 抽样分布 91 标准误standarderror 样本平均数的标准差称为标准误 92 自由度degreeoffreedomp185 可以自由取值的变量的个数任意说出三个整数任意说出三个和为100的整数 t分布的特点p185student stdistribution 对称 左侧为负 右侧为正 均值为0 30时 t分布为接近正态分布 方差 1 n45时 t分布与正态分布没有多大差异在小样本n 30时 t分布具有重要作用 2分布Chi squaredistributionp187 2分布的特点p188 正偏态分布当df 时 2分布为正态分布 2值都是正值可加性k个 2分布的和也是 2分布 2 df 2 2 2df df 2 连续型分布 2分布表P475 例df 5 求 0 05和 0 01时的单侧临界值解 F分布的特点p190 F n1 n2 分布形态是正偏态分布 形式随n1 n2不同而不同 随n1 n2的增大而渐趋正态分布F为两个方差比率 所以为正值n1 1 n2任意时 F值与自由度为n2的t值的平方相等 即F 1 n2 t2 n2 F n1 n2 1 F1 n2 n1 114 101 参数估计 设总体有待估参数 自总体中抽取样本x1 x2 xn点估计pointestimate用样本的某一统计量估计 如用样本均值估计总体均值充分性 无偏性 有效性 一致性区间估计intervalestimate求出一定概率下 的取值范围 102 参数估计的几个概念 显著性水平significancelevel指估计总体参数可能落入某区间时允许犯错误的概率 通常有三个标准 0 05 0 01 0 0011 0 95 0 99 0 999置信水平 置信度confidencelevel待估参数落入置信区间的可靠程度1 置信区间confidenceinterval指在某一置信水平时 总体参数可能落入的区间 点估计p196 统计量作为估计量estimator充分性sufficiency用到样本的所有数据无偏性unbiasedness估计值的平均值与真值一致有效性efficiency当总体参数的无偏估计量有不止一个统计量时 无偏估计变异性最小者有效性高 变异大者有效性低一致性consistency当样本容量无限增大时 估计值越来越接近所估计的总体参数 104 均数的区间估计 105 真题 根据样本平均数对总体平均数进行区间估计时 区间的宽度与无关 05单选 A 样本平均数B 样本标准差C 样本容量D 置信度点估计 07名词解释 区间估计 01名词解释 假设检验的基本原理各种假设检验均数方差比例相关系数卡方非参数 三 假设检验 106 107 假设检验 从样本差异推论总体差异的过程就是假设检验 108 假设检验的步骤 建立虚无假设和备择假设确定适当的检验统计量指定检验中的显著性水平 计算检验统计量的值 建立拒绝虚无假设的规则作出统计决策将检验统计量的值与拒绝规则所指定的临界值相比较 确定是否拒绝虚无假设 或计算p值 利用p值确定是否拒绝虚无假设 阿甘智商75 请问他智力是否正常 109 110 备择假设和虚无假设 虚无假设H0nullhypothesis又叫零假设zerohypothesis 原假设 与研究假设对立的假设 一般假设差异不显著备择假设H1researchhypothesis又叫研究假设alternativehypothesis 指待验证的假设 一般假设差异显著 111 错误和 错误 错误 I型错误 typeIerrorH0为真时却被拒绝 错误 II型错误 typeIIerrorH0为假时却被接受 112 假设检验中各种可能结果的概率 接受H0拒绝H0 接受H1H0为真1 正确决策 错误 H0为伪 错误 1 正确决策 113 错误和 错误的关系p286 1对于固定的样本容量n 与 不能同时减小 增大 减小 减小 增大 一定时 可以通过增大样本容量n来减小 114 单侧检验和双侧检验p286 115 平均数差异显著性检验 总体正态 方差已知Z检验总体正态 方差未知t检验独立样本t检验等方差假设不等方差假设配对样本t检验 116 非参数检验方法 两相关样本的差异显著性检验符号检验法符号等级检验法 符号秩次检验法 两独立样本的差异显著性检验等级和检验法 秩和检验法 中数检验法 例 全市统一考试的数学平均分 0 62分 标准差 0 10 2 一个学校的90名学生该次考试的平均成绩为68分 问该校成绩与全市平均差异是否显著 取 0 05 解 例 p232 有人调查早期教育对儿童智力发展的影响 从受过良好教育的儿童中随机抽取70人进行韦氏儿童智力测验 0 100 0 15 结果X 103 3 能否认为受过良好早期教育的儿童智力高于一般水平 例 学生的学习成绩与教师的教学方法有关 某校一教师采用了一种他认为新式有效的教学方法 经过一学年的教学后 从该教师所教班级中随机抽取了6名学生的考试成绩 分别为48 5 49 0 53 5 49 5 56 0 52 5 而在该学年考试中 全年级的总平均分数为52 0 试分析采用这种教学方法与未采用新教学方法的学生成绩有无显著的差异 已知考试成绩服从正态分布 取 0 05 例 一个汽车制造商声称 某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下大于40000公里 对一个120个轮胎的随机样本作了试验 测得平均值和标准差为X 41000 S 5000 已知轮胎寿命的公里数近似服从正态分布 该制造商的产品同他所说的标准相符吗 0 05 例 p234 某省进行数学竞赛 结果分数的分布不是正态 总平均分43 5 其中某县参加竞赛的学生168人 X 45 1 S 18 7 该县平均分与全省平均分有否显著差异 0 05 思考题1 某市场研究有限公司假定电话调查可在15分钟以内结束 如果调查所需时间超过该值 则需要加收额外费用 假定由35个电话调查所组成的一个样本表明 其样本均值为17分钟 样本标准差为4分钟 取显著性水平 0 01 问是否需要额外收费 思考题2 据美国商业部的经济分析局报道 北加利福尼亚居民年收入的均值为18688美元 一名研究者想对南加利福尼亚州检验H0 18688 H1 18688 其中 为南加利福尼亚州居民年收入的均值 假定由400名南加利福尼亚州居民所组成的样本表明 其年收入的样本均值16868美元 样本标准差为14624美元 则假设检验的结论是什么 取显著性水平为0 05 例 p236某地区的六岁儿童中随机抽取男生30人 其平均身高为114cm 抽取女生27人 平均身高112 5cm 根据以往资料 该区六岁男女儿童身高的标准差男童为5cm 女童为6 5cm 问该区六岁男女儿童身高有无显著差异 0 05 例 某幼儿园在儿童入园时对49名儿童进行了比奈智力测验 16 结果平均智商X1 106 一年后再对同组被试施测 结果X2 110 已知两次测验结果的相关系数r 0 74 问能否说随着年龄增长与一年的教育 儿童智商有了显著提高 0 01 例 某校进行一项智力速度测验 共有19名学生参加 其中男生12人 女生7人 测验共200道题目 在规定时间里 答对一题记1分 测验结束后 得到以下的测验成绩男生12人 83 146 119 104 120 161 134 115 129 99 123女生7人 70 118 101 85 107 132 94试确定男 女生的平均成绩有无显著的差异 取 0 05 133 其他假设检验 方差 方差差异相关系数 相关系数差异百分数 比率 百分数差异卡方检验拟合度检验独立性检验同质性检验 独立性检验 列联分析 两个变量的独立性检验又叫列联分析 因为数据一般以列联表的形式组织列联表以一个变量的分类为行row 如性别 另一个变量的分类为列column 如意见 所以有时候也称为R C列联表 如2 2 3 4列联表行总和rowtotal和列总和columntotal统称边缘总和marginaltotal 列联表的期望频次计算P308 列联表中某单元格的期望频次等于所在行总和乘所在列总和除以总频次 列联表的c2检验 2 2列联表的c2检验的专用公式 分子 对角线乘积之差的平方乘以N分母 四个边缘总和的乘积 例 139 真题 测得某大学生组和专业篮球运动员组被试的体重和身高 已知体重与身高存在高相关 若要比较两组被试的体重是否确实存在差异 最合适的统计方法是 04单选 A t检验B 协方差分析C 判别分析D Z检验若两总体的样本平均数分布为非正态分布 要求检验两独立样本平均数的差异 则应选用 05单选 A t检验B 符号检验C 符号秩序检验D 中数检验对同一班级学生的某项特殊能力进行两次评定 已知评定分数不服从正态分布 检验两次评定结果的差异时 应采用 08单选 A 中数检验法B 秩和检验法C 符号检验法D t检验下列检验方法中属非参数检验法的是 03单选 A 中数检验法B Z检验C t检验D F检验要检验多组计数数据间的差异 适宜的统计检验方法是 04单选 A t检验B Z检验C 秩和检验D 卡方检验 140 在总体关系一定时 错误和 错误的关系是 06单选 拒绝HA假设 也称零假设 时所犯统计错误的概论为 01单选 A C 拒绝虚无假设 Ho 时所犯错误的概率为 08单选 A B 1 C D 1 简述 型错误和 型错误以及两者的基本关系 04简答 错误 02名词解释 141 随机抽取受过良好早期教育的儿童进行韦克斯勒智力测验 测得平均智商为104 若要检验这类儿童的智商是否高于一般儿童 需要检验的虚无假设是 07单选 A H0 1 0B H0 1 0C H0 1 0D H0 1 0虚无假设 05名词解释 简述单侧检验的概念及其应用条件 08简答 双侧检验 07名词解释 简述假设检验的步骤 06简答 142 简述卡方 ChiSquare 检验的应用 07简答 简述在心理学研究中卡方检验的三种应用 03简答简述选择统计方法应考虑的主要因素 08简答 某心理学工作者随机选取16名学生 在期中和期末分别施以同一种测验 已知测验成绩服从正态分布 若要检验期末成绩是否显著高于期中成绩 应选用什么统计方法 请进行统计检验 01应用题 提示 t0 05 15 1753 t0 05 15 2 131 t0 05 30 1 697 t0 025 30 2 042 学生12345678910111213141516期中63643548536070655365632861556559期末60704043575686525871642561586762 143 四 方差分析 144 方差分析AnalysisofVariance 简称ANOVA 检验多个总体均值是否相等分析实验数据中不同来源的变异对总体变异的贡献大小 从而确定实验中的自变量是否对因变量有重要影响比较两个以上的样本平均数可以把方差分析看成是 检验的扩展分析两个以上的自变量的效应及其变量之间的交互作用 145 几个概念 因素 自变量independentvariable 处理treatment如 加工方式因素的水平 一个因素的不同情况或取值 不同的实验处理如 Counting Rhyming Adjective Imagery Intentional因变量 自变量影响的结果如 记忆效果单因素方差分析one wayANOVA只有一个因素 一个因变量多因素方差分析two three wayANOVA多个因素 一个因变量 146 方差分析的前提假设 正态normality方差齐性homogeneityofvariance变异可加 147 完全随机设计Completerandomizeddesign 被试完全随机取样 然后随机分成若干组 每个组随机指派一种实验处理 完全随机分组后 各实验组的被试之间是相互独立的 因而这种设计又称 独立组设计 或 被试间设计 不足之处误差项包括实验本身的误差又包括个体差异引起的误差 148 随机区组设计randomizedblockdesign 原则 同一组内的被试应尽量 同质 一个被试作为一个区组 不同的被试 区组 均需接受全部 个实验处理每一区组内被试的人数是实验处理的整数倍区组内的基本单元标识是以一个团体为单元完全区组设计随机选取区组被试 随机安排被试接收实验处理同一区组接受所有实验处理 实验处理之间有相关 所以也称为 相关组设计 或 被试内设计 完全随机设计变异的分解p265 方差分析表 方差分析的基本过程p267 建立假设H0 无处理效应H1 有处理效应求平方和确定自由度求均方进行F检验 单侧列出方差分析表 152 真题 研究教学方法对教学效果的影响 教学方法 A因素 分为启发式讲授法 a1 和传统讲授法 a2 两种 选取6个班的学生进行教学实验 随机分配3个班接受前一种教法 另3个班接受后一种教法 若把班别作为一个无关变量 B因素 含b1 b6 则以上实验设计应为 05单选 A 嵌套设计B 拉丁方设计C 随机区组设计D 完全随机设计每位被试接受所有实验处理的真实验设计属于 08单选 A 被试间设计B 被试内设计C 独立组设计D 完全随机设计 153 在一个两因素实验设计中 因素A有2个水平 因素B有3个水平 且要求接受每种实验处理条件的被试人数为4人 试确定 在采用完全随机设计和被试内设计两种条件下 各需要多少名被试 02简答 进行方差分析时 对所用数据的非必备条件是 03单选 A 组内平均数相等B 总体呈正态分布C 变异可加D 各组方差齐性方差分析的基本条件 05简答 154 五 一元线性回归 155 回归线theregressionline 156 一元线性回归 157 p365 158 估计的标准误P370standarderrorofestimate 159 确定系数 测定系数 r2coefficientofdetermination 衡量回归方程有效性高低的指标回归平方和在总离差平方和中所占的比例因变量的变异中可以从自变量的变异来解释的比例 160 对回归的有效性检验p368 161 真题 回归系数 04名词解释 在多元线性回归中 已知复相关系数R 0 80 则变量Y的变异由变量Xl和X2的回归所决定的比例为 02单选 A 0 80 3B 0 80 2C 0 80D 0 80 1 2测定系数 03名词解释 数据类型和统计方法
展开阅读全文
相关资源
相关搜索

当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!