《试验资料的整理》PPT课件.ppt

上传人:za****8 文档编号:6145403 上传时间:2020-02-17 格式:PPT 页数:41 大小:903.06KB
返回 下载 相关 举报
《试验资料的整理》PPT课件.ppt_第1页
第1页 / 共41页
《试验资料的整理》PPT课件.ppt_第2页
第2页 / 共41页
《试验资料的整理》PPT课件.ppt_第3页
第3页 / 共41页
点击查看更多>>
资源描述
第三章试验资料的整理 从次数分布表或次数分布图中 可以看出一个资料变数的分布特点 即集中性和离散性 集中性是指资料中的各观察值总是以某 数值为中心分布 离散性是指资料中各观察值的离散 变异程度 但是从次数分布表和次数分布图中只能看出一个大致趋势 且不能以此做统计处理 3 4资料的描述 因此 为了使资料得到完整的描述 还需要从中概括出一些能够反映资料特征的数量指标 这些数量指标称为试验资料的特征数 表示集中性的特征数有算术平均数 几何平均数 众数 中数 表示离散性的特征数有极差 方差 标准差和变异系数 一 平均数 mean 平均数是统计学中最常用的统计数 表示资料中观测值的中心位置 作为资料的代表与另一资料相比较 主要有算术平均数 中位数 众数 几何平均数等 加权法 一 算术平均数 arithmeticmean 直接法 2 算术平均数的基本性质 性质1样本各个观察值与平均数之差的和为零 即离均差之和为零 证明 性质2样本各观察值与平均数之差的平方和为最小 即离均差的平方和最小 证明 将资料中所有观测值从小到大依次排列 位于中间位置的观测值 称为中位数 简称中数 记作Md 二 中位数 对于未分组资料 先将观测值由小到大依次排列 1 当观测值个数为奇数时 n 1 2位置的观测值为中位数 即 2 当观测值个数为偶数时 n 2和n 2 1位置的两个观测值之和的1 2为中位数 即 资料中出现次数最多的那个数或次数最多一组的组中值称为众数 记为Mo 表3 5所列的100株大豆单株节数的次数分布表中 17出现的次数最多 则该资料的众数为17 表3 3所列的100株小麦株高的的次数分布表中 88 5 91 5这一组的次数最多 其组中值为90cm 则该资料的众数为90cm 三 众数 四 几何平均数 n个观测值相乘之积开n次方所得数值 称为几何平均数 记作G 或 几何平均数常用于表示某现象的平均发展速度 如计算若干天内 某种植物株高 根长 生长重或某种昆虫繁殖 每天各为上天的平均倍数等 用几何平均数能比算术平均数更准确地反映实际情况 调查某麦田百株上蚜虫发生情况如表3 8 例3 6 试求百株蚜虫平均每天繁殖量各为上天的多少倍 3 09 2 38 1 54 1 27 每天繁殖量为上天的倍数 即百株麦蚜在4天中 平均每天繁殖量各为上天的1 95倍 我们可以验证 6月27日百株麦蚜为110头 4天后为110 1 954 1590 头 与7月1日实际虫数相符 如若用算术平均数计算就不会符合了 这说明此类问题用几何平均数计算更为确 平均数作为数量资料的代表值 其代表性的强弱 取决于资料内各观察值变异程度的大小 例如有A B两组数据 3 5变异数 B组10 110 50 90 40 A组60 58 60 61 61 虽然两组的平均数都是60 但两组数据的变异程度有很大不同 所以只用平均数表示资料特征是不够的 为了更全面地描述一个数量资料 还必须有一个度量其变异程度的特征数 60 60 度量一个数量资料的变异程度的特征数叫变异数 最常用的变异数有 极差 方差 标准差 变异系数 1 极差 极差 R 是表示资料中各观测值变异程度大小最简便的统计数 但计算极差时 只用资料中的最大值和最小值 因而极差不能准确表达资料中全部观测值的变异程度 当资料很多而又要迅速对资料的变异程度作出判断时 可利用极差 设一样本有n个观测值 为了准确描述样本内各观测值的变异程度 人们首先想到以平均数为标准 求各个观测值与平均数的差 即离均差 2 方差 但由于离均差之和为零 不可能把离均差之和作为描述样本内所有观测值总变异程度的统计数 离均差大 变异就大 反之变异就小 将每个离均差平方 进而求得离均差的平方和 简称平方和 记作SS 用来反映资料所有观测值的总变异程度 由于平方和常随样本容量n而改变 为了消除样本容量的影响 用平方和除以样本容量n 即 求出离均差平方和的平均数 为了使所得的统计数是相应总体参数的无偏估计量 统计学证明 在求离均差平方和的平均数时 分母不用样本容量n 而用自由度n 1 用统计数表示资料所有观测值的总变异程度 统计数称为均方 缩写为MS 又称样本方差 记为s2 即 2 方差 相应的总体参数叫总体方差 记为 2 对于含有N个个体的有限总体而言 2的计算公式为 样本方差s2是总体方差 2的无偏估计值 无偏估计值 在统计上 如果所有可能样本的某一统计数的平均数等于总体的相应参数 则称该统计数的相应参数的无偏估计值 例 有一个有限总体 3 4 5 从中抽样 n 2 所有可能样本为几个 共9个样本 某一统计数 平均数 样本方差的平均数 可求得 4 为 2 0 6667 0 8165 现以n 2作独立的放回抽样 总共得N2 9个样本 有一个N 3的近似正态总体 具有变量3 4 5 根据表的资料可得 样本平均数的平均数 样本方差的平均数 样本标准差的平均数 无偏估计 在统计上 如果所有可能样本的某一统计数的平均数等于总体的相应参数 则称该统计数为相应参数的无偏估计 虽然方差全面的反映了其变异度 但是由于采用了平方的形式 度量单位也随之平方 另外平方使数值量也增大了 与实际变异度有相当差距 为此 把方差开平方还原 就得到一个新的变异数 标准差 3 标准差 简写为 或 统计学上把样本方差S2的平方根叫做样本标准差 记为S 即 自由度 前式中 根号里面分母n 1称为离均差平方和的自由度 简称为自由度 记为d n 1 其统计意义是指在计算离均差平方和时 能够自由变动的离均差的个数 在计算离均差平方和时 n个离均差受到这一条件的约束 能自由变动的离均差的个数是n 1 一般 在计算离均差平方和时 若约束条件为k个 则其自由度d n k 当n 1个离均差确定了 第n个离均差也就随之而定了 不能再任意变动 如n 5 前四个离均差2 1 0 1 那么由于离均差受 第五个离均差肯定是 2 1 直接法对小样本 n 30 和未经分组的资料 直接利用下式计算标准差 标准差的计算 有5株大麦单株粒重资料如下 3 7 6 4 5 N 5 试计算标准差 单位g 例3 7 对于大样本 n 30 且已分组的资料 可在次数分布表的基础上采用加权法计算标准差 计算公式为 2 加权法 其中 f为第i组的次数 x为第i组的组中值 n为样本观测值的总个数 例3 6 由表3 3计算100株小麦株高的标准差 即100株小麦的株高标准差为5 44 cm 标准差带有与样本资料相同的度量单位 不能用来比较度量单位不同 或者度量单位相同但平均数不同的两个或多个样本资料的变异程度的大小 需引入另一个度量资料变异程度的统计数 使其既能反映样本资料的变异性 又能解决度量单位及平均数不同的问题 4 变异系数 变异系数正是这样的统计数 变异系数是一个不带单位的纯数 可用以比较两个或多个样本资料变异程度的大小 变异系数是样本标准差与样本平均数的比值 以百分数形式表示 计算公式为 例3 8 A品种小麦株高的整齐度好于B品种 问两个小麦品种株高整齐度哪个比较好 A小麦品种CV 9 02 95 100 9 5 B小麦品种CV 8 05 75 100 11 3 1 离散性和集中性 众数和中数 2表示离散性和集中性的特征数有哪些 3平均数的意义是什么 算术平均数有哪两个重要特征 证明过程也要掌握 4变异数的意义是什么 习题 5 教材习题 3 3 3 6 6 思考题
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!