第四章正态分布体育统计学33986

上传人:痛*** 文档编号:195030079 上传时间:2023-03-14 格式:PDF 页数:15 大小:803.19KB
返回 下载 相关 举报
第四章正态分布体育统计学33986_第1页
第1页 / 共15页
第四章正态分布体育统计学33986_第2页
第2页 / 共15页
第四章正态分布体育统计学33986_第3页
第3页 / 共15页
点击查看更多>>
资源描述
1 第四章 正 态 分 布 如果将第二章中的(表 2 1)中的数据绘制成直方图,把每个方条顶部中点联结起来,就得到一个图形,它称为频数多边形。(图4 1)当分组数很多,组距很小时,频数多边形就趋于类似(图 4 2)所示的平滑的曲线。这种曲线呈现出两侧近似对称的钟形。随机变量的类似这种分布,在自然界是相当普遍的其中最有代表性的是正态分布。下面就来介绍正态分布及其在体育中的几个应用。12345678910fx 图 4 1 频数多边形图 第一节 正态分布曲线的形式 如果随机变量 X 的概率密度函数为 y=21e222)(x(x)(4 1)2 则称随机变量 X 是服从正态分布的由上式绘出的图形叫做正态曲线。(图 4 2)X 的变动范围在 至+间。YX0 图 4 2 正态分布曲线 正态分布曲线中有两个参数:均值 及方差 2。为了应用方便,对式(4 1)中的随机变量经过一个称为标准化的变换,即令u 来代替原式中的 x,寻这时的随机变量 u 的概率密度函数成为:y=21e22u (4 2)按照(4 2)式绘出的图形,称作标准正态曲线。(图 4 3)Y00.40.30.20.1-1-2-3123 3 图 4 3 标准正态分布曲线 第二节 正态分布曲线的特征 正态分布曲线有许多特点,它们对实际工作有很大的帮助。它的主要特点有以下几个方面:一,正态分布的形式是对称的(但对称的分布不一定是正态分布)。在正态分布中均值与中位数相重合。二,从中央最高点逐渐向两侧降低,降低的速度是先慢后快,以后又再次减慢,最后接近横轴,但终究不能与横轴相交。三,从中央向两侧逐渐下降,它的方向是先向内弯,达到离均值左右各一个标准差时又改向外弯,是以 1 的点为曲线从内弯转向外弯的转折点,即正态曲线中标准差与曲线有固定的关系。四,因为正态曲线是对称的,在曲线下不仅平均数的两侧面积相等,各相当距离间的面积相等,而且各相当距离间的曲线高度也相等,正态曲线下(与横轴间)的总面积为 1.00。五,正态曲线可以有不同形式,它们的均值和标准差可以不相同,均值不同表明曲线在横轴上所处位置不同,标准差不同表明曲线的形态不同。标准差小则曲线高、且窄;标准差大则曲线低、且宽。(图4 4)由式(4 1)和(4 2)知,标准正态曲线的 =0,=1,即标准正态曲线是关于纵轴对称;它在 =0 时,有最大值,它近似等于 0.4,如(图 4 3)所示。4 YX0=0.5=1=2 图 4 4 三种不同形式的正态分布曲线 第三节 正态分布表 从某市 17 岁男生中随机抽出 205 人测量身高,由这个样本计算得到 X=168.40 厘米,S=6.13 厘米。假定该市 17 岁男生身高服从正态分布,试估计身高在 16.40 172.40 厘米之间的人数。求解这类问题的一般方法是:求从正态总体中随机选取一个个体的测量值落在区间(a,b)上的概率。这个概率在标准正态曲线下就是曲线、X 轴、直线 X=a 和 X b 所围成的面积。(图 4 5)当概率 P 求得后,要求的人数约等于总人数乘以 P 值。Y00.1-1-2-31230.20.40.3ab 5 图 4 5 随机变量 X 在区间(a,b)内取值的概率示意图 表的左边第 1 列这横轴上的位置,它是指横轴上某一点与平均值的距离,以标准差为单位来表示,通常记为 u,即 u=x (4 3)表上边的第 1 行为 u 值的第 2 位小数。表的主体部分是各 u 值与均数(u=0)之间所对应的单侧面积(或概率)。一、知 U 值求对应的面积 例 4 1 求 u 值为 1 至+2 之间对应的面积。解:由于标准正态曲线是关于 x=u 对称的均数处的 u 值为零,所以 u 值在 1 至 0 这间对应的面积与它在 0 至+1 之间的对应面积相等。查书后附表 1 得 u 值在1 至 0 的对应面积是 34.13%;u值在 0 至+2 之间的面积是 47.72%。前者在均值的左边,后者在均值的右边,因此这两块面积之和便是所求面积。(图 4 6)即:34.13%+47.72%=81.85%0-12=+81.85%34.13%47.72%00-12 图 46 例 4 2 本节开始提出的问题,即试估计身高在 160.40 172.40 厘米之间的人数。解:首先要求出身高为 160.40 厘米和 172.40 厘米的 u 值,按式(4 3)有(当 u 和 未知时,可用 X 和 S 近似代替):6 u1 =13.640.16840.160=1.31 u2 =13.640.16840.172=0.65 查书后附表1 求 u1、u2 所对应的面积。u1=1.31 所对应的面积是 40.49%,u2=0.65 所对应的面积是 24.22%。u 值1.31 至 0.65所对应的面积为 40.49%+24.22%=64.71%,见(图 4 7)所示,于是身高在 160.40 172.40 厘米之间的人数约为 20564.71%133(人)。0-1-21224.22%40.49%172.40米160.40米0.65-1.31 图 47 估计身高在 160.40172.40 厘米间的人数百分数 二、已知面积求对应的 U 值 例 4 3 试求从+1 向右到什么位置对应的面积为 14.15%?解:设从+1 向右到+k 对应的面积为 14.15%。查标准正态分布表知+1对应的面积是 34.13%。24.13%+14.15%=48.28%,就是 u 值从 0 到+k 之间对应的面积。查书后附表 1 和 K=2.11,即从+1 向右到+2.11 之间对应的面积为 14.15%。(图 4 8)从标准正态分布表中,可以找出标准正态曲线下面的分布规律。在下表中列出的五个分布位置与其对应的概率是统计中电子学用到的,应该熟记。7 +1+2.11 图 4 8 从+1+2.11对应的面积 表 4 1 正态曲线下的概率分布 u 该范围具有的概率 1 68.26%1.96 95.00%2 95.44%2.58 99.00%3 99.73%第四节 统计资料的正态性检验 正态分布的理论适用于正态或近似正态分布的资料。对样本要想用正态分布理论进行分析,首先要检验样本是否为正态分布。检验的方法有多种,简单而实用的方法是“概率格纸绘图法”。这种方法使用的概率纸是正态概率纸,它的横轴是普通的刻度,纵轴是按正态分 8 布的规律刻划的。使用时,先根据样本数据求出累计频率,然后根据累计频率和组限,将其点绘在正态概率纸上,如果样本资料是呈正态分布的则所有点几乎在一条直线上。例 4 4 广州市某中学初中生 800 米跑的抽样测验成绩的累计频率如下表所示,试检验该资料是否近似正态分布?组 限 频 数 累计频数 累计频率(%)732 1 1 0.8 442 6 7 5.6 152 15 22 17.6 852 20 42 33.6 503 27 69 55.2 213 25 94 75.2 913 21 115 92.0 623 6 121 96.8 333 2 123 98.4 043 2 125 100.0 由样本计算得:X=2303 ,S=421 然后根据每组的下限值和相应的累计频率,将它们分别标在图上。根据点的分布趋势画一直线,观察这些点的分布是否接近一条直线。在画直线时应以靠近中部的点为主,两端的点为辅,因为中部的点的组频数大,所以占比重也大。由(图 4 9)可见,所有的点几乎都在一条直线上,故该样本资料接近于正态分布。9 0.010.11510203040506070809095992 512223333337 4458 05 12 1926 3315.872 503 02 891 图 49 当样本资料符合正态分布时,籍助正态概率纸做图,还可以对 和 作出近似地估计。从正态分布理论知道累积频率为 50%的位置应在中点,即接近均数位置。从纵轴 50%的位置画横线与钭线交于 a 点,由不得 a 点向横轴做垂线交于 点,其值为 8203 ,即为估计均数,它与计算值 2203 仅相差 50。又知均数减一个标准差位置的面积为 34.13%,故在纵轴上的应是 50%34.13%=15.87%(b 点),以此划横线交于钭线上 c 点,向横灿做垂线交于 9052 处,此 点 距 均 数 的 长 度 应 为,故 估 计 标 准 差 的 值 为:91190528203 。计算值为 421 ,仅相差 50。只要图做得准确,这些估计值也还是比较精确的。10 第五节 可疑数据的舍取 在实际工作中,往往能够发现样本资料中具有个别突出的数值(特大或特小的数值)。按样本数据系列大小顺序来看,发现这些突出的数值和其他数值之间有明显脱节现象。这种现象使人们怀疑这些特别数值是否属于研究的总体,于是把这些数据称为可疑数据。人们把来自非同一总体的极端值,称为异常数据。样本中的异常数据应当及时剔除,否则会影响样本均数和标准差等统计量及计算结果的准确性。如何判断可疑数据是否为异常数据,方法不少,下面介绍适用于正态分布,且数据个数不多时,比较常用而有效的戈罗伯斯(Grubbs)检验法。设 x1,x2,x n来自正态分布的总体,将它们按大小重新排列,记为 x(1)x(2)x(n)。首先计算出可疑数据的 g n 值,其公式为:g n =s|xx|(4 4)式中 x 表示可疑数据值,若计算得 g n 值大于(表 4 2)中的临界值 an,则认为 x 是异常数据,应舍弃。若小于临界值,则 x 为正常数据,应保留。表 4 2 戈罗伯斯检验临界值(an)表 =0.05 n an n an n an n an n an 3 1.15 12 2.29 21 2.58 30 2.96 40 2.87 4 1.46 13 2.33 22 2.60 31 3.03 50 2.96 5 1.67 14 2.37 23 2.62 32 3.09 60 3.03 6 1.82 15 2.41 24 2.64 33 3.14 70 3.09 7 1.94 16 2.44 25 2.64 34 3.18 80 3.14 11 8 2.03 17 2.47 26 2.75 35 3.21 90 3.18 9 2.11 18 2.50 27 2.82 36 3.23 100 3.21 10 2.18 19 2.53 28 2.87 37 3.24 110 3.23 11 2.23 20 2.56 29 2.92 38 3.25 120 3.24 例 4 5 为了解一般高中学生跳高水平,由随机样本计算得到统计量如下:n=100 人 x=1.31 米 s=0.09 米 假定这些学生跳高成绩的分布呈正态分布。其中有一名学生的成绩是1.65 米,这个成绩超出平均水平三个标准差以上,是个可疑数据。试检验它是否为异常数据。按公式(4 4)计算 g n =s|xx|=09.0|31.165.1|3.78 查(表 4 2)n=100 对应的 an 值是 3.21,现计算 值是 3.78,大于临界值,故 1.65 米是异常数据应舍弃。据了解,该学生是少体校学生,受过专项训练,不属于一般高中学生跳高水平研究的总体。第六节 正态分布理论在体育中的两个应用 一、制定测验标准 制定测验标准是体育教学和训练中的一项重要工作,一般是根据学生原有的基础和不同阶段教学目的与要求,事先规定达到各标准的人数比例,并将这个比例数看作正态分布曲线下的面积,然后利用标准下正态分布表去推算相应标准的具体成绩。例 4 6 某学校某年级在进行跳高教学之前,从该年级随机抽出一部分学生测验其跳高成绩。现由样本计算得到统计量为:12 x=1.40 米,S=0.10 米 学校方面根据学生在跳高上的基础水平和教学的要求,规定就目前状况达到优秀的人数比例为 10%,良好的人数比例为 20%,有 15%的人不能及格,试用统计方法求出以上三个标准的具体成绩。123-1-2-3 15%20%10%cba-1.040.521.281.30米1.45米 1.53米 图 410 跳高测验标准的确定 计算过程如下:人数比例 查标准正态分布表的面积 u 值 标准)sux(10%(优)50%10%=40%1.28 1.40+1.280.10=1.53(米)20%(良)50%10%20%=20%0.52 1.40+0.520.10=1.45(米)15%(不及格)50%15%=35%1.40 1.401.040.10=1.30(米)综上所述,优秀标准的成绩是 1.53 米;良好标准的成绩是 1.45 米;及格标准的成绩是 1.30 米。二、估计达标人数 13 以上阐述的是已知达标人数比例,求出这一标准的具体成绩,下面是叙述先定出具体的成绩标准,而后要求估计出达到标准的人数百分比。这实际上是已知 u 值求对应正态分布曲线下面积的问题。例 4 7 某学校对某年级男生的跳远教学测验成绩作出如下规定:成绩为 5.60 米以上者得 5 分;5.40 米以上者得 4 分;4.60 米以上者得 3 分。教师从该年级男生中随机抽出部分学生进行测验,得到 x=5.00 米,S=0.40 米,试估计该年级男生得各分值的人数比例。123-1-2-34.60米5.40米5.60米(1.5 )得3分的人数百分数得4分的人数百分数得5分的人数百分数 图 411 跳远达标人数的估计 计算结果如下:标 准 u 值(sxx)面积(A)达标人数比例 分值 成 绩 5 分 5.60 米以上 (5 605.00)/0.40=1.5 43.32%50%43.32%=6.7%4分 5.40米以上 (5.405.00)/0.40=1.0 34.13%50%43.32%6.7%=9.2%14 3 分 4.60 米以上 (4.605.00)/0.40=1.0 34.13%34.13%34.13%=68.26%综上所述,该年级男生跳远得 5 分的人数比例是 6.7%;得 4 分的人数比例是 9.2%;得 3 分的人数比例是 68.26%。如果用该年级男生的总人数乘以各人数比例,便可估计达到各标准的人数。习 题 四 1什么是正态分布、标准正态分布?正态分布的特点是什么?如何使用正态分布表?2在正态分布表中,下列范围包括的面积占总面积的百分之几?(1)1.1;(2)58.2;(3)2.1 4.1间。3在正态分布中,已知 k 间包括的面积是 34%,求 K 值为若干?4某年级有 216 名学生,随机抽出部分学生测验跳远成绩得到样本统计量为 x=4.40 米,S=0.42 米。如规定 2.80 米是及格标准,试估计该年级可能有多少人不及格?5 用正态概率纸检验第二章第七节所列出的 31 名大学生简单视反应数据资料是否服从正态分布。6某地区有一万名初中男生,抽样得到百米赛跑运动成绩的统计量为:x=541 ,S=50。(1)若提出一胩锻炼标准,按现在的情况只能有 30%的人达标,那么这个标准的运动成绩定为多少秒合适?(2)如果开运动会,按目状况估计能有多少人达到或者突破 31 的成绩?(3)希望定出一个水平为“中等”的能够包括 6000 人的成绩范围。计算时如果要求以样本平均数为中点,那么这个范围的上下限 15 的运动成绩各是多少秒?7某体重记录资料的样本含量为 n=15,统计量为 x=82.5 公斤,S=0.5 千克。若其中某一数据为 89.4 千克,试检验此数据是否为异常数据?
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!