资源描述
单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,正态分布,1.1 什么是正态分布?,对于连续型随机变量而言,正态分布是最重要的一种概率分布,其外形似“钟型”。,阅历说明:对于其值依靠于众多微小因素且每一因素均产生微小的或正或负影响的连续型随机变量来说,正态分布是一个相当好的描述模型。如身高、体重、考试成绩等。,为了便利,通常用:,表示随机变量X听从正态分布。,符号表示随机变量听从什么样的分布;,N表示正态分布;,,为正态分布的总体均值或期望和方差。,X是一个连续型随机变量,可在区间,+内任意取值。,-,-2,2,68%近似,3,-3,95%近似,99.7%近似,正态曲线下的区域示意图,1.2 正态分布的性质:,正态分布曲线以均值为中心,对称分布。,正态分布的概率密度函数呈中间高、两边低,在均值处到达最高,向两边渐渐降低,即随机变量在远离均值处取值的概率渐渐变小。,正态曲线下的面积约有68%位于 两值之间;约有95%面积位于2之间;约有99.7%的面积位于 3之间。这些区域可用作概率的度量。,正态分布可由两个参数,来描述,即一旦知道,的值,就可以依据附录表查到随机变量X落于某一区间的概率值。,两个或多个正态分布随机变量的线性组合仍听从正态分布。该性质很重要,解释如下:,令:,假定,X,和,Y,相互独立,设,a、b,为常数,考虑线性组合:,W=aX+bY,则有:,其中,,1.3 标准正态分布,由于期望和方差的不同,正态分布之间会存在确定的区分见以以下图,如何将其简洁化,从而引入标准正态分布。,1,2,不同均值,同方差的两个正态分布图,1,2,1=,2,不同均值,不同方差,一样均值,不同方差,标准正态分布,假设变量X的均值为,方差为,定义一个新的变量Z,,则依据性质5,变量Z的均值为0,方差为1。在统计学中,我们称之为单位或标准正态变量,用符号表示为:,任一给定均值和方差的正态变量都可转化为标准正态变量,将其标准化可以大大简化计算。,例:变量X表示面包房每日出售的面包量,假定它听从均值为70、方差为9的正态分布,即XN(70,9),求任给一天,出售面包数量大于75条的概率。,首先,定义变量Z,Z=(75-70)/31.67,求:P(Z1.67),查正态分布表得:,P(0Z1.67)=0.4525,则:P(Z1.67)=0.5-0.4525=0.0475,即每天出售面包的数量超过75条的概率为0.0475。,1.67,0,0.4525,0.0475,f(Z),标准正态变量概率密度函数,t,分布,回忆:假设样本均值 ,则变量Z听从标准正态分布。,即:,假定和的估量量S,则可以用样本标准差S代替总体标准差,得到一个新的变量t。,依据统计理论得知:变量t听从自由度为(n-1)的t分布。,留意:在这里,自由度为(n-1),而不是n。,结论:从正态总体中抽取随机样本,假设该正态总体的均值为,但方差用其估量量S来代替,则其样本均值听从t分布。通常用符号tk表示,其中k表示自由度。,k=120(正态,K=20,K=5,0,不同自由度下的分布,t,分布的性质,t分布与正态分布相类似,具有对称性。,t分布的均值与标准正态分布均值一样,为0,但方差为k/(k-2)。由此,在求t分布的方差时定义自由度必需大于2。,标准正态分布的方差等于1,因此,t分布方差总大于标准分布的方差,也就是说,t分布比正态分布略“胖”些。,t分布与正态分布:,当k增大时,t分布的方差接近于标准正态分布方差值1。,例如:当k=10时,t分布的方差为10/8=1.25;,当k=30时,t分布的方差为30/28=1.07;,当k=100时,t分布的方差为100/98=1.02;,结论:随着自由度的渐渐增大,t分布近似于正态分布。,留意:对于t分布,不要求其样本容量很大,k=30时,t分布与正态分布已很近似。,t,分布表的使用:,0,-1.812,1.812,例:自由度为10,,P(t1.812)=P(t1.812)=P(t1.812)+P(t,0,x,=,0,x,0,x,=,0,x,0,t,检验小结,最终一列给出了t临界值,第一个下标表示显著水平,d.t代表自由度。,
展开阅读全文