数理统计CH抽样分布0000

上传人:仙*** 文档编号:52173061 上传时间:2022-02-07 格式:PPT 页数:64 大小:604KB
返回 下载 相关 举报
数理统计CH抽样分布0000_第1页
第1页 / 共64页
数理统计CH抽样分布0000_第2页
第2页 / 共64页
数理统计CH抽样分布0000_第3页
第3页 / 共64页
点击查看更多>>
资源描述
2022-2-3王玉顺:数理统计02_抽样分布1Sample Distribution2022-2-3王玉顺:数理统计02_抽样分布2使用随机变量X,首先要弄清它的概率分布而实际上往往对X的概率分布一无所知,或者只知分布类型却不知分布参数探明概率分布的唯一方法是相同条件下对X做n次独立重复试验,获得一个称作样本的试验结果序列X1,X1,Xn;样本分量的某种组合(函数)称作统计量;统计量的分布函数和概率密度称作抽样分布。引言引言( (Foreword) )2 抽样分布2022-2-3王玉顺:数理统计02_抽样分布3本章内容2 抽样分布n2.1 总体与样本n2.2 抽样分布n2.3 统计量分位数n2.4 抽样分布定理n2.5 中心极限定理2022-2-3王玉顺:数理统计02_抽样分布4随机试验()复习两个概念2 抽样分布满足下述三个条件的试验称为随机试验:(1)试验可在相同条件下重复进行;(2)试验的所有可能结果是明确可知的,并且不止一个;(3)每次试验总是恰好出现这些可能结果中的一个,但在试验之前却不能肯定会出现哪一个结果。 在统计学里可简称为。 2022-2-3王玉顺:数理统计02_抽样分布5随机试验的所有可能结果所组成的集合称为样本空间样本空间,样本空间里的元素,即随机试验的每一个结果,称为样本点。样本点。(样本空间()复习两个概念2 抽样分布2022-2-3王玉顺:数理统计02_抽样分布62.1 总体和样本Population and Sample2 抽样分布2022-2-3王玉顺:数理统计02_抽样分布72.1 总体和样本研究对象的全部或集合(对象整体)随机试验所有可能结果的集合(样本空间)随机变量X的所有可能观察值(数值集合)总体亦称作母体总体可划分为有限和无限两大类,有限总体可扩展为无限总体(1)总体()2022-2-3王玉顺:数理统计02_抽样分布8理解下面的总体:研究中国的电视机寿命:中国的全部产品或其的集合;研究山西农业大学大学生的数学水平:山西农业大学的全部或其的集合;研究山西农业大学班级的运动成绩:山西农业大学的全部或其的集合。2.1 总体和样本(1)总体()总体的构成元素和疆域由问题界定2022-2-3王玉顺:数理统计02_抽样分布92.1 总体和样本由于随机变量X代表所有可能的观察值,即它代表所研究问题的总体,故常称今后,所研究问题的总体常用随机变量X来指代,即采用下面的陈述:(1)总体() 2,XB n pXPXN 总体总体总体2022-2-3王玉顺:数理统计02_抽样分布102.1 总体和样本构成研究对象整体的一个分割单位(单位)随机试验的一个可能结果(样本点)随机变量X的一个可能观察值(变量值)个体有数值型和非数值型两种(2)个体()总体和个体是彼此对立的两个概念2022-2-3王玉顺:数理统计02_抽样分布11理解下面的个体:一台电视机或一台电视机的寿命观测一个学生或一个学生的数学成绩一个学生班或一个学生班的运动成绩2.1 总体和样本(2)个体()个体的大小和疆域由问题界定2022-2-3王玉顺:数理统计02_抽样分布122.1 总体和样本(3)抽样() 从总体中选取或抽取若干个个体称作抽样。总体中每个个体被抽到的概率都一样,称作机会均等。按原则选取若干个个体的行为或过程,称作( )。 2022-2-3王玉顺:数理统计02_抽样分布132.1 总体和样本对总体 实施 次随机抽样,可视作对 个随机变量 做 次独立重复试验。试验序号做下标,随机变量 的 次试验或抽样记作或(),即随机变量系或随机向量,称该随机变量系或随机向量为样本(sample),称 为样本容量(sample size)。(4)样本()样本是总体的一个子集样本是 次抽样 个随机变量的合称2022-2-3王玉顺:数理统计02_抽样分布142.1 总体和样本试验或抽样后,获得随机变量系的一组试验结果,或随机变量 的 次试验结果,它们就合称为样本观察值(observation);样本观察值记作实数向量 () 或一组实数;注意:样本是随机变量系或随机向量,每个分量都是随机变量;样本观察值是实数向量,每个分量都是实数数值。(5)样本观察值()样本观察值是样本的一次实现2022-2-3王玉顺:数理统计02_抽样分布152.1 总体和样本样本被视作对随机变量 实施 次重复独立的随机试验;次重复独立随机试验的可能样本观察值不止一组,每次试验恰好出现所有可能观察值的一组,但试验前并不知道会出现哪一组;样本和样本观察值常不加区分统称为样本(6)从随机试验角度看样本注意样本的随机性2022-2-3王玉顺:数理统计02_抽样分布162.1 总体和样本满足下面三个条件称作简单随机样本:对总体 的抽样是随机抽样(等概抽样);样本各个分量彼此相互独立,即每次抽样的事件概率与以往抽样无关;样本 各个分量的分布相同。对一个总体的重复抽样自然满足同分布。等概、独立、同分布抽样获得简单随机样本以后不加特别声明“样本”指简单随机样本(7)简单随机样本( )2022-2-3王玉顺:数理统计02_抽样分布172.1 总体和样本若样本的函数不含任何未知参数,则称 为统计量。统计量有三个特征:统计量仍是随机变量;统计量不含任何未知参数;统计量有相应的概率分布(称作抽样分布)(8)统计量()2022-2-3王玉顺:数理统计02_抽样分布182.1 总体和样本nXXX,21抽样2,N222212212111()nnnXXXXXXXXn若未知但已知,试判断右方所示的样本函数是否是统计量?(8)统计量()2022-2-3王玉顺:数理统计02_抽样分布192.1 总体和样本几个常用的统计量:(8)统计量()122111()1100niiniiXXnSXXnSCvX样本均值样本方差样本变异系数2022-2-3王玉顺:数理统计02_抽样分布20总体、样本和统计量构成统计学最基本的概念和关系;统计量是样本的函数;统计量也是随机变量,引入这个术语只不过是特别强调它产生的过程,总体-样本-统计量。因此,统计量也有概率分布,特别地称作抽样分布。2.1 总体和样本(9)小结()2022-2-3王玉顺:数理统计02_抽样分布212.2 抽样分布 Sample Distribution统计量的概率分布称作抽样分布2 抽样分布2022-2-3王玉顺:数理统计02_抽样分布22 许多研究问题可归结为对随机变量 的观测。 是研究对象,表示全部可能的试验结果,称其为总体 (), 的分布称作总体分布。从总体 中随机地抽取若干个个体()称作抽样(),抽取的个个体称作样本(),构建样本的某种函数即统计量(),统计量的分布称作抽样分布()。统计量可用于推断总体的统计规律及特征。2.2 抽样分布为什么研究抽样分布?样本是总体的近似或代表2022-2-3王玉顺:数理统计02_抽样分布232.2 抽样分布对正态总体抽样获得容量为 的样本,由样本构造 、 、和 四种统计量,分别服从 、 和 四种分布,称作数理统计学的四大概率分布或抽样分布。对于正态总体抽样获得的样本统计量,可由四大分布构造出精确的;所谓,是指样本容量 无论多小也能精确计算抽样观测事件的概率;为什么研究抽样分布?正态总体抽样的四大分布2022-2-3王玉顺:数理统计02_抽样分布242.2 抽样分布对于非正态总体抽样获得的样本统计量,当 充分大时,某些统计量的分布趋近正态分布(极限分布为正态分布),可由四大分布构造出近似的。 所谓,是指样本容量n需要足够大,由正态总体抽样的四大分布近似计算抽样观测事件的概率;为什么研究抽样分布?正态总体抽样的四大分布2022-2-3王玉顺:数理统计02_抽样分布252.2.1 分布Chi-Square D22.2 抽样分布2022-2-3王玉顺:数理统计02_抽样分布26为检验实际分布与理论分布的吻合程度,即拟合优度检验(),英国统计学家(卡尔皮尔逊)于年提出一个新统计量(),从而创立了卡方分布(Chi-square );卡方分布衍生自正态分布;由卡方分布创建了许多重要的统计方法,如适合性检验、方差检验、列联表分析等。(1)2分布简史2.2.1 分布22022-2-3王玉顺:数理统计02_抽样分布272,iiiXXNZ (2) 统计量22.2.1 分布2设样本X1,X2,Xn来自正态总体N(,2),即各个样本分量独立同分布且是正态分布,则它们标准化随机变量的平方和222212nZZZ服从自由度的卡方分布(Chi-square ),记作 222或ndf2022-2-3王玉顺:数理统计02_抽样分布28若统计量的表达式仅含有df个独立随机变量,亦即该统计量是df个独立随机变量的函数,则该统计量的“自由度”为df;确定统计量自由度的方法是:若统计量表达式不仅包含n个独立的随机变量,还包含由该n个独立随机变量所构成的k个样本统计量,则统计量的自由度df=n-k。(3) 统计量的自由度22.2.1 分布22022-2-3王玉顺:数理统计02_抽样分布292.2.1 分布2(4) 统计量的概率密度222212122221022;( ; )0,0nnxndfnxzzzxexnf x nx nx,统计量的概率密度是观测x和自由度n的函数22022-2-3王玉顺:数理统计02_抽样分布302.2.1 分布2(4) 统计量的概率密度2其中,卡方分布概率密度中的函数具有下面的取值规律: 100111121,2,1!xxe dx 函数递推公式:函数定义:特殊函数值:正整数函数值:2022-2-3王玉顺:数理统计02_抽样分布31 22111200022200122112222122令xxxttexe dxxe dxdxxtxdxtdtedtedt 2.2.1 分布2(4) 统计量的概率密度2正态概率积分2022-2-3王玉顺:数理统计02_抽样分布322.2.1 分布2(4) 统计量的概率密度22分布是一种左倾的偏态分布,自由度n是它的唯一分布参数;n愈小2观察值愈集中于左侧,峰值升高而右尾收缩变细;n愈大2观察值愈向右分散,峰值降低而右尾扩伸变粗;概率密度曲线愈来愈对称。2022-2-3王玉顺:数理统计02_抽样分布332.2.1 分布2(5) 统计量概率密度的证明2引用浙大概率统计教材P63例3所证明的标准正态随机变量平方Y=Z2的分布:122212iiyiiYiiYZfyy e 1,; ,yYfyye 引用分布定义:2022-2-3王玉顺:数理统计02_抽样分布342.2.1 分布2(5) 统计量概率密度的证明2 11 2121121 222,; ,1 211 221 1,2 2iiiyyyYiiiiiYfyyefyy eyeYZ 比较分布可知,Z2服从(1/2,1/2):2022-2-3王玉顺:数理统计02_抽样分布352.2.1 分布2(5) 统计量概率密度的证明2 2222212122221212112221 1,1,2,2 2,21;22iinnnnnxxnZinZZZnxzzzf x nxexen 引用教材P97-P99例3所证明的分布可加性2022-2-3王玉顺:数理统计02_抽样分布362.2.1 分布2(6) 分布的性质2期望和方差:222EnVarn222211122211422110()() ()312niiniiEEZnEZnnVarVarZn Var ZnE Zn E Znnn 2022-2-3王玉顺:数理统计02_抽样分布372.2.1 分布2(6) 分布的性质2设ZN(0,1),则概率密度为 2212zf ze 22222222222222121122210 112zzzzzE Zz f z dzzedzzzedzd ezeedz 2022-2-3王玉顺:数理统计02_抽样分布382.2.1 分布2(6) 分布的性质2设ZN(0,1),则概率密度为 2212zf ze2222222443223322222211222113221332zzzzzzzE Zzedzz edz d ez ezedzzedz 2022-2-3王玉顺:数理统计02_抽样分布392.2.1 分布2(6) 分布的性质2卡方分布可加性:利用 分布可加性可简便地推证,两独立卡方统计量之和服从自由度相加的卡方分布:222212112222212121211,2 2221,22nnnnnnnn 2022-2-3王玉顺:数理统计02_抽样分布402.2.1 分布2(6) 分布的性质2大数定律:当n+时,2(n)分布趋于均值等于n 、方差等于2n的正态分布;概率密度曲线愈来愈对称;应用:只要自由度n足够大, 2(n)分布就可用N(n,2n)正态分布近似。2022-2-3王玉顺:数理统计02_抽样分布412.2.2 t 分布Student D2.2 抽样分布2022-2-3王玉顺:数理统计02_抽样分布42William Sealy Gosset(威廉姆斯戈赛)在1908年发表的一篇论文中首先推导出t-分布当时Gosset在都柏林的Guinness(强性黑啤酒)啤酒厂工作,由于被禁止以他本人的名义发表论文,所以使用了Student(学生)这一笔名之后英国统计学家R.A.Fisher(罗纳德费雪)的工作发扬光大了t检验及相关理论,正是他将此分布称为student distribution(学生分布)(1) t 分布简史2.2.2 t 分布2022-2-3王玉顺:数理统计02_抽样分布43 The derivation of the t-distribution was first published in 1908 by William Sealy Gosset, while he worked at a Guinness brewery in Dublin. He was not allowed to publish under his own name, so the paper was written under the pseudonym Student. The t-test and the associated theory became well-known through the work of R.A. Fisher, who called the distribution Students distribution. (1) t 分布简史2.2.2 t 分布2022-2-3王玉顺:数理统计02_抽样分布44(2)T统计量的定义2.2.2 t 分布设ZN(0,1)和 22(n),且它们相互独立,则由标准正态Z统计量与自由度为n的2统计量所构建的新统计量:2ZTn服从自由度为n的t分布(t-distribution or student distribution),且自由度n是它的唯一分布参数。 Tt n记作2022-2-3王玉顺:数理统计02_抽样分布452.2.2 t 分布(3)T统计量的概率密度212212;( ; )12nztnntf t nt t nnnnt t(n)分布概率密度是观测t和自由度n的函数2022-2-3王玉顺:数理统计02_抽样分布462.2.2 t 分布t(n)是对称分布,自由度n是它的唯一分布参数;n愈大峰值愈高及两尾收缩变细,t观察值愈集中于期望0;n愈小峰值愈低及两尾伸展变粗,t观察值愈向两侧分散。(3)T统计量的概率密度2022-2-3王玉顺:数理统计02_抽样分布472.2.2 t 分布(4)T统计量概率密度的证明方开泰,许建伦统计分布北京:科学出版社,1987 方开泰(l 940),江苏扬州人,国际数理统计学会院士,均匀设计创始人。1957-63北京大学数力系;1963-67中科院研究生;1980年副研究员;1986年-中科院应用研究所研究员;1984-92中科院应数所副所长;1985-博士生导师;1980-82美国耶鲁大学、斯坦福大学Visiting Fellow;1985-86年苏黎士高工客座教授;1988.1-6北卡罗尼西大学访问教授;1993起为香港浸会大学讲座教授;1982年选为美国IMS终生Fellow;1995-99任国际统计学院(ISI)理事(代表中国);曾任中国概率统计学会理事长、中国概率统计学会秘书长、国际统计协会院士、数学统计学会会员、中国数学会执行副秘书长、委员等职务。百战黄沙终不悔!2022-2-3王玉顺:数理统计02_抽样分布482.2.2 t 分布T统计量的期望和方差: 222222222101023ZE TEE Z EnnVar TE TE TE TZnEEZnEnnn(5) t 分布的性质2022-2-3王玉顺:数理统计02_抽样分布491222201122202 1122 10111221221122 122 11122 12nxnnxnxnnExedxxnxedxnxedxnnnn2.2.2 t 分布T统计量的期望和方差(5) t 分布的性质1/2统计量与2统计量有相同的概率密度卡方概率积分2022-2-3王玉顺:数理统计02_抽样分布502.2.2 t 分布(5) t 分布的性质分布对称性:概率密度关于t=0对称。亦即位于t=0两侧的t点和- -t点具有相同的概率密度。;ttf t nft n 2022-2-3王玉顺:数理统计02_抽样分布512.2.2 t 分布概率密度峰点:x=0处概率密度最大,众数01122223221 2;112;1210021 200;2nnnnttt t nCnnnnd t t nnttCtdtnnnttnnn (5) t 分布的性质2022-2-3王玉顺:数理统计02_抽样分布522.2.2 t 分布大数定律:当n时,t分布趋于标准正态分布,它们都关于0对称;一般当n30时,t(n)分布就可用标准正态分布N(0,1)替代。(5) t 分布的性质2022-2-3王玉顺:数理统计02_抽样分布532.2.3 F 分布F-d2.2 抽样分布2022-2-3王玉顺:数理统计02_抽样分布54英国统计学家和美国统计学家分别独立提出了 分布为了彰显对统计学的杰出贡献和对本人的敬重,将其命名为分布。采用 分布发明了著名的方差分析(),方差分析已成为统计学的核心统计方法。2.2.3 F 分布(1)F分布简史2022-2-3王玉顺:数理统计02_抽样分布552.2.3 F 分布(2)F统计量的定义设Q12(n1)和Q22(n2),且它们相互独立,则由2统计量Q1和Q2所构建的新统计量:1122Q nFQn服从自由度为n1,n2的F-distribution(F分布),其中n1称为第一自由度,n2称为第二自由度2022-2-3王玉顺:数理统计02_抽样分布562.2.3 F 分布两统计量Q1 2(n1)及Q2 2(n2)均源自正态总体抽样的样本;Q1和Q2相互独立,意味着它们对应的两样本独立,两样本甚至源自不同的正态总体;两自由度n1和n2的次序不能颠倒。第一自由度n1属于F统计量分子上的 2统计量,第二自由度n2属于F统计量分母上的 2统计量。 (3)F统计量要点2022-2-3王玉顺:数理统计02_抽样分布572.2.3 F 分布112121221111212222210( ; , )2200nn nnnnnnxxxnnf x n nnnnx ,F(n1,n2)分布的概率密度是观测x和两个自由度n1及n2的函数:(4)F统计量的概率密度1122q nxqn2022-2-3王玉顺:数理统计02_抽样分布582.2.3 F 分布(4)F统计量的概率密度F(n1,n2)是一种向左的偏态分布,分布参数分别是第一自由度n1和第二自由度n2;固定第一自由度n1,n2愈大峰值愈高及右尾收缩变细,F观察值愈向左侧集中。2022-2-3王玉顺:数理统计02_抽样分布592.2.3 F 分布(4)F统计量的概率密度F(n1,n2)是一种向左的偏态分布,分布参数分别是第一自由度n1和第二自由度n2;固定第二自由度n2,n1愈大峰值愈右移并略升高,右尾收缩变细微小,F观察值愈向中部集中。2022-2-3王玉顺:数理统计02_抽样分布602.2.3 F 分布(5)F统计量概率密度的证明方开泰,许建伦统计分布北京:科学出版社,1987 方开泰(l 940),江苏扬州人,国际数理统计学会院士,均匀设计创始人。1957-63北京大学数力系;1963-67中科院研究生;1980年副研究员;1986年-中科院应用研究所研究员;1984-92中科院应数所副所长;1985-博士生导师;1980-82美国耶鲁大学、斯坦福大学Visiting Fellow;1985-86年苏黎士高工客座教授;1988.1-6北卡罗尼西大学访问教授;1993起为香港浸会大学讲座教授;1982年选为美国IMS终生Fellow;1995-99任国际统计学院(ISI)理事(代表中国);曾任中国概率统计学会理事长、中国概率统计学会秘书长、国际统计协会院士、数学统计学会会员、中国数学会执行副秘书长、委员等职务。2022-2-3王玉顺:数理统计02_抽样分布612.2.3 F 分布F统计量的期望和方差引用前述求解T统计量期望时的中间结果 22222122212222222,424nE FnnnnnVar Fnn nn(6)F分布的性质 1122121221122212Q nE FEQnQnEEnQnE Q EnQnn2022-2-3王玉顺:数理统计02_抽样分布622.2.3 F 分布(6)F分布的性质反对称性:F统计量的倒数1/F服从自由度对调后的F分布,即12211,(,)FF n nF n nF2022-2-3王玉顺:数理统计02_抽样分布632.2.3 F 分布(6)F分布的性质大数定律:n1,n2愈大,概率密度愈峰值升高及两尾收缩,峰值右移并趋于相对f=1对称;应用:n1,n2时F(n1,n2)趋于正态分布NE(F),Var(F);只要n1,n2足够大就可用正态分布替代。2022-2-3王玉顺:数理统计02_抽样分布64结束结束
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 成人自考


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!