概率统计基础知识讲义课件

上传人:痛*** 文档编号:241543262 上传时间:2024-07-03 格式:PPT 页数:187 大小:1.34MB
返回 下载 相关 举报
概率统计基础知识讲义课件_第1页
第1页 / 共187页
概率统计基础知识讲义课件_第2页
第2页 / 共187页
概率统计基础知识讲义课件_第3页
第3页 / 共187页
点击查看更多>>
资源描述
第一部分第一部分 概率统计基础知识概率统计基础知识 随机事件及其概率随机变量及其分布随机变量的数字特征数理统计的基本概念参数估计假设检验方差分析7/3/202411.1 随机事件及其概率随机事件及其概率随机事件及其运算概率的定义及其运算条件概率全概率公式与贝叶斯公式事件的独立性7/3/202421.1.1 随机事件随机事件及其运算及其运算随机试验随机试验(简称简称“试验试验”)随机试验的特点 1.可在相同条件下重复进行;2.试验可能结果不止一个,但能确定所有的可能结果;3.一次试验之前无法确定具体是哪种结果出现。随机试验可表为E 7/3/20243例例1.1.1随机试验例:随机试验例:E1:抛一枚硬币,分别用抛一枚硬币,分别用“H”和和“T”表示出正面和反表示出正面和反面面;E2:将一枚硬币连抛三次,考虑正面出现的次数将一枚硬币连抛三次,考虑正面出现的次数;E3:掷一颗骰子,考虑可能出现的点数;掷一颗骰子,考虑可能出现的点数;E4:记录某网站一分钟内受到的点击次数;记录某网站一分钟内受到的点击次数;E5:在一批灯泡中任取一只,测其寿命。在一批灯泡中任取一只,测其寿命。7/3/202441.1.1 随机事件随机事件及其运算及其运算样本空间样本空间实验的所有可能结果所组成的集合称为样本空间,记为样本点 试验的每一个结果或样本空间的元素称为一个样本点,记为 基本事件由一个样本点组成的单点集由一个样本点组成的单点集7/3/202451.1.1 随机事件随机事件及其运算及其运算随机事件随机事件试验中可能出现或可能不出现的情况叫“随机事件”,简称“事件”.记作A、B、C等任何事件均可表示为样本空间的某个子集任何事件均可表示为样本空间的某个子集.称事件称事件A发生当且仅当试验的结果是发生当且仅当试验的结果是A中的元素中的元素两个特殊事件两个特殊事件:必然事件必然事件、不可能事件、不可能事件.7/3/20246例例1.1.2 对于试验对于试验E2:将一枚硬币连抛三次,考虑正面将一枚硬币连抛三次,考虑正面出现的次数出现的次数,以下随机事件,以下随机事件:1=0,1,2,3 -必然事件必然事件 A“至少出一个正面至少出一个正面”1,2,3;而对试验而对试验E5:在一批灯泡中任取一只,测其寿命在一批灯泡中任取一只,测其寿命。2=x:0 x(小时)小时)。B“灯泡寿命超过灯泡寿命超过1000小时小时”x:1000 x0,则则:P(AB)P(A)P(B|A)称为事件称为事件A、B的概率乘法公式的概率乘法公式推广推广到三个事件的情形:到三个事件的情形:P(ABC)P(A)P(B|A)P(C|AB).一般地,有下列公式:一般地,有下列公式:P(A1A2An)P(A1)P(A2|A1).P(An|A1An-1).7/3/202430n例例1.1.10 1.1.10 有有1 1张电影票需要给张电影票需要给3 3个人分,每个人都个人分,每个人都想要,决定用抓阄的方式解决,问抓阄的先后对此想要,决定用抓阄的方式解决,问抓阄的先后对此方法的公平性是否有影响。方法的公平性是否有影响。由此可见,由此可见,抓阄的方式是公平的!可推广到抓阄的方式是公平的!可推广到n n中抓中抓m m的情况。的情况。P=m/nP=m/n7/3/2024311.1.4 全概率公式与贝叶斯公式全概率公式与贝叶斯公式n完备事件组事件组事件组A1,A2,An(n可为可为),称为样本空间,称为样本空间的一个的一个完备事件组完备事件组,若满足:,若满足:AnA2A1-B-7/3/2024321.1.4 全概率公式与贝叶斯公式全概率公式与贝叶斯公式n全概率公式事件组事件组A1,A2,An 为样本空间为样本空间的一个的一个完备事完备事件组件组,且,且P(Ai)0,(i1,n),则对任何事件,则对任何事件B有:有:AnA2A1-B-7/3/202433n例例1.1.111.1.11市场上有甲、乙、丙三家工厂生产的同一市场上有甲、乙、丙三家工厂生产的同一品牌产品,已知三家工厂的市场占有率分别为品牌产品,已知三家工厂的市场占有率分别为1/41/4、1/41/4、1/21/2,且三家工厂的次品率分别为,且三家工厂的次品率分别为 2 2、1 1、3 3,试求市场上该品牌产品的次品率。,试求市场上该品牌产品的次品率。B7/3/202434甲乙n例例1.1.12 1.1.12 有甲乙两个袋子,甲袋中有两个白球,有甲乙两个袋子,甲袋中有两个白球,1 1个红球,乙袋中有两个红球,一个白球这六个球个红球,乙袋中有两个红球,一个白球这六个球手感上不可区别今从甲袋中任取一球放入乙袋,搅手感上不可区别今从甲袋中任取一球放入乙袋,搅匀后再从乙袋中任取一球,问此球是红球的概率?匀后再从乙袋中任取一球,问此球是红球的概率?7/3/2024351.1.4 全概率公式与贝叶斯公式全概率公式与贝叶斯公式n贝叶斯公式 上例中,若已知取到一个红球,则从甲上例中,若已知取到一个红球,则从甲 袋放入乙袋的是白球的概率是多少?袋放入乙袋的是白球的概率是多少?事件组事件组A1,A2,An 为样本空间为样本空间的一个的一个完备事件完备事件组组,且,且P(Ai)0,(i1,n),则对任何事件,则对任何事件B有:有:7/3/202436n例例1.1.131.1.13用血清甲胎蛋白法诊断肝癌,试验反应有用血清甲胎蛋白法诊断肝癌,试验反应有阴性和阳性两种结果。当被诊断者患肝癌时,其反阴性和阳性两种结果。当被诊断者患肝癌时,其反应为阳性的概率为应为阳性的概率为0.950.95;当被诊断者未患肝癌时,;当被诊断者未患肝癌时,其反应为阴性的概率为其反应为阴性的概率为0.90.9。根据记录,某地人群中。根据记录,某地人群中肝癌的患病率为肝癌的患病率为0.00040.0004,现有一人的试验反应为阳,现有一人的试验反应为阳性,问此人确实患肝癌的概率性,问此人确实患肝癌的概率?7/3/2024377/3/2024381.1.5 事件的独立性事件的独立性n两个事件独立的定义设设A、B是两事件,是两事件,P(A)0,若若 P(B)P(B|A)P(AB)P(A)P(B)则称事件则称事件A与与B相互独立相互独立(即(即A的发生与否对的发生与否对B毫无影响)。毫无影响)。定理定理 以下四件事等价:以下四件事等价:(1)事件事件A、B相互独立;相互独立;(2)事件事件A、B相互独立;相互独立;(3)事件事件A、B相互独立;相互独立;(4)事件事件A、B相互独立。相互独立。7/3/2024391.1.5 事件的独立性事件的独立性n多个事件独立的定义若三个事件若三个事件A、B、C满足:满足:(1)P(AB)=P(A)P(B),P(AC)=P(A)P(C),P(BC)=P(B)P(C),则称事件则称事件A、B、C两两相互独立两两相互独立(2)P(ABC)P(A)P(B)P(C),则称事件则称事件A、B、C相互独立相互独立。7/3/2024401.1.5 事件的独立性事件的独立性推广:推广:一般地,设一般地,设A1,A2,An是是n个事件,如果对个事件,如果对任意任意k (1kn),任意的任意的1i1i2 ikn,具有等,具有等式:式:P(A i1 A i2 A ik)P(A i1)P(A i2)P(A ik)则称则称n个事件个事件A1,A2,An相互独立。相互独立。7/3/2024411.1.5 事件的独立性事件的独立性n事件独立性的应用1、加法公式的简化:若事件、加法公式的简化:若事件A1,A2,An相互相互独立独立,则:则:2、在可靠性理论上的应用、在可靠性理论上的应用7/3/2024421.2 1.2 随机变量随机变量随机变量的概念离散型随机变量连续型随机变量正态分布7/3/2024431.2.11.2.1随机变量的概念随机变量的概念随机变量随机变量 设设=是试验的样本空间,如果量是试验的样本空间,如果量X是定义在是定义在上的一个单值实值函数即对于每一个上的一个单值实值函数即对于每一个 ,有一实,有一实数数X=X()与之对应,则称与之对应,则称X为随机变量。为随机变量。随机变量随机变量常用常用X、Y、Z 或或 、等表示。等表示。通俗地说,每一个样本点可以数量化,每次试验的通俗地说,每一个样本点可以数量化,每次试验的结果在未结束前是个未知变量,而且取值具有随机性。结果在未结束前是个未知变量,而且取值具有随机性。随机变量的特点随机变量的特点:(1)X的全部可能取值是互斥且完备的的全部可能取值是互斥且完备的(2)X的部分可能取值描述随机事件的部分可能取值描述随机事件7/3/202444n例例1.2.11.2.1引入适当的随机变量描述下列事件:引入适当的随机变量描述下列事件:(1)(1)将将3 3个球随机放入三个格子中,个球随机放入三个格子中,记空格子数为记空格子数为X X:事件事件A=A=有有1 1个空格个空格=X=1=X=1,B=B=全有球全有球=X=0=X=0 。(2)(2)进行进行5 5次试验,次试验,记试验成功次数为记试验成功次数为Y Y:事件事件C C=试验成功一次试验成功一次=Y=1=Y=1,D D=试验至少成功一次试验至少成功一次=Y1=Y1(3)(3)掷掷1 1次硬币,观察正反面。记正面为次硬币,观察正反面。记正面为1 1,反面为,反面为0 07/3/2024451.2.11.2.1随机变量的概念随机变量的概念随机变量的分类随机变量的分类 随机变量的分布函数随机变量的分布函数设设X是随机变量,对任意实数是随机变量,对任意实数x,事件,事件Xx的概率的概率PXx称为随机变量称为随机变量X的分布函数。的分布函数。记为记为F(x),即,即 F(x)P Xx.易知,对任意实数易知,对任意实数a,b(ab),P aXbPXbPXa F(b)F(a).7/3/2024461.2.11.2.1随机变量的概念随机变量的概念分布函数的性质分布函数的性质(1)单调不减性:若单调不减性:若x1x2,则则F(x1)F(x2);(2)归一归一 性:对任意实数性:对任意实数x,0F(x)1,且,且(4)对任意实数对任意实数a,b(ab),P aXbPXbPXa F(b)F(a).具有具有(13)性质的实函数,必是某个随机变量的分布函性质的实函数,必是某个随机变量的分布函数。故该三个性质是分布函数的充分必要性质。数。故该三个性质是分布函数的充分必要性质。(3)右连续性:对任意实数右连续性:对任意实数x,7/3/202447当x1时,F(x)=1当0 x1时,特别,F(1)=P0 x1=k=1n例例1.2.21.2.2向向0,10,1区间随机抛一质点,以区间随机抛一质点,以X X表示质点表示质点坐标坐标.假定质点落在假定质点落在0,10,1区间内任一子区间内的概区间内任一子区间内的概率与区间长成正比,求率与区间长成正比,求X X的分布函数的分布函数解:解:F(x)=PXxF(x)=PXx 1.2.11.2.1随机变量的概念随机变量的概念7/3/2024481.2.2 1.2.2 离散型随机变量离散型随机变量定义定义 若随机变量若随机变量X取值取值x1,x2,xn,而且取这些而且取这些值的概率依次为值的概率依次为p1,p2,pn,则称则称X为离散型为离散型随机变量,而称随机变量,而称 PX=xk=pk,(k=1,2,)为为X的分布律的分布律(列列)或概率分布。或概率分布。也可表为也可表为:7/3/2024491.2.2 1.2.2 离散型随机变量离散型随机变量分布律的性质分布律的性质(1)pk 0,k1,2,;(2)n例例1.2.3 1.2.3 设袋中有设袋中有5 5只球,其中有只球,其中有2 2只白只白3 3只黑。现只黑。现从中任取从中任取3 3只球只球(不放回不放回),求抽得的白球数,求抽得的白球数X X为为k k的概的概率。率。解解 k k可取值可取值0 0,1 1,2 27/3/2024501.2.2 1.2.2 离散型随机变量离散型随机变量分布函数分布函数 一般地,对离散型随机变量一般地,对离散型随机变量 XPX=xkpk,k1,2,其分布函数为其分布函数为 用分布函数描述随机变量不如分布律直观用分布函数描述随机变量不如分布律直观!7/3/202451解解X012P0.10.60.3n例例1.2.4 1.2.4 设随机变量设随机变量X具分布律具分布律如右表如右表:试求出试求出X X的分布函数。的分布函数。1.2.2 1.2.2 离散型随机变量离散型随机变量7/3/2024521.两点两点(0-1)分布分布2.若随机变量若随机变量X的取值为的取值为0,1两个值,分布律为:两个值,分布律为:PX0=q=1-p,PX1=p则称则称X服从服从(01)分布分布(两点分布两点分布)1.2.2 1.2.2 离散型随机变量离散型随机变量几个常用的离散型分布几个常用的离散型分布7/3/2024532.贝努里贝努里(Bernoulli)概型与二项分布概型与二项分布 设将试验独立重复进行设将试验独立重复进行n次,每次试验中,事件次,每次试验中,事件A发生的概率均为发生的概率均为p,则称这,则称这n次试验为次试验为n重贝努里试验重贝努里试验.若以若以X表示表示n重贝努里试验事件重贝努里试验事件A发生的次数,则发生的次数,则称称X服从参数为服从参数为n,p的的二项分布二项分布。记作。记作XB(n,p)其分布律为:其分布律为:1.2.2 1.2.2 离散型随机变量离散型随机变量7/3/202454解解:(1)(1)由题意由题意,XB(6,1/3),XB(6,1/3),于是于是,X X的分布的分布律为律为:n例例1.2.51.2.5从某大学到火车站途中有从某大学到火车站途中有6 6个交通岗个交通岗,假设假设在各个交通岗是否遇到红灯相互独立在各个交通岗是否遇到红灯相互独立,并且遇到红灯并且遇到红灯的概率都是的概率都是1/3.1/3.(1)(1)设设X X为汽车行驶途中遇到的红灯数为汽车行驶途中遇到的红灯数,求求X X的分布律的分布律.(2)(2)求汽车行驶途中至少遇到求汽车行驶途中至少遇到5 5次红灯的概率次红灯的概率.7/3/2024553.泊松泊松(Poisson)分布分布P()若随机变量若随机变量X的分布律为:的分布律为:1.2.2 1.2.2 离散型随机变量离散型随机变量PXk ,k0,1,2,(0)则称则称X X服从参数为服从参数为的的泊松分布泊松分布。记作。记作X XP P()泊松泊松定理定理 设随机变量设随机变量XB(n,p),(n0,1,2,),且且n很大,很大,p很小,记很小,记=np,则则 即可认为即可认为XP()7/3/202456泊松泊松定理表明定理表明:泊松分布是二项分布的极限分布,泊松分布是二项分布的极限分布,当当n很大,很大,p很小时,很小时,二项分布就可近似地二项分布就可近似地看成是参数看成是参数=np的的泊松分布泊松分布1.2.2 1.2.2 离散型随机变量离散型随机变量7/3/202457解解 设设X X表示表示400400次独立射击中命中的次数,次独立射击中命中的次数,则则X XB(400,0.02)B(400,0.02),故故PXPX 221 1 PXPX00P XP X111 10.980.98400400(400)(0.02)(400)(0.02)(0.980.98399399)=)=取取=np=np(400)(0.02)(400)(0.02)8,8,故故近似地有近似地有 :n例例1.2.61.2.6某人射击的命中率为某人射击的命中率为0.020.02,他独立射击,他独立射击400400次,试求其命中次数不少于次,试求其命中次数不少于2 2的概率。的概率。7/3/202458解解:由题意由题意,n例例1.2.71.2.7设某国每对夫妇的子女数设某国每对夫妇的子女数X X服从参数为服从参数为的的泊松分布泊松分布,且知一对夫妇有不超过且知一对夫妇有不超过1 1个孩子的概率为个孩子的概率为3e3e-2-2.求任选一对夫妇求任选一对夫妇,至少有至少有3 3个孩子的概率。个孩子的概率。7/3/2024591.2.31.2.3连续型随机变量连续型随机变量 对于随机变量对于随机变量X X,若存在,若存在(-(-,+)+)上的非负函数上的非负函数f(x)f(x),使对任意实数,使对任意实数x x,都有:,都有:概率密度概率密度则称则称X X为连续型随机变量,为连续型随机变量,f(x)f(x)为为X X的的概率密度概率密度函数函数,简称概率密度或密度函数简称概率密度或密度函数.7/3/202460密度函数的密度函数的几何意义几何意义为为7/3/202461(1)非负性非负性 f(x)0,(-x);(2)归一性归一性性质性质(1)、(2)是密度函数的充要性质;是密度函数的充要性质;1.2.31.2.3连续型随机变量连续型随机变量密度函数的性质密度函数的性质(3)若若x是是f(x)的连续点,则的连续点,则7/3/2024621.2.31.2.3连续型随机变量连续型随机变量(4)(4)对任意实数对任意实数b b,若若X X f(x)f(x),(-(-xx),则则:PX=PX=b b 0 0。(5)(5)7/3/2024631.2.31.2.3连续型随机变量连续型随机变量几个常用的连续型分布几个常用的连续型分布1.均匀分布均匀分布若若X的分布密度为:的分布密度为:则称则称X在在(a,b)内服从内服从均匀分布。记作均匀分布。记作 XU(a,b)对任意实数对任意实数c,d(acd0的的指数分布,记为:指数分布,记为:Xexp()。其分布函数为其分布函数为1.2.31.2.3连续型随机变量连续型随机变量7/3/202466解解n例例1.2.91.2.9电子元件的寿命电子元件的寿命X(X(年)服从参数为年)服从参数为3 3的指数的指数分布分布(1)(1)求该电子元件寿命超过求该电子元件寿命超过2 2年的概率。年的概率。(2)(2)已知该电子元件已使用了已知该电子元件已使用了1.51.5年,求它还能使用年,求它还能使用两年的概率为多少?两年的概率为多少?7/3/2024673.正态分布正态分布-高斯高斯(Gauss)分布分布1.2.31.2.3连续型随机变量连续型随机变量若随机变量随机变量X的分布密度为:的分布密度为:其中其中 为实数,为实数,0,则称,则称X服从参数为服从参数为 ,2的的正态正态分布分布,记为:记为:XN(,2).7/3/2024681.2.41.2.4正态分布正态分布正态分布的特性正态分布的特性(1)单峰对称单峰对称 密度曲线关于直线密度曲线关于直线x=对称对称;f()maxf(x).7/3/202469 参数参数 0,21的正态分布称为的正态分布称为标准正态分标准正态分布,记作:布,记作:XN(0,1)。1.2.41.2.4正态分布正态分布标准正态分布标准正态分布7/3/2024701.2.41.2.4正态分布正态分布性质性质(1)密度函数密度函数(2)分布函数分布函数(3)(x)1 (x);(4)若若XN(,2),则则一般的概率统计教科书均附有标准正态分布表供读者查阅一般的概率统计教科书均附有标准正态分布表供读者查阅(x)的值。的值。7/3/2024711.2.41.2.4正态分布正态分布性质性质(1)密度函数密度函数(2)分布函数分布函数(3)(x)1 (x);(4)若若XN(,2),则则7/3/202472n例例1.2.101.2.10 (1)Z(1)ZN N(0 0,1 1):):(0.50.5)=0.6915,P1.32Z2.43=(2.43)-(1.32)=0.6915,P1.32Z2.43=(2.43)-(1.32)=0.9925-0.9066=0.9925-0.9066(2)X(2)XN N(,2 2):):P-3P-3 X X-3P|X|3的值的值.如在质量控制中,常用标准指标值如在质量控制中,常用标准指标值3 3 作两作两条线,当生产过程的指标观察值落在两线之外时发出警报条线,当生产过程的指标观察值落在两线之外时发出警报.表表明生产出现异常明生产出现异常.7/3/202473解:设设Y为为使用的最初使用的最初9090小时内损坏的元件数小时内损坏的元件数,故则YB(3,p)其中n例例1.2.111.2.11一种电子元件的使用寿命(小时)服从一种电子元件的使用寿命(小时)服从正态分布正态分布(100,225),(100,225),某仪器上装有某仪器上装有3 3个这种元件,个这种元件,三个元件损坏与否是相互独立的三个元件损坏与否是相互独立的.求:使用的最初求:使用的最初9090小时内无一元件损坏的概率小时内无一元件损坏的概率.1.2.41.2.4正态分布正态分布7/3/202474随机变量的数学期望与方差几个常见分布的期望与方差随机变量的协方差和相关系数大数定律中心极限定理1.3 随机变量的数字特征随机变量的数字特征7/3/202475引例引例:设某班设某班40名学生的概率统计成绩及得分人名学生的概率统计成绩及得分人数如下表所示:数如下表所示:分数分数 40 60 70 80 90 100 总人总人数数 人数人数 1 6 9 15 7 2 40则学生的平均成绩是总分则学生的平均成绩是总分总人数。即总人数。即1.3.1 随机变量的期望与方差随机变量的期望与方差7/3/2024761.3.1 随机变量的期望与方差随机变量的期望与方差若XPX=xk=pk,k=1,2,n,.则称函数函数Y=g(X)的期望的期望E(g(X)为为7/3/2024771.3.1 随机变量的期望与方差随机变量的期望与方差若若Xf(x),-x,则称则称若Xf(x),-x0,DY0,则,则称为X与Y的相关系数相关系数.注:注:若记若记称为称为X的的标准化标准化,易知,易知EX*=0,DX*=1.且且7/3/2024941.3.3 协方差和相关系数协方差和相关系数 (1)|XY|1;(2)|XY|=1存在常数a,b 使PY=aX+b=1;(3)X与Y不相关 XY=0;1.K阶原点矩阶原点矩 Ak=E(Xk),k=1,2,而E(|X|k)称为X的K阶绝对原点矩;2.K阶中心矩阶中心矩 Bk=EX-E(X)k,k=1,2,而E|X-E(X)|k称为X的K阶绝对中心矩;7/3/2024951.3.3 协方差和相关系数协方差和相关系数 (1)|XY|1;(2)|XY|=1存在常数a,b 使PY=aX+b=1;(3)X与Y不相关 XY=0;1.K阶原点矩阶原点矩 Ak=E(Xk),k=1,2,而E(|X|k)称为X的K阶绝对原点矩;2.K阶中心矩阶中心矩 Bk=EX-E(X)k,k=1,2,而E|X-E(X)|k称为X的K阶绝对中心矩;7/3/202496 设设X1,,Xn为为n个随机变量个随机变量,记记cij=cov(Xi,Xj),i,j=1,2,n.则称由则称由cij组成的矩阵为随机变量组成的矩阵为随机变量 X1,,Xn的协方差矩阵的协方差矩阵C。即。即1.3.3 协方差和相关系数协方差和相关系数7/3/202497 若若随机变量随机变量X的期望和方差存在,则对任意的期望和方差存在,则对任意0,有,有这就是著名的这就是著名的切比雪夫切比雪夫(Chebyshev)不等式不等式。它有以下等价的形式:它有以下等价的形式:1.3.4 大数定律大数定律7/3/2024981.3.4 大数定律大数定律7/3/202499解解:由切比由切比雪夫不等式雪夫不等式令令1.3.4 大数定律大数定律7/3/20241001.3.4 大数定律大数定律设设Xn为随机变量序列为随机变量序列,X为随机变量,若任给为随机变量,若任给 0,使得:使得:则称则称Xn依概率收敛于依概率收敛于X.可记为可记为7/3/2024101如如意思是意思是:当当a而而意思是意思是:时时,Xn落在落在内的内的概率越来越大概率越来越大.,当当1.3.4 大数定律大数定律7/3/20241021.3.4 大数定律大数定律设设Xn为随机变量序列为随机变量序列,X为随机变量,若任给为随机变量,若任给 0,使得:使得:则称则称Xn依概率收敛于依概率收敛于X.可记为可记为7/3/2024103设设Xk,k=1,2,.为独立的随机变量序列,且为独立的随机变量序列,且有相同的数学期望有相同的数学期望,及方差及方差 20,则,则1.3.4 大数定律大数定律7/3/2024104证明证明:由切由切比雪夫不等式比雪夫不等式这里这里故故7/3/2024105设进行设进行n次独立重复试验,每次试验中事件次独立重复试验,每次试验中事件A发生发生的概率为的概率为p,记,记fn为为n次试验中事件次试验中事件A发生的频率,发生的频率,则则证明证明:设设第第i次试验事件次试验事件A发生发生第第i次试验事件次试验事件A不发生不发生则则由切由切比雪夫大数定理比雪夫大数定理1.3.4 大数定律大数定律7/3/2024106 若若Xk,k=1.2,.为独立为独立同分布同分布随机变量序列随机变量序列,EXk=,k=1,2,则则推论推论:若若Xi,i=1.2,.为独立为独立同分布同分布随机变量序随机变量序列列,E(X1k)=,则则1.3.4 大数定律大数定律7/3/2024107 设设Xn为随机变量序列,为随机变量序列,X为随机变量,其为随机变量,其对应的分布函数分别为对应的分布函数分别为Fn(x),F(x).若在若在F(x)的连续点,有的连续点,有则称则称Xn依分布收敛于依分布收敛于X.可记为可记为1.3.5 中心极限定理中心极限定理7/3/2024108 设设Xn为独立为独立同分布同分布随机变量序列,若随机变量序列,若EXk=,DXk=2 0,k=1,2,则则Xn满足:满足:1.3.5 中心极限定理中心极限定理根据上述定理,当根据上述定理,当n充分大时充分大时实际上,当实际上,当n充分大时,充分大时,Xi对总和的影响既均匀又微小对总和的影响既均匀又微小7/3/2024109解解:设设 Xk为第为第k 次掷出的点数次掷出的点数,k=1,2,100,则则X1,X100独立同分布独立同分布.由由中心极限定理中心极限定理1.3.5 中心极限定理中心极限定理7/3/2024110 设设Xn为独立为独立同分布同分布随机变量序列,若随机变量序列,若EXk=,DXk=2 0,k=1,2,则则Xn满足:满足:1.3.5 中心极限定理中心极限定理根据上述定理,当根据上述定理,当n充分大时充分大时实际上,当实际上,当n充分大时,充分大时,Xi对总和的影响既均匀又微小对总和的影响既均匀又微小7/3/2024111设随机变量设随机变量 n(n=1,2,.)服从参数为服从参数为n,p(0p1)的二项分布,则的二项分布,则证明证明:设设第第i次试验事件次试验事件A发生发生第第i次试验事件次试验事件A不发生不发生则则由由中心极限定理中心极限定理,结论得证结论得证1.3.5 中心极限定理中心极限定理7/3/20241121.3.5 中心极限定理中心极限定理7/3/2024113解:解:设设X表示一年内死亡的人数,则表示一年内死亡的人数,则XB(n,p),其中其中:n=10000,p=0.6%,np=60,npq=59.64设设Y表示保险公司一年的利润,表示保险公司一年的利润,Y=10000*12-1000X于是于是由中心极限定理由中心极限定理 (1)PY0=P10000*12-1000X0=1 PX 120 1 (7.75)=0;1.3.5 中心极限定理中心极限定理7/3/2024114(2)设赔偿金为设赔偿金为a元,则令元,则令由中心极限定理由中心极限定理,上式等价于上式等价于1.3.5 中心极限定理中心极限定理7/3/2024115随机样本抽样分布1.4 数理统计的基本概念数理统计的基本概念7/3/2024116 1.1.总体总体-研究对象的全体。研究对象的全体。通常指研究对象的某项数量指标全体。通常指研究对象的某项数量指标全体。组成总体的元素称为组成总体的元素称为个体个体。从本质上讲,总体就是所研究的随机变量或随从本质上讲,总体就是所研究的随机变量或随机变量的分布。机变量的分布。1.4.1 随机样本随机样本2.样本:样本:来自总体的部分个体来自总体的部分个体X X1 1,X Xn n 如果满足:如果满足:(1)同分布性:同分布性:Xi,i=1,n与总体X同分布.7/3/20241171.4.1 随机样本随机样本(2)独立性:独立性:X1,Xn 相互独立;则称为则称为容量容量为为n n 的简单随机样本,简称的简单随机样本,简称样本样本。而称而称X X1 1,X Xn n 的的一次实现为一次实现为样本观察值样本观察值,记为,记为x x1 1,x xn n 简单随机样本来自于简单随机抽样试验,特点:简单随机样本来自于简单随机抽样试验,特点:(1)(1)每次抽样中,各个个体被抽到的机会均等每次抽样中,各个个体被抽到的机会均等 (2)(2)每次抽样前,总体成分保持不变每次抽样前,总体成分保持不变样本容量样本容量n n相对于总体容量相对于总体容量N N而言是极小的,在试验而言是极小的,在试验中,不放回抽样可近似认为是有放回抽样。中,不放回抽样可近似认为是有放回抽样。7/3/20241183.总体、样本、样本观察值的关系总体、样本、样本观察值的关系总体总体 样本样本 样本观察值样本观察值 理论分布理论分布 统计是从手中已有的资料统计是从手中已有的资料样本观察值,去推断总体样本观察值,去推断总体的情况的情况总体分布。样本是联系两者的桥梁。总体分总体分布。样本是联系两者的桥梁。总体分布决定了样本取值的概率规律,也就是样本取到样本观布决定了样本取值的概率规律,也就是样本取到样本观察值的规律,因而可以用样本观察值去推断总体察值的规律,因而可以用样本观察值去推断总体1.4.1 随机样本随机样本7/3/2024119统计量的定义抽样分布常用统计量及其分布1.4.2 抽样分布抽样分布7/3/20241201.4.2 抽样分布抽样分布 如果样本如果样本X X1 1,X,Xn n 的函数的函数g(Xg(X1 1,X Xn n )不含不含未知参数未知参数,则称,则称g(Xg(X1 1,X Xn n)是总体是总体X X的一个的一个统统计量计量.如:如:7/3/20241211.4.2 抽样分布抽样分布 统计量的分布称为抽样分布。数理统计中常用到如下三个分布:2 2分布、t t 分布和F F分布。1 2分布分布7/3/2024122(2)2分布的分布的密度函数密度函数f(x)曲线曲线1.4.2 抽样分布抽样分布7/3/2024123(3)临界点临界点 设X 2(n),若对于:0 1,存在满足满足则称则称为为分布的分布的临界点临界点。1.4.2 抽样分布抽样分布7/3/2024124实际应用中,常常将满足:实际应用中,常常将满足:的点的点称为称为分布的分布的上侧上侧临界点临界点。1.4.2 抽样分布抽样分布而将满足:而将满足:的点的点分布的分布的下侧下侧临界点临界点。称为称为7/3/2024125使得:使得:对于不同的对于不同的n和和a,和和1.4.2 抽样分布抽样分布可查可查2 2分布表分布表得到得到。(4)性质性质:分布可加性分布可加性:若X 2(n1),Y 2(n2),X与与Y独立,则X+Y 2(n1+n2)期望与方差期望与方差:若X 2(n),则E(X)=n,D(X)=2n7/3/20241261.4.2 抽样分布抽样分布2 t分布分布(1)定理:定理:若 N(0,1),2(n),与 独立,则t(n)称为称为自由度自由度为为n的的t分布分布。(2)t(n(n)的概率密度为的概率密度为:7/3/20241271.4.2 抽样分布抽样分布(3)(3)基本性质基本性质:f(tf(t)关于关于t=0(t=0(纵轴纵轴)对称。对称。f(tf(t)的极限为的极限为N(0N(0,1)1)的密度函数,即的密度函数,即 表明:当表明:当n n比较大时比较大时(n30),(n30),可用标准正态分布代替可用标准正态分布代替t t分布分布7/3/2024128(4)(4)临界点临界点设设T Tt(n)t(n),若对若对:0:0 1,0)0,满足:,满足:P-tP-t(n)T(n)Tt t(n(n)=1-)=1-,则称则称t t(n)(n)为为t(nt(n)的的临界点临界点1.4.2 抽样分布抽样分布7/3/20241291.4.2 抽样分布抽样分布3 F分布分布(1)定理:定理:若若若若X X 2 2(n(n1 1),YY2 2(n(n2 2),X X与与与与Y Y独立,则独立,则独立,则独立,则称为第一自由度为称为第一自由度为n1,第二自由度为,第二自由度为n2的的F分布分布。其概率密度为其概率密度为7/3/2024130(2)F-(2)F-分布的分布的临界点临界点1.4.2 抽样分布抽样分布 对于对于:00 10)0,满足:,满足:PFPF F F/2/2(n(n1 1,n n2 2)=)=/2/2,则称则称F F/2/2(n(n1 1,n n2 2)为为F F分布分布的的上侧临界点上侧临界点;对于对于:00 10)0,满足:,满足:PFPF F F1-1-/2/2(n(n1 1,n n2 2)=1-)=1-/2/2,则称则称F F1-1-/2/2(n(n1 1,n n2 2)为)为F F分布分布的的下侧临界点下侧临界点;总之,使得:总之,使得:PFPF1-1-/2/2(n(n1 1,n n2 2)FF)FF/2/2(n(n1 1,n n2 2)=1-)=1-7/3/2024131(3)F-(3)F-分布的性质分布的性质1.4.2 抽样分布抽样分布证明证明:设设FF(n1,n2),则则7/3/20241321.4.2 抽样分布抽样分布1 样本均值样本均值证明证明:由于由于n 个独立的正态随机变量的线性组合个独立的正态随机变量的线性组合,仍然服从正态分布仍然服从正态分布7/3/20241331.4.2 抽样分布抽样分布2 样本方差样本方差定理定理4证明提示证明提示:7/3/20241341.4.2 抽样分布抽样分布2 样本方差样本方差7/3/20241351.4.2 抽样分布抽样分布3 样本矩样本矩7/3/2024136点估计点估计 估计量的评选标准估计量的评选标准 区间估计区间估计正态总体参数的区间估计正态总体参数的区间估计1.5 参数估计参数估计 参数估计问题是一类统计推断问题,指的是参数估计问题是一类统计推断问题,指的是在处理实际问题时,采用抽样的方法,从获取的在处理实际问题时,采用抽样的方法,从获取的样本数据中提取有用的信息,来对总体的情况进样本数据中提取有用的信息,来对总体的情况进行推断,主要指的是对分布形式已知的总体中的行推断,主要指的是对分布形式已知的总体中的某些未知参数的估计问题。某些未知参数的估计问题。主要内容:主要内容:7/3/2024137 设设X1,Xn是总体是总体X的一个样本,的一个样本,其分布函其分布函数为数为F(x;),。其中其中 为未知参数为未知参数,为参数空间为参数空间,若统计量若统计量g(X1,Xn)可作为可作为 的一个估计的一个估计,则则称其为称其为 的的一个一个估计估计量量,记为,记为注:注:F(x;)也可用分布律或密度函数代替.1.5.1 点估计点估计7/3/2024138若若x1,xn是样本的一个观测值。是样本的一个观测值。由于由于g(x1,xn)是实数域上的一个点,是实数域上的一个点,现用它来估计现用它来估计,故称这种估计为故称这种估计为点估计点估计。点估计的经典方法是点估计的经典方法是矩估计法矩估计法与与极大似然估极大似然估计法计法。1.5.1 点估计点估计称为估计量称为估计量的一个的一个观测值观测值。7/3/20241391.5.1 点估计点估计 关键点:用样本矩作为总体同阶矩的估计,即:用样本矩作为总体同阶矩的估计,即 一般使用:使用:7/3/20241401.5.1 点估计点估计7/3/20241411.5.1 点估计点估计1 极大似然思想极大似然思想 有两个射手,一人的命中率为有两个射手,一人的命中率为0.9,0.9,另一人的另一人的命中率为命中率为0.1,0.1,现在他们中的一个向目标射击了一现在他们中的一个向目标射击了一发,结果命中了,估计是谁射击的?发,结果命中了,估计是谁射击的?一般说,事件A发生的概率与参数有关,取值不同,则P(A)也不同。因而应记事件A发生的概率为P(A|).若A发生了,则认为此时的值应是在中使P(A|)达到最大的那一个。这就是极大似然极大似然思想思想7/3/20241421.5.1 点估计点估计2 似然函数似然函数为该总体的为该总体的为该总体的为该总体的似然函数似然函数。3 极大似然估计极大似然估计则则称称 为为 的极大似然估计的极大似然估计若有若有使得使得7/3/20241431.5.1 点估计点估计4 求极大似然估计步骤求极大似然估计步骤(1)建立似然函数建立似然函数(2)做对数似然函数做对数似然函数(3)列似然方程列似然方程若该方程有解,则其解就是若该方程有解,则其解就是注:注:若概率函数中含有多个未知参数,则可解方程组若概率函数中含有多个未知参数,则可解方程组7/3/20241441.5.1 点估计点估计7/3/20241451.5.1 点估计点估计7/3/20241461.5.2 估计量的评选标准估计量的评选标准可以证明:可以证明:即:即:7/3/20241471.5.2 估计量的评选标准估计量的评选标准7/3/20241481.5.2 估计量的评选标准估计量的评选标准7/3/20241491.5.2 估计量的评选标准估计量的评选标准7/3/20241501.5.3 区间估计区间估计 设总体设总体X的分布函数的分布函数F(x;)含有含有未知参数未知参数,对于给定值对于给定值(0 0(或 10620由pT t0.05(9)=0.05,得拒绝域为T t0.05(9)=1.8331这里接受H01.6.2 单正态总体的假设检验单正态总体的假设检验7/3/2024168不论不论 是否是否未知1.6.2 单正态总体的假设检验单正态总体的假设检验7/3/2024169得水平为的拒绝域为1.6.2 单正态总体的假设检验单正态总体的假设检验7/3/2024170这里接受H01.6.2 单正态总体的假设检验单正态总体的假设检验得拒绝域为:7/3/20241711.6.3 双正态总体的假设检验双正态总体的假设检验7/3/2024172解:1.6.3 双正态总体的假设检验双正态总体的假设检验7/3/2024173这里:拒绝拒绝H H0 0认为两种安眠药的疗效有显著性差异认为两种安眠药的疗效有显著性差异进一步改为进一步改为:试检验是否甲安眠药比乙安眠药疗效显著?这里这里:t=1.861.3304,故拒绝故拒绝H H0,0,认为认为甲安眠药比乙安眠药疗甲安眠药比乙安眠药疗效显著效显著7/3/2024174两样本独立,给定检验水平 ,由观测值假定假定 1,2未知1.6.3 双正态总体的假设检验双正态总体的假设检验7/3/2024175由pF F1/2(n1 1,n2 1)或F F/2(n1 1,n2 1)=F1/2F/2得拒绝域F F1/2(n1 1,n2 1)或F F/2(n1 1,n2 1)1.6.3 双正态总体的假设检验双正态总体的假设检验7/3/2024176解:拒绝域:F0.025(7,6)=5.7 F F1 0.025(7,6)=1/5.12=0.1953这里:接受H0,即认为无显著差异1.6.3 双正态总体的假设检验双正态总体的假设检验7/3/2024177 在试验中,如果只控制一个试验条件在试验中,如果只控制一个试验条件(因素因素)在在变化,其他条件变化,其他条件(因素因素)不变,则称为单因素试验。不变,则称为单因素试验。同时称因素所处的状态为同时称因素所处的状态为水平水平。在同一个因素下,。在同一个因素下,可以有不同的水平,基于单因素试验进行的方差分可以有不同的水平,基于单因素试验进行的方差分析称为单因素方差分析。析称为单因素方差分析。如研究肥料数量对玉米产量的影响,肥料的用如研究肥料数量对玉米产量的影响,肥料的用量划分为量划分为r个水平,每个水平下做个水平,每个水平下做m次试验(可以次试验(可以m块临近的田同时试验)。块临近的田同时试验)。1.7 方差分析方差分析实质是假设检验中实质是假设检验中F检验的一种推广!检验的一种推广!7/3/20241781.7 方差分析方差分析1.数学模型数学模型结果结果 水平水平试验号试验号A1A2.Aj.Ar1x11x12.x1j.x1r2x21x22.x2j.x2r.ixi1xi2.xij.xir.mxm1xm2.xmj.xmr7/3/20241791.7 方差分析方差分析2.一般原理一般原理基本假定基本假定:(1)每个水平下的样本都来自正态总体;每个水平下的样本都来自正态总体;(2)每个总体的方差相同每个总体的方差相同(方差齐性方差齐性);(3)每个样本是相互独立的。每个样本是相互独立的。则:则:xijN(j,2),xij-j=ijN(0,2)检验原假设:检验原假设:H0:1=2=.=r若接受若接受H0,说明水平对结果无显著影响,由于随机,说明水平对结果无显著影响,由于随机波动导致结果间的不同波动导致结果间的不同;若拒绝;若拒绝H0,说明水平对,说明水平对结果有显著影响,除了随机波动导致结果间的不同结果有显著影响,除了随机波动导致结果间的不同,还有水平的影响。需要设法将这两部分影响分开,还有水平的影响。需要设法将这两部分影响分开,定量地比较哪个影响占主导地位,从而决定接受还定量地比较哪个影响占主导地位,从而决定接受还是拒绝是拒绝H0。7/3/20241801.7 方差分析方差分析3.做法做法计算:各列计算:各列(水平水平)均值:均值:总均值:总均值:总误差平方和:总误差平方和:组间平方和组间平方和(水平影响水平影响):组内平方和组内平方和(随机误差随机误差):显然:显然:SST=SSA+SSE7/3/20241811.7 方差分析方差分析定理定理:若假设若假设H0成立,则:成立,则:(1)SSA/22(r-1);SST/22(r*m-1)2(n-1);(2)SSE/22(n-r);(3)SSA与与SSE相互独立;相互独立;(4)证明略证明略7/3/20241821.7 方差分析方差分析 在给定在给定a下,查下,查F分布表可以得到分布表可以得到F临界值临界值Fa(r-1,n-1),然后计算然后计算F值与临界值比较,得到以下结论:值与临界值比较,得到以下结论:(1)若若F Fa(r-1,n-1),说明说明SSA/SSE比值较大,因素水比值较大,因素水平影响比随机波动的影响大,即因素水平影响显著,平影响比随机波动的影响大,即因素水平影响显著,拒绝拒绝H0;(2)若若FFa(r-1,n-1),说明说明SSA/SSE比值很大,即因比值很大,即因素水平影响特别显著,拒绝素水平影响特别显著,拒绝H0;(3)若若F Fa(r-1,n-1),说明说明SSA/SSE比值较小,即因素比值较小,即因素水平影响不显著,接受水平影响不显著,接受H0;总结步骤:假设总结步骤:假设统计量统计量查表查表下结论下结论7/3/20241831.7 方差分析方差分析 为了方便,构造以下单因素方差分析表:为了方便,构造以下单因素方差分析表:方差方差来源来源离差离差平方和平方和自由度自由度均方差均方差F统计量统计量计算值计算值F临界值临界值结论结论因素因素水平水平SSAr-1SSA(r-1)FFa随机随机波动波动SSEn-rSSEn-r总离差总离差SSTn-17/3/20241841.7 方差分析方差分析 推广:推广:(1)上述单因素方差分析表可以应用于各水平下试验次上述单因素方差分析表可以应用于各水平下试验次数不相同的情形。仍有:数不相同的情形。仍有:n=sum(mj)(2)若若2未知,则由:未知,则由:知知SSE/(n-r)是是2的无偏估计;的无偏估计;(3)如果希望进一步找出因素取何种水平试验指标最佳,如果希望进一步找出因素取何种水平试验指标最佳,可以通过两两比较检验问题可以通过两两比较检验问题H0*:i=j 来解决。来解决。7/3/20241851.7 方差分析方差分析 温度温度试验试验3040506014.36.110.06.527.87.34.88.333.24.25.48.646.59.67/3/20241861.7 方差分析方差分析方差方差来源来源离差离差平方和平方和自由度自由度均方差均方差F统计量统计量计算值计算值F临界值临界值结论结论因素因素水平水平14.1134.7031.098F0.05(3,10)=3.71接受接受H0随机随机波动波动42.83104.283总离差总离差56.94137/3/2024187
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!