资源描述
*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,*,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,第三章,概率与概率分布,本章是推断统计的基础,主,要,内,容,基础概率,概率的数学性质,概率分布、期望值与变异数,10/1/2024,1,参数估计和假设检验,推断,统计研究如何依据样本资料对总体性质作出推断,这是以概率论为基础的。,随机原则,总体,样本,总体参数,统计量,推断估计,参数估计,检验,假设检验,抽样分布,10/1/2024,2,第一节 基础概率,概率论起源于,17,世纪,当时在人口统计、人寿保险,等工作中,要整理和研究大量的随机数据资料,这就需,要一种专门研究大量随机现象的规律性的数学。,参赌者就想:如果同时掷两颗骰子,,则点数之和为,9,和点数之和为,10,,哪种情况出现的可能性较大?,例如,17,世纪中叶,贵族德,梅尔发现:将一枚骰子,连掷四次,出现一个,6,点的机会比较多,而同时将两枚,掷,24,次,出现一次双,6,的机会却很少。,10/1/2024,3,概率论的创始人是法国的帕斯卡,(16231662),和费,尔马,(16011665),,他们在以通信的方式讨论赌博的机率,问题时,发表了,骰子赌博理论,一书。棣莫弗,(1667,1754),发现了正态方程式。同一时期瑞士的伯努利,(1654,一,1705),提出了二项分布理论。,1814,年,法国的拉普拉斯,(17491827),发表了,概率分析论,,该书奠定了古典概,率理论的基础,并将概率理论应用于自然和社会的研,究。此后,法国的泊松,(17811840),提出了泊松分布,德,国的高斯,(17771855),提出了最小平方法。,10/1/2024,4,随机现象和随机事件,随机现象具有一定条件呈现多种可能结果的特性。,人们把随机现象的结果以及这些结果的集合体称作随机事件。,概率是与随机现象相联系的一个概念。所谓随,机现象,是指事先不能精确预言其结果的现象,如即,将出生的婴儿是男还是女?一枚硬币落地后其正面是,朝上还是朝下,?,等等。所有这些现象都有一个共同的,特点,那就是在给定的条件下,观察所得的结果不止,一个。随机现象具有非确定性,但内中也有一定的规,律性。例如,事先我们虽不能准确预言一个婴儿出生,后的性别,但大量观察,我们会发现妇女生男生女的,可能性几乎一样大,都是,0.5,,这就是概率。,10/1/2024,5,在统计学中,我们把类似掷一枚硬币的行为(或对某一随机现象进行观察)称之为随机试验。随机试验必须符合以下三个条件:它可以在相同条件下重复进行;试验的所有结果事先已知;每次试验只出现这些可能结果中的一个,但不能预先断定出现哪个结果。,1.,样本点,2.,样本空间,例,掷一颗骰子,试列出它的基本事件和样本空间。,随机试验的每一个可能的结果,称为基本事件(或称样本点),所有样本点的全体称作样本空间,(Sample space),,记作,10/1/2024,6,简单事件,:仅含样本空间中一个样本点的事件。,复合事件,:含样本空间中一个样本点以上的的事件。,必然事件,:从样本空间来看,该事件事件是由其全部基本事件所组成,记作,S,。,随机事件,不可能事件,:从样本空间来看,不含任何基本事件,记作,。,极端的,随机事件,10/1/2024,7,例,对掷一颗骰子的试验,我们研究如下,事件:,A,为“点数是,3”,;,B,为“出现奇数点”;,C,为“出现点数不超过,6”,;,D,为“点数是,7”,。,解,因为,1,,,2,,,3,,,4,,,5,,,6,,所以,A,3,,为简单事件;,B,1,,,3,,,5,,为复合事件;,C,1,,,2,,,3,,,4,,,5,,,6,,为必然事件;,D,7,,为不可能事件。,10/1/2024,8,2.,事件之间的关系,(,1,)事件和(,Or conjunction),事件,A,与,事件,B,至少有一个事件发生所构成的事件,C,称为,A,与,B,的事件和,记作,(,2,)事件积,(As-well-as conjunction),事,件,A,与事件,B,同时发生所构成的事件,C,称为,A,与,B,的事件积,记作,10/1/2024,9,(,3,)事件的包含与相等,事件,A,发生必然,导致事件,B,发生,则称为,B,包含,A,记作,如果 则,(,4,)互斥事件,事件,A,和事件,B,不能同时,发生,则称,B,和,A,是互斥事件,或互不相容事,件,记作,10/1/2024,10,(,5,)对立事件,事件,A,与事件,B,是互斥事,件,且在一次试验中必有其一发生,称,A,与,B,为,对立事件(逆事件),记作,(,6,)相互独立事件,事件,A,的发生与事,件,B,是否发生毫无关系,称,A,与,B,为相互独立事,件,记作,10/1/2024,11,两之 随间 机的 事关 件系,10/1/2024,12,3.,先验概率,在统计学中,有两种常见的确定概率的方法:古,典法和频率法。,由普拉斯,1814,年提出。以想象总体为对象,利用模型本身所具有的对称性来事先求得概率,故被称为先验概率。,条件:,(,1,)在一样本空间中,各样本点出现的机会均等;,(,2,)该样本空间只有有限(,n),个样本点。,用古典,法求出,的概率,10/1/2024,13,例,掷两枚均匀的硬币,求“两枚都朝上”的概率;求,“,一枚朝上,一枚朝下”的概率。,这样对于含有,m,个样本点的事件,A,,其出现,的概率为,用古典法求算概率,在应用上有两个缺点:它只适用于有限样本点的情况;它假设机会均等,但这些条件实际上往往不能得到满足。,10/1/2024,14,4.,经验概率,求算概率的另一途径是运用频率法。设想有一个与某试验相联,系的事件,A,,把这个试验一次又一次地做下去,每次都记录事件,A,是否发生了。假如做了,n,次试验,而记录到事件,A,发生了,m,次,(即成功,m,次),则频数与试验次数的比值,称作次试验中事件,A,发生的频率,显然,频率具有双重性质:随机性和规律性,.,当试验或观察次数趋近于无穷时相应频率趋于稳定,这个极,限值就是用频率法所定义的概率,即,频率稳定到概率这个事实,给了“机会大小”即概率一个浅显而,说得通的解释,这在统计学上具有很重要的意义。坚持这种观点的,统计学派也就被称为频率学派。,10/1/2024,15,比如:,法国统计学家蒲丰(,Buffon,)把铜板抛了,4040,次,正面的次数是,2048,,比例是,0.5069,。,1900,年,英国统计学家皮尔逊把硬币抛了,24000,次,正面的次数是,12012,,比例是,0.5005,南非数学家柯屈瑞在监狱时,把硬币抛了,10000,次,正面的次数是,5067,,比例是,0.5067,。,再如:,保险公司会利用概率进行人寿保险经营,比如研究表明,20,24,岁的男性中明年死亡的概率是,0.0015,,同龄的女性是,0.0005,,保险公司对男性的保费就多收一些。,10/1/2024,16,2.,加法规则,如果事件,A,和事件,B,互斥,那么,如果,A,和,B,是任何事件,(,不一定互斥,),,,加法规则更普通地表示为如下形式,第二节 概率的数学性质,1.,非负性,特别对必然事件,和不可能事件有,10/1/2024,17,例,从一副普通扑克牌中抽一张牌,求抽到一张红,桃或者方块的概率。,例,在一副,52,张扑克牌中,求单独抽取一次抽到一,张红桃或爱司的概率。,10/1/2024,18,加法规则可推广到对两个以上的事件,若事件,A,,,B,,,CK,都互斥,那么有,P(,A,或,B,或,C,或,K,),P(,A,)+P(,B,)+P(,C,)+P(,K,),例,根据上海市职业代际流动的统计,向下流动,的概率是,0.07,,静止不动的概率是,0.6,,求向上流动的,概率是多少?,例,为了研究父代文化程度对子代文化程度的影,响,某大学统计出学生中父亲具有大学文化程度的占,30,,母亲具有大学文化程度的占,20,,而双方都具,有文化程度的占有,10,,问从学生中任抽一名,父代,至少有一名具有大学文化程度的概率是多少?,10/1/2024,19,3.,乘法规则,式中符号 和 代表条件概率。应理,解为,“在,B,已经发生条件下,A,发生的概率”。条件概率的意思是,,A,发生的概率可能与,B,是否发生有关系。换言之,,B,已经发生时,A,发生,的概率可能有别于,B,没有发生时,A,发生的概率。,理解统计独立的概念,对于灵活运用概率的乘法规则,很重要。现在用条件概率来加以表达,统计独立是指,若,A,和,B,在统计上相互独立,(,无关,),,这时乘法规则可以简化为,10/1/2024,20,例,假定有下列,3000,个社区的数据,如果随机地从这,个总体中抽取一个社区,得到一个中等的而且犯罪率,低的社区的概率是多少,?,例,假定数据变动如下,随机地从这个总体中抽取一个社区,得,到一个中等的而且犯罪率低的社区的概率又是多少,?,属性,大,中,小,总和,高犯罪率,600,300,100,1000,低犯罪率,600,900,500,2000,总和,1200,1200,600,3000,属性,大,中,小,总和,高犯罪率,100,300,600,1000,低犯罪率,500,900,600,2000,总和,600,1200,1200,3000,10/1/2024,21,例,根据统计结果,男婴出生的概率是,22/43,,女婴出生的概率是,21/43,,某单位有两名,孕妇,问两名孕妇都生男婴的概率是多少?都,生女婴的概率是多少?其中一男一女的概率是,多少?,例,某居民楼共,20,户,其中核心家庭为,2,户,问访问两户都是核心家庭的概率是多少?,问访问第二户才是核心家庭的概率是多少?,10/1/2024,22,例,为了研究父代文化程度对子代文,化程度的影响,某大学统计出学生中父亲,具有大学文化程度的占,30,,母亲具有大,学文化程度的占,20,,而双方都具有文化,程度的占有,10,,问从学生中任抽一名,,父代至少有一名具有大学文化程度的概率,是多少?,10/1/2024,23,在抽样方法中还经常涉及到,回置抽样,和,不回置抽样,。如前所述,所谓回置抽样,就是抽取的单位登记后又被放回总体中去,然后再进行下一次抽取。使用回置抽样法,先后两次抽取是彼此独立的。因为每一次抽取后抽取到的单位都得返还,总体保持不变,前一次的结果不可能影响到后一次。所谓不回置抽样,就是不再把抽取到的单位退还总体。这样先后两次抽取就不再独立了,必须使用条件概率的概念。,用不回置法从一幅普,通扑克牌抽取两次,计算,得到两张爱司的概率。,用回置法从一幅普通,扑克牌抽取两次,计算,得到两张爱司的概率。,10/1/2024,24,4.,排列和样本点的计数,要正确解决概率问题,往往光考虑乘法规则还不够,还要同时考虑使用加法规则。一般最简单的做法是:首先确定一种符合要求的排列方式并计算它们发生的概率,然后再考虑还有没有其他同样符合要求的排列方式。如果存在着其他实现方式,并且都具有相同的概率,就可以简单地把排列方式数与以某一给定的排列方式计算的概率相乘。注意,后一步相当于使用了加法规则。,所有,N,个元,素都不相同的,情况下,排列,方式数为,N,个元素中,若其中第一组中有,r,1,个不能,区分的元素,第,2,组中有,r,2,个不能区分的元,素,,,第,k,组中有,r,k,个不能区分的元素,,且各组彼此是可以区分的,则总的排列数为,10/1/2024,25,例,从一幅洗得很好的扑克牌中做了,3,次抽取,假定使用回置,法,求至少得到,1,张,A,和一张,K,的概率是多少,?,解,按照题意,要在不同样本空间中考虑三种复合事件:抽到,1,张,A,和,1,张,K,,另,l,张非,A,非,K,,用符号
展开阅读全文