资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,漳州师范学院教育系,概率和概率分布回顾,概率,自然界现象和人类社会现象,确定性现象,随机现象,必然现象,不可能现象,注意:一次观察的无法确切预测的性质,不是绝对的不确定,随机现象的确定性或规律性,随机现象的性质,偶然性:一次随机试验不能预测确定结果,规律性或必然性:多次随机试验(多次观察),随机现象的规律性的数学指标,次数或频数:,N,次重复随机试验,观察,事件,A,发生的次数,n,。,频率:,F,N,(A)=n/N,概率:当观测,次数,N,趋近于无穷大,时,,F,N,(A),趋近于一个稳定的数值,我们把它叫做,事件,A,发生的概率,P,(,A,)。,显然,如果对于,事件,A,,,经过无穷大,的观察,,果然存在一个,P,(,A,)值,那么这个值是由随机事件本身客观的属性决定的。,在,事件,A,发生的条件稳定的话,它的发生只有唯一一个,P,(,A,)值与它对应。,概率,P,(,A,)的数学定义,概率的运算规则,概率运算(n个事件同时发生),加法:互不相容事件,乘法:互相独立的事件,互不相容事件和互斥事件,正态分布,概率密度函数式,正态分布图形态、构成、概率分布特点,正态分布的应用,总体,样本,样本点,正态分布,标准量尺,统一度量衡目的是什么,公平与效率,Z,分数的线性转换,正态分布图,正态分布曲线图,坐标的意义,X:在可能性中,x事件出现,Y:x事件出现的概率密度,Z,分数及其线性转换,T=KZ+C,抽样,研究样本,简单随机抽样:相互独立,等距抽样:个体间变异大、分布均匀时,分层抽样:总体已有的与研究有关的特征,整群抽样:自然群体抽取。分层整群抽样,随机数字表法,抽签法,抽样图示1,抽样图示2,概率分布的分类结构图1,分布,经验分布频次分布,理论分布概率分布,基本随机变量分布,抽样分布(样本分布),离散分布二项分布,连续分布正态分布,概率分布的分类结构图2,按照随机变量的类型划分,数据的分布,统计量的分布(抽样分布),原始数据次数分布直方图,Z分数概率分布标准正态u,t分布,X2分布,F分布,二项试验,二项试验又称贝努里试验,相同条件下,n,次重复进行,或者一次进行,n,个随机试验(,n,是预先给定的任一正整数),每次试验结果只有两种对立状态,,A,或非,A,各次试验结果相互独立,每一次试验中两个相互对立的状态发生的概率保持不变的一类随机试验。,二项试验,与心理学研究进行类比,又称为又称贝努里分布,是一种常用的,离散型,随机变量的分布。,二项式定理,(,通式,),:(,p+q,),n,n,次二项试验,某事件出现,x,次的概率分布公式:,b(x,n,p)=C,n,X,p,x,q,n-x,C,n,X,n!/x!(n-x)!,二项分布,二项分布的表示,二项分布的均值和方差,在二项分布图中,,坐标的意义,X:n次试验中,成功出现x次的A事件,Y:A事件对应的概率(也是概率密度),二项分布与正态分布,在,n,次独立的二项试验中,若在每次试验中成功的概率为,p,,失败的概率为,q,(,p+q=1,),P,q,0.5,,,n,无穷大时,二项分布为正态分布,正态分布是二项分布的极限,pq,,,nq5,时,二项分布接近正态分布,随机变量,x,近似服从的正态分布。,二项分布的参数,二项分布的应用,三种主要问题类型举例,182,页:例,6-6,是非题,182,页:例,6-7,单项选择题,196,页:第,17,题,多项选择题,第四节 样本分布,样本分布:样本统计量的分布,统计推论的基础。,学习必要性:我们的需要是归纳整个一类个体,总体的某种属性。能测量到的只是它的一部分,我们需要根据样本对总体作出,推断,。,形成样本的抽样:,样本容量尽可能大?:,a,选择有偏,,b,回答有偏。当选择程序有偏时,抽取一个大的样本并无帮助,它只不过是在较大规模下去重复基本错误。,抽样方法:完全随机抽样、简单随机抽样(放回?)、其它抽样,代表性(客观性),抽样图示,抽样图示,回顾直方图、正态分布、近似正态,概率直方图,正态曲线,把一枚硬币抛,100,次,可能的型式有多少种?出现其中一种型式的先验概率是多少?怎么计算?,正态近似:每个人都相信,【,正态近似,】,,试验者想这是一个数学定理,数学家想这是一个试验事实。,G.Lippman,法国物理学家,(1845-1921),对于调查问卷得分的正态近似,当随机放回地从一个盒子中作抽取时,即使盒子中所装票子并不遵循正态,但抽得的数的和的概率直方图将遵循正态曲线。直方图必须换算成标准单位,并且抽取的次数必须适当的大。,【,美,】David Freedman,样本分布之一渐近正态,1,、总体分布已知,正态,总体方差已知,样本平均数的分布为正态。,样本平均数的分布,平均数的分布的参数:,样本平均数分布图,总体正态分布低阔,样本平均数分布高狭,n,上尖下沉,相同测量分数、相同标准分数,总体分布非正态时,总体方差已知,n30时,样本平均数服从渐进正态分布。,中心极限定理n的大小与趋近,学这些有什么用呢?,Z,N,偏斜,185页:方差与标准差的分布,样本分布之二,t,分布,格赛特的学生分布,小样本分布、平均数分布:187页解释,t,分布图及,t,分布表使用,187页,上沉下翘,t,分布特征,平均数,对称?,变量取值,当自由度大于,30,时,,t-,分布曲线与正态分布曲线接近,自由度趋于无限大时,,t-,分布为平均数为,0,,标准差为,1,的正态分布。,样本分布之三,2,分布,数学表达:从正态分布中派生,应用:,2,分布图,2,分布特点及分布表的用法,2分布为正偏态分布,自由度越小,偏斜度越大,当自由度无限增大时,2分布趋于正态分布,在统计检验中,2是计数资料分析常用的统计检验方法。,189页,2的和服从自由度的和的2分布,样本分布之四,F,分布,F,分布是由美国统计学家斯纳德克()提出的一种分布。,F,分布为一正偏态分布,取值在,0-+,之间,以,X,轴为渐近线;分布曲线随自由度变化,当自由度,m,、,n,增加时,,F,分布曲线与正态分布曲线接近。,在统计检验中,,F,分布常用于方差差异性的检验,也是方差分析所用的统计检验方法。,F分布图,F,分布,F分布表,问题,查表,理解概率和概率分布,概率是,0,到,1,之间的一个数,表示某一随机现象某一结果发生的可能性,概率分布是表示随机现象的结果与其可能性之间的函数。,正态分布是以平均数为中点的对称图形。,正态分布曲线下,标准差和概率有一定的数量关系。,正态分布表包括三个部分内容:,Z,分数、,y,值和,p,值。,利用正态分布表,可以(,1,)依据,Z,分数求概率,(,2,)依据概率求,Z,分数,理解概率和概率分布,二项分布,,如果满足,pq,nq5),时,二项分布接近正态分布,t-,分布,当自由度大于,30,时,,t-,分布曲线与正态分布曲线接近,F,分布,在统计检验中,,F,分布常用于方差差异性的检验,也是方差分析所用的统计检验方法。,在统计检验中,,2,是计数资料分析常用的统计检验方法。,总结四大分布,关系,Z,T,X,2,F,用处,原始数据,平均数,方差,Nothing is impossible,
展开阅读全文