资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,医药数理统计,教师:吕 靖,联系方式:,邮箱:,QQ号:76756940,办公室:公教楼123,第一章,.,事件与概率,第二章,.,随机变量的概率与数字特征,第三章,.,实验设计,第四章,.,抽样分布,第五章,.,参数估计,第六章,.,假设检验,第八章,.,线性相关与回归分析,第九章,.,正交设计,概率规律,统计方法,主要内容,第七章,.,方差分析,第十章,.,均匀设计,实验设计,确定性现象:结果确定,不确定性现象:结果不确定,自然界与社会生活中的两类现象,抛出的物体会掉落到地上,明天天气状况,买了彩票会中奖,抛硬币出现正(反)面,事件与概率,一次抛掷硬币试验,(出现正面朝上),多次抛掷硬币实验,(出现正面朝上的次数),不确定,近半数(规律),这种在个别实验中其结果呈现出不确定性,在大量重复试验中其结果又具有统计规律性的现象,称为,随机现象,。,概率论与数理统计是研究和揭示随机现象规律性的一门数学学科。,事件与概率,第一节 随机事件及其运算,一、随机事件,随机试验:,对随机现象的,观察(试验),抛一枚硬币,观察,抛一颗骰子,观察,记录某城市120急救电话台一昼夜接到的呼叫次数,观察,某一电子元件的寿命,将一枚硬币连抛三次,考虑正(反)面出现的情况,具有以上三个特点的试验成为,随机试验,,简称,试验(E)。,1、可以在相同条件下重复;,2、每次试验的结果可能不止一个,并且能事先明确试验的所有可能结果;,3、进行一次试验之前不能确定哪一个结果会出现。,事件与概率,样本空间:,试验所有的结果的集合(,),抛硬币:正面,反面,抛一颗骰子:1,2,3,4,5,6,记录某城市120急救电话台一昼夜接到的呼叫次数:1,2,3,4,,观察,某一电子元件的寿命: R+,将三枚硬币:正正正,正正反,正反反,反反反,随机事件:,随机试验的结果(样本空间的子集)(,A,B.,),基本事件,:,不能分解成其它事件的最简单的随机事件.,必然事件:,每次试验必然发生(,),不可能事件:,每次试验都不会发生(,),二、事件间的关系与运算,事件的包含:,如果事件,A,发生必然导致,B,发生,则称事件,B,包含事件,A,或称事件,A,包含于事件,B,或称,A,是,B,的子事件,记作,B,A,或,A,B,说明:,A,B,属于,A,的每一个样本点一定也属于,B,对任意事件,A,易知,A,事件的相等:,如果事件,A,包含事件,B,事件,B,也包含事件,A,则称事件,A,与,B,相等,(,或等价,),记作,A,B,说明:,相等的两个事件总是同时发生或同时不发生,事件与概率,事件的并,(,或和,),“,事件,A,与,B,至少有一个发生,”,这一事件称,作事件,A,与,B,的并,(,或和,),记作,A,B,或,A,B,例,.,在投掷一枚骰子的试验中,记,A,“,点数为奇数,”,B,“,点数小于,5,”,则,A,B,?,事件的交,(,或积,),“,事件,A,和,B,都发生,”,这一事件称为事件,A,与,B,的交,(,或积,),记作,A,B,(,或,AB,),说明:,两个事件的并与交可以推广到有限个或可数个事件的并与交,例,.,在投掷一枚骰子的试验中,记,A,“,点数为奇数,”,B,“,点数小于,5,”,则,A,B,?,事件与概率,事件的差,“,事件,A,发生而,B,不发生,”,这一事件称为事件,A,与,B,的差,记作,A,B,例,.,在投掷一枚骰子的试验中,记,A,“,点数为奇数,”,B,“,点数小于,5,”,则,A,B,?,互不相容事件,若事件,A,与,B,不可能同时发生,也就是说,AB,是不可能事件,即,AB,则称事件,A,与,B,是互不相容事件,事件与概率,完备事件组:,设,A,1,A,2,A,n,是两两互不相容的事件,并且和为,,,称,A,1,A,2,A,n,是一个完备事件组,例,.,考察某一位同学在一次数学考试中的成绩,分别用,A,B,C,D,P,F,表示下列各事件,(,括号中表示成绩所处的范围,),A,优秀,(90,100),D,及格,(60,70),B,良好,(80,90),P,通过,(60,100),C,中等,(70,80),F,未通过,(0,60),则:,A,B,C,D,F,是两两不相容事件,P,与,F,是互为对立的事件,即有,P,F,A,B,C,D,均为,P,的子事件,且有,P,A,B,C,D,对立事件:,“,事件,A,不发生,”,这一事件称为事件,A,的对立事件,记作,A,如:,在投掷一枚骰子的试验中,“,点数小于,3,”,和,“,点数大于,4,”,这两个事件是互不相容事件,说明:,在一次试验中,如果,A,发生,则,A,一定不发生,如果,A,不发生,则,A,一定发生,因而有,A,A,A,A,问:对立事件与互不相容事件之间的关系?,事件与概率,三、随机事件的运算律,1,关于求和运算,(1),A,B,B,A,(,交换律,),(2) (,A,B,),C,A,(,B,C,),A,B,C,(,结合律,),2,关于求交运算,(1),A,B,B,A,(,交换律,),(2) (,A,B,),C,A,(,B,C,),A,B,C,(,结合律,),3,关于求和与求交运算的混合,(1),A,(,B,C,),(,A,B,),(,A,C,),(,第一分配律,),(2),A,(,B,C,),(,A,B,),(,A,C,),(,第二分配律,),4,关于求对立事件的运算,5,德摩根律,事件与概率,频 率 稳 定 值 概率,概率的统计定义,频率:,在相同条件下进行,n,次试验,事件发生的次数,m,称为事件,发生的频数。称 为发生的频率。记作,定义:,当,n,足够大时,,频率的稳定值,p,(注意概率与频率的区别),性质:,第二节 事件的概率,注:概率是一个随机事件所固有的属性,与试验次数以及每一次试验结果无关。,频率的性质,事件发生的频繁程度,事件发生的可能性的大小,概率的统计定义,事件与概率,一、概率的定义,概率的古典定义,前提:,试验样本空间只包含有限个元素;每个基本事件发生等可能性。,定义:,已知样本空间,中,基本事件,总数为,n,,若事件,A,包含,k,个,基本事件,,,则有,例:,将一枚硬币抛三次,求(1)事件A=恰有一次出现正面(2)事件B=至少有一次出现正面?,例,:某学习小组有10名同学,其中7名男生,3名女生,从中任选3人去参加社会,活动,则3人全为男生的概率为?,补充:排列与组合,排列定义:,从,m,个元素中,取出,n,(,nm,)个元素按一定顺序排成一列。记为,组合定义,:从,n,个元素中,任取,k,个为一组,得出的不同的组数,称为组合数。,记作,1.,互斥事件加法定理(有限可加性),若事件,A,、,B,互斥,则有,P,(,A+B,),=P,(,A,),+P,(,B,),推广:若 为两两互斥事件,则,例,.,药房有包装相同的六味地黄丸,100,盒,其中,5,盒为去年产品,,95,盒为今年产品。现随机发出,4,盒,求:有,1,盒或,2,盒陈药的概率。,2.,一般加法定理,对任意两事件,A,、,B,,有,P(A+B)=P(A)+P(B),P(AB),推广:对任意三事件,A,、,B,、,C,,有,P(A+B+C)=P(A)+P(B)+P(C),P(AB),P(AC),P(BC)+P(ABC),3.,减法定理,对任意的,A,、,B,,有,P(A-B)=P(A),P(AB),二、概率的运算,4.,条件概率与乘法定理,条件概率:,在事件,B,已经发生的条件下,,A,发生的概率称为,A,的条件概率,记,性质:,一般情况下,,例,.,袋中有,2,个白球,,8,个黑球,现让两个人去抽球(无放回)。若已知第一个人抽到白球,则第二个人也抽到白球的概率是多少?,乘法定理:,推广公式:,4.,独立事件及其乘法定理,独立事件:,若 或 或,则称时间,A,、,B,相互独立。,定理:,若,A,与,B,,,A,与 , 与,B,, 与 中有一对相互独立,则另外三对也相互独立。,推广:,若任意三事件,A,、,B,、,C,两两独立,且,P,(,ABC,),=P(A)P(B)P(C),则称,A,、,B,、,C,相互独立。,多事件相互独立,多事件两两独立,例如:,抛一枚硬币两次,记,A=,第一次为正面,B=,第二次为反面,C=,两次都为同一面,。分析知,,A,、,B,、,C,两两独立,但不相互独立。,独立事件的乘法定理:,若 相互独立,则,注意:,具有非零概率的两事件,互斥就不独立,独立就不互斥。,例,.,若每人血清中有肝炎病毒的概率为,0.4%,,今混合,100,人的血清,求混合血清无肝炎病毒的概率。,1.,全概率公式,:,若 构成互斥完备群,则对任意事件,B,,有,全概率公式的意义:,在较复杂情况下直接计算,P(B),不易,借助于一个完备事件组,将复杂事件分解成若干个互不相容的简单事件的和,再利用概率的加法公式求出复杂事件概率。,例,12.,设药房的某种药品由三个不同的厂家生产。其中第一家药厂生产的药品占,1/2,,第二、三家分别占,1/4,,已知第一、二家药厂生产的药品有,2%,的次品,第三家药品有,4%,的次品。试求:现从药房任取一份,问拿到次品的概率?,第四节 全概率公式和逆概率公式,实际工作中还会遇到与全概率问题相逆的问题。,如例,12,改成,:,设药房的某种药品由三个不同的厂家生产。其中第一家药厂生产的,药品占,1/2,,第二、三家分别占,1/4,,已知第一、二家药厂生产的药品有,2%,的次品,第三家药品有,4%,的次品。试求:拿到的药品是次品时,该次品由各家药厂生产的可能性为多大?,2.,逆概率公式(贝叶斯公式):,设 是互斥完备群,则对任意事件,B,,,有,随机变量的概率分布与数字特征,第一节 随机变量与离散型随机变量的概率分布,引入随机变量使得随机事件可用随机变量的关系式表示,从而使对随机现象研究进一步深入、更数学化。,1.随机变量,对于随机试验,若其试验结果可用一个取值带有随机性的变量来表示,且变量取这些可能值的概率是确定的,则称这种变量是随机变量。,注意:,随机变量常用,X,Y,Z,表示,而表示随机变量所取的值通常用,x,y,z,表示。,例如,,从某一学校随机选一学生,测量他的身高。我们可把可能的身高看作随机变量,X,,然后提出关于,X,的各种问题。如,P,(,X,1.7)=?,P,(,X,1.5)=?,P,(1.5,X,1.7)=?一旦我们实际选定了一个学生并量了他的身高之后,我们就得到,X,的一个具体的值,记作,x,。这时,要么,x,1.7米,要么,x,1.7米,再去求,P,(,x,1.7米)就没有什么意义。,性质1:,随机变量取任何值的概率均为,非负,。,性质2:,随机变量取所有可能值的,概率之和为1,。,2.离散型随机变量,如果随机变量只能取有限个或无限可列个数值,则称它为离散型随机变量。,例如:小白鼠存活的只数,引体向上次数等。,3.连续型随机变量,如果随机变量的可能取值为某一区间的所有实数,无法一一列举,则称他为连续型随机变量。,例如:身高、体重等。,4.离散型随机变量的概率函数,设离散型随机变量X的所有可能取值为x,i,(i=1,2,),相应的概率P(X=x,i,)=p,i,称为离散型随机变量X的,概率函数,或,分布律,。,通常X的分布律可用表格表示:,概率函数有如下性质性质:,例.,某篮球运动员投中篮圈概率是0.9,求他两次独立投篮投中次数,X,的概率分布。,X x,1,x,2,x,i,P p,1,p,2,p,i,5.离散型随机变量的分布函数,设X是一个随机变量(可以是离散型,也可以是连续型),x是任意实数,则函数,F(x)=P(Xx)称为随机变量X的,分布函数,。,性质:,(1) F(x)为非减函数;,(2)0F(x)1 (-x+);,(3)F(-)=0, F(+)=1;,(4)F(x) 右连续,即,例.,给青蛙按每单位体重注射一定数量的洋地黄,由以往的实验知,致死的概率,为0.6,存活的概率为0.4,现给两只青蛙注射,求死亡只数的,概率函数和分布函,数,。,0 1 2 x,F(x),第二节 常用的离散型随机变量的概率分布,1.二项分布,伯努利试验:,许多试验只有两种,互斥,的结果,为了找到这些试验结果的规律性,,需要在相同条件下做n次,独立重复,试验,称为n重伯努利试验,简称伯努利试验。,二项分布,若在一次伯努利实验中成功(事件,A,发生)的概率为,p,(0,p0,则称X服从参数为的泊松分布,记为XP ()。,许多,稀有事件,都服从或近似服从泊松分布。 =np。,例5.,已知某地区人群中患某种病的概率为0.001,试求在检查的5000人中至少有2,人患此病的概率。,解:由于n=5000较大,p=0.001较小,取=np=5,设X=患此病人数, 则XP(5),若精确计算,则XB(5000,0.001),第3节 连续型随机变量的概率分布,1.连续型随机变量的概率密度,若对于随机变量,X,的分布函数,F(x),,存在非负函数,f (x),使得对于任意实数,x,有:,则称,X,为连续型随机变量,其中被积函数,f(x),称为,X,的,概率密度函数,(简称概率,密度),性质,:, f (x) 0;,对于任意实数a,b(a 0)为常数 ,则称X服从参数为,2,的,正态分布,(或高斯分布),记为,XN(, 2),.,特点:,曲线f(x)呈钟形,关于直线x=对称,在(-,上递增,在,+),上递减。,在x=处,f(x)取最大值,在x=处有拐点,且以x轴水平渐近线。,当固定时,改变,则f(x)图形的形状不变,只改变其位置,确定图形的,中心位置,称,位置参数,增大,曲线向右移。,当固定时,越小图形越陡峭,确定图形峰的陡峭形状,故称,形状参数,。,标准正态分布,参数=0,=1的正态分布为,标准正态分布,,记为XN(0,1)。,标准正态分布的重要性在于,,任何一个正态分布都可以通过线性变换转化为标准正态分布,。它的依据是下面的定理:,根据定理,只要将标准正态分布的分布函数制成表,就可以解决一般正态分布的概,率计算问题。,正态分布是自然界及工程技术中最常见的分布之一,大量的随机现象都是服从或,近似服从正态分布的,正态分布是概率论中最重要的分布。,均匀分布、对数正态分布等分布不做要求。,第4节 随机变量的数字特征,随机变量,数字特征,,分两类:,表示,集中程度、平均水平,数学期望,、分位数、中位数、众数等;,表示,离散程度、变异大小,方差、标准差、变异系数,等。,1.均数(数学期望),定义1:,设离散型随机变量,X,的分布律为,P,X,=,x,i,=p,i, k=1,2,3. ,则规定,X,的均数,定义2:,设连续型随机变量,X,的概率密度函数f(x),则规定X的均数为,性质:,(1),E,(,c,)=,c, c为常数,(2),E,(,cX,)=,c,*,E,(,x,),(3),E,(,X,Y,)=,E,(,X,)E(,Y,),(4),E,(,XY,)=,EX,*,EY,,,X,与,Y,独立,常见分布的数学期望,二项分布:,泊松分布:,正态分布:,E,(,X,)=,2.方差和标准差,方差:,设,X,是一个随机变量,则称,E,(,X,-,EX,),2,为,X,的方差,记作,DX,, 为标准差。,注:,随机变量的方差反映了它的取值与其数学期望的偏离程度,它是衡量取值,离,散程度,的一个尺度。,对于离散型随机变量:,对于连续型随机变量:,性质:,(1),D,(,c,)=0,,c,为常数,(2),D,(,cX,)=,c,2,*,D,(,X,),(3),D,(,X,Y,)=,DX,+,DY,,,X,与,Y,相互独立,常见分布的方差,二项分布:,泊松分布:,正态分布:,例7:,设XP(2),则下列结论中正确的是( ),A.EX=0.5,DX=0.5B.EX=0.5,DX=0.25,C.EX=2,DX=4 D.EX=2,DX=2,例8:,相互独立的随机变量X和Y的方差分别为4和2,则随机变量3X-2Y的方差是?,3.变异系数,比较度量单位不同或均数相差悬殊的两组(或多组)资料的变异程度。,第5节 三种重要分布的渐进关系(略),当n,二项分布B (k; n, p)以泊松分布P (k; )为极限分布;,当n,二项分布B (k; n, p)以正态分布N (np, npq )为极限分布;,当n,泊松分布P (k; ) 以正态分布N(; )为极限分布。,例:,第3讲 随机抽样、抽样分布和总体的参数估计,第1节 随机抽样,1.总体与样本,总体:,研究对象的全体,组成总体的每个单元称为个体。,样本:,在一个总体X中抽取n个个体X,1,,X,2,X,n,,这n个个体组成的集合称为总体,X的一个样本。样本中含有个体的数目称为,样本容量,,也称样本的大小。,简单随机抽样,是指在抽取样本单位时,总体的每一个可能的样本被抽中的概率相同。,简单随机样本,样本X,1,,X,2,X,n,相互独立且与总体X有相同的分布函数,这样的样本称为简单随,机样本。,第2节 样本的数字特征,统计量:,设X,1, X,2,X,n,为总体X的一个样本,g(X,1,,X,2,X,n,)为一个样本函数,如,果g中,不含有任何未知参数,,则称g为一个统计量。,特点:(1),统计量是样本中n个随机变量X,1,X,2,Xn的函数,它是完全由样本决,定的量,仍是一个随机变量。,(2)统计量不包含任何未知参数。,例如:,几种常见统计量,样本均数,样本方差、标准差、变异系数(相对标准差),注意:分母为n-1,。,由于样本方差中的均数是样本的,是总体的一部分,其离差平,方和一定变小,所以若以n为分母,S,2,一般比总体方差小(有偏估计)。而分母改,为n-1后,经数学证明,S,2,总在总体方差周围波动(无偏估计),另外,S,2,的,自,由度,正好是n-1。,样本的标准误,SD与SE的区别:,SD是描述个体观察值变异程度的大小,样本标准差越小,样本均,数对一组样本观察值的代表性就越好;SE是描述,样本均数变异程,度和抽样误差的大小,,样本标准误越小,用样本均数估计总体均,数可靠性就越高。,在实际中,一般,用样本标准差与样本均数结合,,用于描述样本观察值的分布范,围;,样本标准误与样本均数结合,,用于估计总体均数可能出现的范围。,第3节 抽样分布,统计量是样本随机变量的函数,也是一个随机变量,因而也有自己的概率分布,,这种统计量的分布叫做,抽样分布,。,以下介绍几种在已知,总体为正态分布,条件下,常见统计量的抽样分布。,1.样本均数的u分布,这说明,样本均数的期望与总体的期望相等,,而,方差为总体方差的1/n倍,。可见,用,样本均值估计总体均值无系统偏差,且n越大越精确。,样本均值分布的应用:,其标准化随机变量u主要用于单正态总体、方差已知、小样本条件下数学期望的u检验。,2.,2分布(卡方分布),设X1,X2,Xn相互独立,都服从N(0,1),则称随机变量:,所服从的分布为,自由度为n,的,2分布,记为,2,2(n)。,自由度:,指统计量中独立变量的个数。计算公式为df=n-k,n为样本容量,k为约,束条件个数。如统计量 ,变量独立无约束条件,所以自由,度为n。而样本方差 ,其中有n个变量 ,但,这说明变量间有一个约束条件,所以其自由度为n-1.,性质:(1)一种非对称分布。当n较大时,曲线近似对称,趋于正态分布。,(2),一个以自由度n为参数的分布族,,自由度n决定了分布的形状,对于,不同的n有不同的分布。,(3),均值为n,,,方差为2n,。,定理,:若X1,X2,Xn为正态总体 的一个样本,则有,3.t分布,设XN(0,1),Y,2(n),且X与Y相互独立,则称随机变量 所服从的分,布为自由度为n的t分布,记为tt(n)。,性质:(1) t分布是对称分布,与标准正态分布相比,t分布的中心部分较低,2个尾部较高。,(2)均值为0, 方差为n/(n-2)。,(3)当样本容量n较小时,t分布的方差大于1;当n逐渐增大时,t分布的方差就接近1,t分布也就趋近于标准正态分布。,t分布是统计学中十分重要的分布,应用最为广泛,其应用的依据是下面2个定理:,(1) 设X1,X2Xn为正态总体 的一个样本,则,(2) 设X,1,,X,2,X,n1,和Y,1,,Y,2,Y,n2,分别是从,同方差,的总体 和,中所抽取的样本,它们是相互独立,则,其中,,S,1,和S,2,分别是这两个样本的标准差。,4.F分布,设X,2(n1), Y,2(n2), X与Y相互独立,则称统计量 为服从自由度,n1和n2的F分布,记为FF(n1,n2),。,n1为分子随机变量X的自由度,称为分子自由度,n2为分母随机变量Y的自由度,称为分母自由度。,性质:(1) 非对称偏左侧的分布;当n较大时,曲线近似对称,趋于正态分布。,(2)是以自由度n1和n2为参数的分布族,不同自由度决定了F 分布的形状。,概率分布的拟合及其应用不做要求。,第4节 总体的参数估计,统计推断:,用样本的信息去推断总体的信息。,参数估计:用样本统计量去估计总体参数的大小。,假设检验:用样本统计量大小去推断总体参数是否有差异。,1.参数点估计(略),直接用样本统计量大小代替总体参数。同一总体参数可用多个统计量来估计,衡,量其好坏的指标有三个:,无偏性,、,有效性,、,一致性,。,(易出选择题或填空题),缺陷:,(1)点估计值不一定是参数的真值,即使与真值相等也无法肯定这种相等,(总体参数本身是未知的)。,(2)点估计值只是未知参数的一个近似值,没有给出它与真值之间的误差范,围(可靠程度),把握不大。,实例:,估计全省18岁女孩的平均身高。若根据实际样本,通过,点估计法,可能得到,女孩的平均身高估计值为,162cm,。而实际上,女孩的平均身高可能大于或小,于162cm。若能给出一,区间,,能以,较大概率,相信这个区间包含身高的真值,,将会,更有价值,。,2、区间估计,在给定可靠程度1-,下,用样本值通过合适统计量,估计总体参数,所在区间的,方法。,置信区间与置信度,设,是总体的未知参数,若由样本X1,X2,Xn 确定的两个统计量:,对给定,(0,50,正态总体总体均数之差的区间估计、正态总体方差的区间估计(略)。,离散型总体参数的区间估计不作要求。,第4讲 总体参数的假设检验,第1节 假设检验的基本思想,问题的提出,从吸烟人群和非吸烟人群中各抽取n=100的样本,分别记为A样本和B样本。A样本,收缩压为150mmHg,B样本为130mmHg。,原因有两种可能:(1) 两个,总体均数不相同,(2),抽样误差,(两个总体均数相同),假设检验的基本思想,(1),反证法,(2),小概率原理:,认为小概率事件在一次抽样中是不可能发生的。,先假定一个假设H0:1=2成立,如果由此导出一个不合理现象的发生(即出现,一个小概率事件),就拒绝这个假设;如果没有导出不合理的现象发生,就不能,拒绝这个假设。,假设检验的基本步骤,(1)建立假设,H0:,1=,2,(原,假设),H1:,1,2,(备择假设),注意:,假设是针对总体,而不是样本,(2)确定检验水准,显著性水准,判定差别有无统计学意义的概率水准,确定了,小概率事件的标准,。,通常取,=0.05。P ,- 小概率事件,(3)选定检验方法,计算检验统计量,根据研究目的、资料类型选用合适的检验方法;,统计量都是在,H,0,成立的前提下,算出来的!,(4)确定P值,根据检验统计量确定P值,。,P值:,H,0,成立的概率,如果P,0,.05,即H,0,成立的概率小于0.05,可以认为H,0,成立是小概率事件,发生的,可能性很小,就有理由怀疑H,0,不成立!,(5)做出推断结论,推断的结论,统计学结论,专业结论,P0.05,,按=0.05检验水准,,不拒绝H,0,,差异,无,统计学意义,,还不能认为,不同或不等。,P0.05,,按=0.05检验水准,,拒绝H,0,,,接受H,1,,差异,有,统计学意义,,可以认为,不同或不等。,下结论时,对H,0,只能说,拒绝/不拒绝,;对H,1,只能说,接受,!,不拒绝H,0, 接受H,0,第2节 单个正态总体的参数检验,2,已知时正态总体均值的,u,检验,设总体X,N(,2,),X1,X2,Xn为抽自总体,X,的样本,方差,2,已知,则,例1.,某药厂正常情况下生产的某药膏含甘草酸量,X,N,(4.45,0.1082).现随机抽,查了5支药膏,其含甘草酸量分别为:4.40 4.25 4.21 4.33 4.46,若方,差不变,问此时药膏的平均含甘草酸量是否有显著变化?(,=0.05),解:H0:=0,H1:,0;=0.05,根据显著水平,=0.05,查正态分布双侧,临界值,,得u,0.05/2,=1.96,|u|=2.485,u,0.05/2,,所以拒绝,H,0,接受,H,1。,可以认为此药膏的平均含甘草酸量有显著性变化。,2,未知时正态总体均值的,u,检验,设总体X,N(,2),X1,X2,Xn为抽自总体,X,的样本,方差2未知,则,例2,.正常人的脉搏平均为72(次/min),现测得20例慢性四乙基铅中毒患者的脉,搏(次/min)的均值是63.50,标准差是5.60,若四乙基铅中毒患者的脉搏服从正态,分布,问四乙基铅中毒患者的脉搏是否与正常人不同?(,=0.05),解: H0:=0,H1:,0,=0.05,查t分布临界值表得:,|t|=6.7882.093,所以拒绝H0,接受H1,可认为四乙基铅中毒者的脉搏与正常人不同。,第3节 两个正态总体的参数检验,1.两个正态总体的方差齐性检验(略),2.配对比较两个正态总体均数的检验(略),3.成组比较两个正态总体均数的检验(略),第4节 方差分析,在多组总体均数比较时如采用t检验会增大犯第一类错误概率。如三组之间的两两,t检验,三组之间的两两t检验做完三次t检验,总的显著性水平变为,1-(1-0.05),3,=0.14,要大于设定的=0.05。而方差分析是将三组数据放在一起做一次比较,犯,一类错误的概率仍为=0.05。,基本概念,试验指标,:衡量试验结果好坏的标准。,因素,:在试验过程中,影响试验结果的条件。,水平,:因素在试验中可能处的状态。,总体,1. N(1,,,1,2,),-,样本,1,(,n1,, ,,S1,),总体,2. N(2,,,2,2,),-,样本,2,(,n2,, ,,S2,),总体,3.,N(3,,,3,2,),-,样本,3,(,n3,, ,,S3,),已知:,1,2,=,2,2,=,3,2,,问:,1=2=3,?,总离差平方和(,SS,),,所有观察值之间的差异,组内离差平方和(,SSe,),,在因素的同一水平,(,同一个总体,),内,样本的各观察值之间的差异,组间利差平方和(,SS,A,),,在因素的不同水平,(,不同总体,),下,各水平的均值之间的差异,组间变异,(不同药物效应引起 + 随机误差引起),总变异,组内变异,(随机误差引起),如不同药物的作用相同(H0:均值相等),则:,F=组间变异/ 组内变异 =1,在H0条件下,F虽不会正好等于1 (抽样误差),但应当和1相差不大。,F越大,其概率越小,当F以致其对应的概率P0.05,则可认为不同药物的作用,是不相同的。即样本均数之间的差异有统计学意义。,方差分析的基本步骤,(1)提出假设,H0:三种药物对小白鼠镇咳作用相同,H1:,三种药物镇咳作用不完全相同,(2)确定检验水准,=0.05,(3)计算统计量,SSe的自由度为N-k,即40-3=37,组内方差Se,2,=SSe/(N-k),SS,A,的自由度为k-1,即3-1=2,组间方差S,A,2,=SS,A,/(k-1),统计量F=组间方差S,A,2,/组内方差Se,2,,将结果整理为,方差分析表,(4)确定P值,(5)作出推断结论,在=0.05水平上,拒绝H0,接受H1,认为三种药物平均推迟咳嗽时间不全相同。,方差齐是方差分析的前提条件之一,因此先进行,方差齐性检验(略),。,方差分析中如果拒绝HO,接受H1,仅能认为多个水平间均数不全相等,但是哪些,水平间差异显著,哪些不显著,方差分析不能作结论。因此需要进行,两两间多重,比较的检验法(略),。,两因素试验的方差分析不作要求。,第5节 离散型变量总体参数的假设检验,单个总体率的假设检验(略),两个总体率的假设检验(略),第6节 列联表中独立性检验,22列联表(四格表)中的独立性检验,原理及步骤,(1)建立假设,H0:两种药物治疗消化道溃疡的疗效相同,H1:两种药物治疗消化道溃疡的疗效不同,(2)确立检验水准 =0.05,(3)计算统计量,在H0成立的前提下, 假设1=2=PC(合计率),计算理论频数T,两种药物治疗消化道溃疡,4,周后疗效,处 理 愈合 未愈合 合计 愈合率,(%),洛赛克,64(E11) 21(E12) 85 75.29,雷尼替丁,51(E21) 33(E22) 84 60.71,合 计,115 54 169 68.05,合计愈合率=115/169,合计未愈合率=54/169,各个格子理论频数应为:,E11=85* 115/169,E12=85* 54/169,E21=84 * 115/169,E22=84* 54/169,统计学家Pearson提出对RC列联表使用统计量,它服从自由度为f的,2分布,其中f=(R-1)*(C-1)。,(4)确定P值。,2,0.05,1,=3.84,,得,P F,a,时,则拒绝,H0,,即认为,X,与,Y,之间有显著的线性关系。,第3节 预测与控制,建立了有统计学意义的回归方程以后,X变量=x0时,Y变量为a+bx0,这个值是估,计值,为提高可靠性,可以在进行区间估计,包括,预测,和,控制,(由,x,0,推算,y,0,称为预,测,由,y,0,推算,x,0,称为控制)。,(略),多元线性回归与非线性回归不做要求。,第4节 半数有效量(ED50)和半数致死量(LD50)估计,概率单位法(略),序贯法不做要求。,第6讲 正交试验设计,对于单因素或两因素试验,因其因素少,试验的设计、实施与分析比较简单。但,在实际工作中,常常需要同时考察,3,个或,3,个以上的试验因素,若进行全面试验,,则,试验的规模将很大,,往往因试验条件的限制而难于实施 。,正交试验设计就是,安排多因素试验 、寻求最优水平组合的一种高效率试验设计方法。,第1节 正交表与交互作用,基本原理,正交试验设计,是利用正交表来安排与分析多因素试验的一种设计方法。它是由试,验因素的全部水平组合中,挑选部分有代表性的水平组合进行试验的,通过对这,部分试验结果的分析了解全面试验的情况,找出最优的水平组合。,例如,,要考察乙醇浓度、溶剂用量和浸渍速度对姜黄素提取收率的影响。每个因,素设置3个水平进行试验 。,A因素是乙醇浓度,设A,1,、A,2,、A,3,3个水平;B是溶剂用量,设B,1,、B,2,、B,3,3个水,平;C因素为浸渍速度,设C,1,、C,2,、C,3,3个水平。这是一个3因素3水平的试验,各,因素的水平之间全部可能组合有27种 。,全面试验,:可以分析各因素的效应,交互作用,也可选出最优水平组合。但全面,试验包含的水平组合数较多,工作量大,在有些情况下无法完成 。,若试验的,主要目的是寻求最优水平组合,,则可利用正交表来设计安排试验。,正交试验设计的,基本特点,是:,用部分试验来代替全面试验,通过对部分试验结果,的分析,了解全面试验的情况。,本例,3个因素的选优区可以用一个立方体表示(图1),3个因素各取3个水平,,把立方体划分成27个格点,反映在图上就是立方体内的27个,“,.,”,。若27个网格点都,试验,就是全面试验,其试验方案如表1所示。,正交设计就是从选优区全面试验点(水平组合)中挑选出,有代表性的部分试验点,(水平组合)来进行试验。图1中标有试验号的九个,“,(,),”,,就是利用正交表,L,9,(3,4,),从27个试验点中挑选出来的9个试验点。即:,(1)A,1,B,1,C,1,(2)A,2,B,1,C,2,(3)A,3,B,1,C,3,(4)A,1,B,2,C,2,(5)A,2,B,2,C,3,(6)A,3,B,2,C,1,(7)A,1,B,3,C,3,(8)A,2,B,3,C,1,(9)A,3,B,3,C,2,上述选择 ,保证了A因素的每个水平与B因素、C因素的各个水平在试验中各搭配,一次 。从图1中可以看到,9个试验点在选优区中,分布是均衡的,,在立方体的每个,平面上,都恰是3个试验点;在立方体的每条线上也恰有一个试验点。,9个试验点均衡地分布于整个立方体内,有很强的代表性,能够比较全面地反映选,优区内的基本情况。,正交表,L,8,(2,7,),,其中,“,L,”,代表正交表,;L右下角的数字,“,8,”,表示有,8行,,用这张正交表安排试,验包含8个处理(水平组合) ;括号内的底数,“,2
展开阅读全文