资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第七章 试验资料的统计推断,统计学的目的不只是为了研究样本,而是要通过样本的结果来推断其所属总体的特征,即统计推断问题。统计推断就是根据抽样分布律和概率理论,由样本结果统计数对总体特征参数进行推论。试验所获得的资料通常是样本资料,而我们的目的是希望知道样本所属总体的情况。因此,统计推断是科研工作中的一个十分重要的工具。,统计推断的根本内容有两个方面:,1统计假设测验;2参数估计。,第一节 概率的根本知识,假定在同一组条件下重复进行同一类试验或调查,随机事件A的频率a/n 在试验或调查的次数n逐渐增大时,将稳定地在某一数值P附近摆动,而且当n愈增大时这种摆动的幅度愈变愈小频率的稳定性,那么定义随机事件A的概率为P,并记为:,PA=P,在通常情况下,由于P是一个理论值,实际中P不可能准确获得的,所以人们常用n充分大时事件A的频率作为该事件概率P的近似值,即,PA=P(a/n),而且:0 P(A)1,随机事件的概率表现了事件的客观统计规律,反映事件在一次试验中发生的可能性大小。P(A)愈大,事件A就愈容易发生。如P(A)=1,那么,事件A是必然事件;,相反,P(A)愈小,事件A就愈不容易发生,当P(A)=0时,表示事件A根本不可能发生,成为不可能事件。假设事件A发生的概率很小,表示事件A在一次试验中出现的可能性很小,以至实际上不可能出现,这称为“小概率事件实际不可能性原理。概率论的这一原理是统计假设性测验的根本原理。在生物统计上,常把事件发生的概率小于5%叫做小概率事件。,概率计算法那么:,1.假设事件A与事件B是互斥事件,其概率分别为P(A)和P(B),那么事件A与B的和事件的概率等于事件A的概率与事件B的概率之和,即:P(A+B)=P(A)+P(B),假设事件A的概率为P(A),那么其对立事件B的概率为:,P(B)=1-P(A),假设事件A1、A2、A3、An构成试验的完全事件系,那么:,PA1+A2+A3+An=1,2.假设事件A和事件B相互独立,那么事件A和事件B同时发生或相继发生的事件概率等于两个独立事件概率的乘积,即:,PAB=PAPB,概率的乘法定理可扩及到多个独立事件的运算。,第二节 理论概率分布,一、二项分布 binomial distribution,一二项总体,在试验中,有些总体的每个个体的某种性状,只能发生非此即彼的两种结果用0,1表示,这种由非此即彼事件构成的总体称为二项总体,又称为0、1总体。,统计上习惯将二项总体中变量“1 的概率用p表示;变量“0 的概率用q表示。显然,P+q=1。,二项总体的参数:=p 2=pq,(二)二项分布,1.二项分布:是一种最重要的非连续性随机变数的概率分布。假设从二项总体中独立抽取n个个体,把这n个个体作为一个样本,那么可以抽得n+1个样本,将每一样本的n个观察值加起来得到样本总和数,那么这n+1个样本的总和数就构成了样本总和数总体,样本总和数总体的概率分布就叫二项概率分布,简称二项分布。,二项分布中任何一项概率的通式为:,P(x=K)=Cnk pk qn-k,显然有:Cnk pk qn-k=p+q)n=1,2.二项分布的形状与参数,二项分布的参数为:,=np 2=npq,二项分布的图形形状取决于n和p。假设变数x服从二项分布,可记为:xBn,p,二项分布的形状:,当p=q时,无论n大小。图形左右对称。,2.当pq、n一定时,图形偏斜,且p、q相差越大越偏斜。,3.当p与q为一定值,尽管二者相差较大,但随着n的增大而偏斜度相应减小,且逐渐接近于左右对称;当n 适当大n30,且np和nq都不小于5时,二项分布趋近于正态分布;当n、p不过小时,二项分布即成为正态分布。,二、正态分布normal distribution,正态分布特性,f(x)=,1是连续性分布,以x=为对称轴左右对称分布。在平均数的左方或右方,只要距离相等,其f(x)就相等。,2正态分布曲线有一个顶峰,曲线以x轴为渐近线,随机变数x的取值范围为-,+。,3正态曲线是一个曲线系统,由和两个参数来确定的,其中确定曲线在x轴上的位置,确定它的变异程度,故记作:N(,2)。,4正态分布与x轴之间的面积表示所研究总体的全部变量出现的概率密度总和,等于1。,常用的理论面积或概率如下:,区间,1,面积或概率=0.6826,2,=0.9545,3,=0.9973,1.96,=0.9500,2.58,=0.9900,2.正态分布概率计算,将一般正态分布转换成标准正态分布的过程就是将x变数转换成u变数:,u=,标准正态离差:u=,从一般正态分布N(,2)到标准正态分布,N0,1,可简化处理步骤,而不改变正态分布的根本性质。因此在求一般正态分布的概率时,只要将其转换成u值,然后查表即可。,三、普松分布poisson distribution),当n、p0时,二项分布可导出普松分布。计算其任一变量的概率为:,Px=K=,普松分布仅具参数=np,可记作:,P ,且有:=2=的特征。,普松分布通常是极偏斜状分布,此分布主要用于描述小概率事件,并且事件应是独立的。,一般当二项分布在p,0.1和 np,0 或 0,测验的否认区域位于正态分布右尾。,2.0:0,对 A:0,其否认区域位于正态分布的左尾。,以上将否认区仅选在一尾的测验,叫一尾或单尾测验。,一般而言,如果凭借一定的知识和经验,推测,应当或可能是,0,的,为测验,是否显著,0,,我们的假设应是:,0,:,0,,对,A,:,0,的,我们的假设应是:,0,:,0,,对,A,:,0,第五节 平均数的假设测验,一、单个平均数的假设测验,指测验某个样本平均数 的总体平均数与某一总体平均数0 之间的差异是否显著。,:=0 A:0,总体的标准差一般为未知的,可由样本方差去估计总体方差,如果样本为大样本n30 可以直接进行u测验;如果样本为小样本n30,那么要进行t测验。,u或t=,进行t检验时,依据自由度为df=n-1查临界t值t。,二、两个样本平均数的统计假设测验,指测验两个样本所属总体的平均数 1和间有无显著性差异。,H0:1=2 A:12,测验的方法随试验设计的不同而有差异,可分为成组数据和成对数据的比较两大类。,一 成组数据,两个处理间的各供试单位彼此独立,其观察值之间无一一对应关系,即为成组数据。其测验又依两样本所属总体的方差 和 是否和样本容量的大小不同,测验方法也不同。,1.在两个样本所属正态总体的方差和 时,用 u 测验。,总体的方差往往是未知的,如果两个样本均为大样本n130,n230,可以用两个样本均方估计其总体的方差:,两个样本所属总体方差未知,且又为小样本时,可以假定两个样本所属总体方差相等,即 =,为了增加误差估计的精确度,将两个样本均方乘以各自的自由度之和,再除以两个样本自由度之和,得到两个样本均方的加权平均数作为总体方差,2,的估计值。,成组数据可以n1=n2,也可以n1n2,假设 为一定,那么在 时,为最小,所以在设计时,最好使各平均数的n相等,以减小误差。,二 成对数据,两个处理间的各供试单位彼此存在一一对应关系,即为成对数据,显然成对数据必然有:n1=n2。,=,t=,依据自由度为df=n-1查临界t值t,。,第六节 参数的区间估计,参数估计是指由样本结果对总体参数作出估计点估计和区间估计。点估计是以统计数估计相应参数,因未考虑误差,所以对总体估计是有一定偏误的,故可用区间估计进行参数估计。,区间估计是指:根据统计数的概率分布,给出一个区间,使总体参数在此区间的概率为1-,即:,一、总体平均数的区间估计,区间估计和显著性测验的结果有着必然的联系。假设参数的1-置信区间内包括H0,那么必在水平上接受H0;如置信区间内不包括H0,那么必在水平上否认H0。,二、总体平均数差数的区间估计,对于按u分布的资料,置信限:,对于按t分布的资料,置信限:,对于成对资料,置信限:,本章结束,
展开阅读全文