统计学ppt课件-概率论基础

资源描述

经济计量学经济计量学概率论与统计学基础概率论与统计学基础(chp2chp5)经济计量学概率论与统计学基础12-2主要内容主要内容n概率论基础知识概率论基础知识n数理统计基础知识数理统计基础知识主要内容概率论基础知识2概率论部分概率论部分概率论部分32-4概率论基础知识主要内容概率论基础知识主要内容n概率概率n随机变量随机变量n概率密度函数概率密度函数n多维随机变量多维随机变量n随机变量的数字特征随机变量的数字特征n一些重要的概率分布一些重要的概率分布概率论基础知识主要内容概率42-5一、概率一、概率n随机试验随机试验可以在相同条件下重复进行可以在相同条件下重复进行每次试验的可能结果不止一个，但事先能明确每次试验的可能结果不止一个，但事先能明确所有的可能结果所有的可能结果进行一次试验之前不能确定会出现哪一个结果进行一次试验之前不能确定会出现哪一个结果n实例实例一枚硬币抛掷两次一枚硬币抛掷两次在校园里询问任意一个学生的年龄在校园里询问任意一个学生的年龄一、概率随机试验52-6n样本空间样本空间(sampling space)/总体总体(population)某一个随机试验的所有可能结果组成的集合，记某一个随机试验的所有可能结果组成的集合，记为为Sn样本点样本点(sampling point)样本空间里的某一元素，即随机试验的某一可能样本空间里的某一元素，即随机试验的某一可能结果结果n实例实例一枚硬币抛掷两次，出现正面记为一枚硬币抛掷两次，出现正面记为H，出现反面，出现反面记为记为Tn样本空间：样本空间：HH,HT,TH,TTn样本点：样本点：HH,HT,TH,TT样本空间(sampling space)/总体(popula62-7n事件事件(event)某一随机试验的样本空间的一个子集某一随机试验的样本空间的一个子集n实例：一枚硬币抛掷两次实例：一枚硬币抛掷两次事件事件A：出现两个正面：出现两个正面事件事件B：出现一个正面和一个反面：出现一个正面和一个反面事件事件C：出现两个反面：出现两个反面事件(event)72-8n频率频率(frequency)在相同条件下，某随机试验进行了在相同条件下，某随机试验进行了n次，其中次，其中事件事件A发生了发生了m次，则比值次，则比值m/n称为事件称为事件A发生发生的频率，记的频率，记fn(A)n实例：抛掷一枚硬币，事件实例：抛掷一枚硬币，事件A为出现正面为出现正面当当n逐渐增大时，频率趋向于某一常数，称为逐渐增大时，频率趋向于某一常数，称为频率稳定性频率稳定性n550500204840401200024000fn(A)0.60.540.4840.51810.50690.50160.5005频率(frequency)n550500204840401282-9n概率概率(probability)S是某一随机试验的样本空间，对于其中的任意是某一随机试验的样本空间，对于其中的任意一个事件一个事件A赋予一个实数赋予一个实数P(A)，如果，如果P(A)满足下满足下列三个条件，则称列三个条件，则称P(A)为事件为事件A的概率。的概率。1.0 P(A)12.P(S)=13.如果如果A1,A2,是两两不相容的事件，那么是两两不相容的事件，那么 P(A1+A2+)=P(A1)+P(A2)+n当当n趋近于无穷大时，频率趋近于无穷大时，频率fn(A)无限接近于概无限接近于概率率P(A)，从而用概率来度量事件，从而用概率来度量事件A在一次试验在一次试验中发生的可能性中发生的可能性概率(probability)92-10n条件概率条件概率(conditional probability)设设A、B是两个事件，且是两个事件，且P(A)0，称下式为事件，称下式为事件A发生的发生的条件下事件条件下事件B发生的条件概率：发生的条件概率：n实例实例一枚硬币抛掷两次，出现正面记为一枚硬币抛掷两次，出现正面记为H，出现反面，出现反面记为记为T。样本空间：。样本空间：HH,HT,TH,TT。事件事件A为为“至少有一次至少有一次H”，事件，事件B为为“两次都是两次都是同一面同一面”。则事件。则事件A的概率为的概率为3/4，事件，事件A和和B同同时发生的概率为时发生的概率为1/4，在，在A发生的条件下发生的条件下B发生的发生的概率为概率为1/3条件概率(conditional probability)102-11二、随机变量二、随机变量n随机变量随机变量(stochastic/random variable)一个变量若它的值是由随机试验决定的，称其为随机一个变量若它的值是由随机试验决定的，称其为随机变量。随机变量通常用大写字母变量。随机变量通常用大写字母X、Y、Z表示，其数值表示，其数值则用小写字母则用小写字母x、y、z表示表示n离散型随机变量离散型随机变量(discrete random variable)可能取到的值是有限个的随机变量可能取到的值是有限个的随机变量n例：离散型随机变量：扔一次骰子出现的点数；未出生婴儿的例：离散型随机变量：扔一次骰子出现的点数；未出生婴儿的性别性别n连续型随机变量连续型随机变量(continuous random variable)可能取到的值是无限个的随机变量可能取到的值是无限个的随机变量n例：人的身高；百米跑速度例：人的身高；百米跑速度二、随机变量随机变量(stochastic/random v112-12三、概率密度函数三、概率密度函数(probability density function，PDF/probability distribution)n离散型变量的概率函数离散型变量的概率函数/概率分布概率分布n实例实例X：投掷两颗骰子出现的点数之和，：投掷两颗骰子出现的点数之和，X的的PDF为：为：X23456789101112f(X)1/362/363/364/365/366/365/364/363/362/361/36三、概率密度函数(probability density f122-13n连续型变量的累积分布函数连续型变量的累积分布函数(cumulative distribution function，CDF)n实例实例枪靶的半径为枪靶的半径为2米，若每枪都能击中枪靶，且米，若每枪都能击中枪靶，且击中靶上任一同心圆内的点的概率与该圆的面击中靶上任一同心圆内的点的概率与该圆的面积成正比，则弹着点与靶心的距离积成正比，则弹着点与靶心的距离X是一个连是一个连续型随机变量，其续型随机变量，其CDF为：为：连续型变量的累积分布函数(cumulative distri132-14概率密度函数F(x)x21概率密度函数F(x)x21142-15概率密度函数连续型变量的概率密度函数连续型变量的概率密度函数(PDF)实例n在上例中，PDF为：xf(x)12概率密度函数连续型变量的概率密度函数(PDF)xf(x)12152-16PDF与与CDF关系关系概率密度函数概率密度函数(PDF)是是累积分布函数累积分布函数(CDF)的导的导数数,即即对于这一点进一步剖析对于这一点进一步剖析,可以得到：可以得到：这表明，这表明，f(x)不是不是X取值取值x的概率，而是它在的概率，而是它在x点点概率分布的密集程度。但是概率分布的密集程度。但是f(x)的大小能反映的大小能反映X在在x附近取值的概率大小。因此，对于连续型随机变量，附近取值的概率大小。因此，对于连续型随机变量，用密度函数描述它的分布比分布函数直观。用密度函数描述它的分布比分布函数直观。PDF与CDF关系概率密度函数(PDF)是累162-17概率密度函数概率密度函数n连续型变量的概率密度函数连续型变量的概率密度函数(PDF)f(x)xab概率密度函数连续型变量的概率密度函数(PDF)f(x)xab172-18多维随机变量多维随机变量n多维随机变量多维随机变量多个变量的取值由同一个随机试验决定，称这多个变量的取值由同一个随机试验决定，称这些变量为多维随机变量。些变量为多维随机变量。以下我们考虑最简单的二维随机变量，用以下我们考虑最简单的二维随机变量，用(X,Y)表示，其数值用表示，其数值用(x,y)表示表示n实例实例离散型二维随机变量：每一位学生的性别和民离散型二维随机变量：每一位学生的性别和民族族连续型二维随机变量：每一位学生的身高和体连续型二维随机变量：每一位学生的身高和体重重多维随机变量多维随机变量182-19多维随机变量离散型变量的联合概率密度函数离散型变量的联合概率密度函数(joint PDF)实例譬如：既是男生又是满族的概率为譬如：既是男生又是满族的概率为0.08，既是女生又是回族的，既是女生又是回族的概率为概率为0民族民族汉族汉族满族满族回族回族蒙古族蒙古族性别性别男男0.270.080.160女女0.350.1000.04多维随机变量离散型变量的联合概率密度函数(joint PDF192-20多维随机变量离散型变量的离散型变量的边缘概率密度函数边缘概率密度函数(marginal PDF)实例实例X(民族民族)边缘概边缘概率率汉族汉族满族满族回族回族蒙古族蒙古族Y(性别性别)男男0.270.080.1600.51女女0.350.1000.040.49边缘概率边缘概率0.620.180.160.04多维随机变量离散型变量的边缘概率密度函数(marginal202-21离散型变量的条件概率密度函数离散型变量的条件概率密度函数(conditional PDF)n表示在表示在Y=y的条件下的条件下X=x的概率的概率譬如：譬如：f(满族满族,女生女生)=0.10,f(女生女生)=0.49,f(满族满族|女生女生)=0.10/0.49=0.20 f(汉族汉族,男生男生)=0.27,f(男生男生)=0.51,f(汉族汉族|男生男生)=0.27/0.51=0.53X(民族民族)边缘概边缘概率率汉族汉族满族满族回族回族蒙古族蒙古族Y(性别性别)男男0.270.080.1600.51女女0.350.1000.040.49边缘概率边缘概率0.620.180.160.04离散型变量的条件概率密度函数(conditional PD212-22多维随机变量统计独立性统计独立性(statistically independence)n如果两个随机变量的联合如果两个随机变量的联合PDF等于它们边缘等于它们边缘PDF的乘的乘积，则称这两个变量是相互独立的（积，则称这两个变量是相互独立的（independent）。）。两个变量独立意味着其中一个变量的结果不会影响另两个变量独立意味着其中一个变量的结果不会影响另一个。一个。譬如：譬如：f(X=H,Y=H)=f(X=H)*f(Y=H)=1/2*1/2=1/4 实例：抛硬币实例：抛硬币X(第一次第一次)正面正面(H)反面反面(T)Y(第二次第二次)正面正面(H)1/41/4反面反面(T)1/41/4多维随机变量统计独立性(statistically ind222-23多维随机变量多维随机变量连续型变量的联合概率密度函数连续型变量的联合概率密度函数(joint PDF)连续型变量的边缘概率密度函数连续型变量的边缘概率密度函数(marginal PDF)统计独立性统计独立性(statistically independence)多维随机变量连续型变量的联合概率密度函数(joint PD232-24四、随机变量的数字特征四、随机变量的数字特征n以上讨论了随机变量的概率密度函数以上讨论了随机变量的概率密度函数PDF和累积分布函数和累积分布函数CDF，但在处理实际问题，但在处理实际问题时，往往不需要求出这些函数，而是只需时，往往不需要求出这些函数，而是只需要了解变量的某些特征值。要了解变量的某些特征值。n这些特征值包括三类：这些特征值包括三类：度量变量分布的度量变量分布的集中趋势集中趋势（central tendency）：数学期望或均值；中位数；众数）：数学期望或均值；中位数；众数度量变量分布的度量变量分布的离散性离散性（dispersion）：方差；）：方差；标准差标准差度量两个变量的度量两个变量的相关性相关性（correlation）：协方）：协方差；相关系数差；相关系数四、随机变量的数字特征以上讨论了随机变量的概率密度函数PDF242-25数学期望数学期望（expectation）或）或均值均值（mean）n离散型变量的期望：离散型变量的期望：n实例：扔两个骰子的点数之和实例：扔两个骰子的点数之和x23456789101112f(x)1/362/363/364/365/366/365/364/363/362/361/36数学期望（expectation）或均值（mean）x234252-26随机变量的数字特征随机变量的数字特征n连续型变量的期望：连续型变量的期望：n实例：实例：随机变量的数字特征连续型变量的期望：262-27随机变量的数字特征期望的性质：期望的性质：随机变量的数字特征期望的性质：272-28n随机变量的类型随机变量的类型定类变量（定类变量（nominal variable）：性别；民族）：性别；民族定序变量（定序变量（ordinal variable）：教育水平；收）：教育水平；收入等级入等级定距变量（定距变量（interval variable）：考试成绩；）：考试成绩；收入水平收入水平n一般地，不同类型的变量用不同的数学特一般地，不同类型的变量用不同的数学特征表示其集中趋势。定类变量用众数；定征表示其集中趋势。定类变量用众数；定序变量用中位数；定距变量用均值或中位序变量用中位数；定距变量用均值或中位数数随机变量的类型282-29随机变量的数字特征方差（方差（variance）n方差被定义为随机变量对其均值的期望距离，用于方差被定义为随机变量对其均值的期望距离，用于表示随机变量与其均值的偏离程度。方差较小说明表示随机变量与其均值的偏离程度。方差较小说明变量的分布比较集中，反之则说明变量的分布很分变量的分布比较集中，反之则说明变量的分布很分散散n方差的性质随机变量的数字特征方差（variance）292-30随机变量的数字特征实例：x23456789101112f(x)1/362/363/364/365/366/365/364/363/362/361/36随机变量的数字特征实例：x23456789101112f(x302-31随机变量的数字特征标准差（standard deviation）n方差的量纲与变量的量纲不同，为此引入与变量具有相同量纲的数字特征标准差，同样度量变量的离散程度n标准差的性质：随机变量的数字特征标准差（standard deviatio312-32随机变量的数字特征度量变量离散程度的其他常用指标还有：度量变量离散程度的其他常用指标还有：n极差极差/全距全距n极差率极差率n变异系数变异系数随机变量的数字特征度量变量离散程度的其他常用指标还有：322-33随机变量的数字特征协方差（协方差（covariance）n协方差度量两个随机变量的相关协方差度量两个随机变量的相关(correlation)程度程度n协方差大于协方差大于0表示两个变量正相关表示两个变量正相关(positively correlated)，即其中一个变量随着另一个变量的增大而，即其中一个变量随着另一个变量的增大而增大增大n协方差小于协方差小于0表示两个变量负相关（表示两个变量负相关（negatively correlated），即其中一个变量随着另一个变量的增大而），即其中一个变量随着另一个变量的增大而减小减小n协方差等于协方差等于0表示两个变量不相关（表示两个变量不相关（uncorrelated）随机变量的数字特征协方差（covariance）332-34n协方差的性质：若X和Y相互独立，则Cov(X,Y)=0Cov(aX,bY)=abCov(X,Y)|Cov(X,Y)|F (n1,n2)=,0 2.80)=0.05一些重要的概率分布FF(n1,n2)，如果F(n1,n260数量统计基础数量统计基础数量统计基础612-62数量统计基础的主要内容数量统计基础的主要内容n总体与样本总体与样本n参数估计参数估计点估计点估计区间估计区间估计n假设检验假设检验置信区间法置信区间法显著性检验法显著性检验法数量统计基础的主要内容总体与样本622-63总体与样本总体（总体（population）n研究对象的全体，记为研究对象的全体，记为X随机样本（随机样本（random sample）/样本样本（sample）n在相同条件下对总体在相同条件下对总体X进行进行n次重复的、独立的次重复的、独立的观测，每次观测结果都是与观测，每次观测结果都是与X具有相同分布的、具有相同分布的、相互独立的随机变量，记为相互独立的随机变量，记为X1,X2,Xn，把，把它们称为来自总体的一个简单随机样本，简称它们称为来自总体的一个简单随机样本，简称样本，称样本，称n为样本容量。当观测完成后，得到一为样本容量。当观测完成后，得到一组观测值组观测值x1,x2,xn，称为样本值。，称为样本值。总体与样本总体（population）632-64n我们感兴趣的实际上是总体，但由于不可我们感兴趣的实际上是总体，但由于不可能或很难得到总体的信息，只能从中抽取能或很难得到总体的信息，只能从中抽取一个样本，根据样本数据来推断总体的性一个样本，根据样本数据来推断总体的性质。这其中包含两类问题：质。这其中包含两类问题：参数估计参数估计和和假假设检验设检验我们感兴趣的实际上是总体，但由于不可能或很难得到总体的信息，642-65参数估计参数（参数（parameters）n与总体有关的数字特征。如总体均值、总体方差等与总体有关的数字特征。如总体均值、总体方差等等。等。参数估计（参数估计（parameter estimation）n根据样本的有关数值来估计总体参数或总体参数的根据样本的有关数值来估计总体参数或总体参数的范围范围点估计点估计区间估计区间估计参数估计参数（parameters）652-66n点估计（点估计（point estimation）X1,X2,Xn是来自总体是来自总体X的一个样本，的一个样本，x1,x2,xn是对应于该样本的样本值，是对应于该样本的样本值，是待估是待估参数。点估计问题就是根据样本构造一个函数参数。点估计问题就是根据样本构造一个函数，用它的观测值，用它的观测值来估计未知参数。来估计未知参数。前者称为估计量前者称为估计量(Estimator)，后者称为估计值，后者称为估计值(Estimate)，统称为估计，都简记为，统称为估计，都简记为。点估计（point estimation）662-67点估计点估计n估计量是样本的函数，对于不同的样本，估计量是样本的函数，对于不同的样本，参数估计值是不同的。参数估计值是不同的。n点估计的方法：点估计的方法：矩估计法矩估计法极大似然法极大似然法最小二乘法最小二乘法点估计估计量是样本的函数，对于不同的样本，参数估计值是不同的672-68点估计矩（矩（moment）矩估计法（矩估计法（method of moment）n用样本矩作为相应总体矩的估计量，并用样本矩用样本矩作为相应总体矩的估计量，并用样本矩的连续函数作为总体矩连续函数的估计量。通过的连续函数作为总体矩连续函数的估计量。通过这种方法得到的估计量称为矩估计量。这种方法得到的估计量称为矩估计量。点估计矩（moment）682-69点估计矩估计法：实例总体总体X的均值为的均值为，方差为，方差为 2，X1,X2,Xn是是来自来自X的一个样本，则可以用样本的的一个样本，则可以用样本的1阶原点阶原点矩估计总体均值，用样本矩估计总体均值，用样本2阶中心矩估计总体阶中心矩估计总体方差，即：方差，即：点估计矩估计法：实例总体X的均值为，方差为2，X1,X2692-70n极大似然法（极大似然法（method of maximum likelihood）设总体设总体X的的PDF为为P(X=x)=p(x,)，是待估参数，是待估参数，。设设X1,X2,Xn是来自是来自X的样本，那么的样本，那么X1,X2,Xn的联的联合合PDF，即事件，即事件(X1=x1,Xn=xn)发生的概率为：发生的概率为：L()称为样本的似然函数，所谓极大似然法，就是在称为样本的似然函数，所谓极大似然法，就是在可能的取值范围可能的取值范围内，找到令似然函数达到最大值的估内，找到令似然函数达到最大值的估计量计量。点估计极大似然法（method of maximum likeli702-71点估计n也就是说，要找到使实际观测数据出现的也就是说，要找到使实际观测数据出现的可能性最大的可能性最大的值。值。n具体解法是：具体解法是：点估计也就是说，要找到使实际观测数据出现的可能性最大的值。712-72点估计n极大似然法：实例点估计极大似然法：实例722-73点估计估计量的评选标准估计量的评选标准n估计量是随机变量，会由于估计方法的不同而不同，估计量是随机变量，会由于估计方法的不同而不同，那么，如何判断一个估计量的好坏呢？或者说应该那么，如何判断一个估计量的好坏呢？或者说应该选择哪个估计量更好呢？有以下几条标准：选择哪个估计量更好呢？有以下几条标准：针对小样本的标准针对小样本的标准a.无偏性无偏性b.有效性有效性c.针对大样本的标准针对大样本的标准d.一致性一致性e.渐进正态性渐进正态性点估计估计量的评选标准732-74点估计无偏性（无偏性（unbiasedness）实例求证：样本的求证：样本的k阶原点距是总体阶原点距是总体k阶原点距的无偏估计。阶原点距的无偏估计。特别地，样本的特别地，样本的1阶原点距是总体均值的无偏估计，即：阶原点距是总体均值的无偏估计，即：点估计无偏性（unbiasedness）求证：样本的k阶原点742-75求证：样本的求证：样本的2 2阶阶中心距中心距是总体方差的有偏估计。是总体方差的有偏估计。求证：样本的2阶中心距是总体方差的有偏估计。752-76点估计有效性（有效性（efficiency）n注意：一个无偏的估计量可能存在很大方差，而一注意：一个无偏的估计量可能存在很大方差，而一个方差很小的估计量可能是偏离总体均值的，因此个方差很小的估计量可能是偏离总体均值的，因此有效性综合考虑了估计量的有效性综合考虑了估计量的集中趋势集中趋势和和离散性离散性两个两个特征特征点估计有效性（efficiency）762-77点估计n实例：有效性和无偏性实例：有效性和无偏性总体总体X的均值为的均值为，方差为，方差为 2，X1,X2,Xn是是来自来自X的一个样本，则的一个样本，则E(X1)=，即，即X1是总体均是总体均值的无偏估计量。值的无偏估计量。由上可知，由上可知，即样本均值也是总体均值，即样本均值也是总体均值的无偏估计量。然而，的无偏估计量。然而，所以，所以，是比是比X更有效的估计量。更有效的估计量。点估计实例：有效性和无偏性总体X的均值为，方差为2，X1772-78点估计点估计n线性估计量（线性估计量（linear estimator）例如，对于样本均值来说，是一个线性估计量。例如，对于样本均值来说，是一个线性估计量。n最优线性无偏估计量（最优线性无偏估计量（best linear unbiased estimator,BLUE）点估计线性估计量（linear estimator）782-79点估计一致性（一致性（consistence）点估计一致性（consistence）792-80点估计概率极限（概率极限（probability limits）点估计概率极限（probability limits）802-81点估计一些重要的估计量：一些重要的估计量：点估计一些重要的估计量：812-82点估计n实例：为了解中国城市失业率，随机抽取了实例：为了解中国城市失业率，随机抽取了10座城座城市，得到如下样本。则我们可以用这市，得到如下样本。则我们可以用这10座城市的平座城市的平均失业率来估计中国城市的平均失业率均失业率来估计中国城市的平均失业率城市城市(i)12345678910失业率(xi)5.16.49.24.17.58.32.63.55.87.5点估计实例：为了解中国城市失业率，随机抽取了10座城市，得到822-83点估计渐进正态性（渐进正态性（asymptotic normality）n当样本容量无限增大时估计量趋向于正态分布当样本容量无限增大时估计量趋向于正态分布中心极限定理（中心极限定理（central limit theorem,CLT）n定理一（独立同分布的中心极限定理）：当样本容定理一（独立同分布的中心极限定理）：当样本容量无限增大时，任何总体的随机样本的均值趋近于量无限增大时，任何总体的随机样本的均值趋近于正态分布。正态分布。点估计渐进正态性（asymptotic normality）832-84点估计中心极限定理中心极限定理定理二：李雅普诺夫（定理二：李雅普诺夫（Liapunov）定理）定理若随机变量若随机变量X1,X2,Xn相互独立，其均值和方相互独立，其均值和方差分别为：差分别为：点估计中心极限定理842-85区间估计n对于一个未知参数，除了估计其近似值（点估计）对于一个未知参数，除了估计其近似值（点估计）外，还希望知道这个值的精确程度，从而引出外，还希望知道这个值的精确程度，从而引出区间区间估计（估计（interval estimation）问题问题置信区间（置信区间（confidence interval）区间估计对于一个未知参数，除了估计其近似值（点估计）外，还希852-86区间估计n正态总体均值的区间估计：总体方差已知区间估计正态总体均值的区间估计：总体方差已知862-87区间估计n实例：总体方差已知时正态总体均值的区间估计区间估计实例：总体方差已知时正态总体均值的区间估计872-88区间估计n正态总体均值的区间估计：总体方差未知区间估计正态总体均值的区间估计：总体方差未知882-89区间估计n标准误（标准误（standard error），而，而S是是的点估计，的点估计，所以所以是是的点估计。的点估计。定义定义为为的标准误，的标准误，这样，总体均值的这样，总体均值的1-置信区间为：置信区间为：区间估计标准误（standard error）892-90区间估计n正态总体均值的区间估计：95%置信区间的简单法则区间估计正态总体均值的区间估计：95%置信区间的简单法则902-91n非正态非正态总体均值的区间估计总体均值的区间估计对于非正态总体，中心极限定理保证了当对于非正态总体，中心极限定理保证了当n时，任何分布的样本均值都接近于正态分布。时，任何分布的样本均值都接近于正态分布。因此，无论总体是否为正态分布，一个近似的因此，无论总体是否为正态分布，一个近似的95%的置信区间为：的置信区间为：非正态总体均值的区间估计912-92假设检验假设检验（假设检验（hypothesis testing）n在总体的在总体的PDF未知或某些参数未知的情况下，对总体未知或某些参数未知的情况下，对总体的的分布或参数分布或参数提出某些假设，然后根据样本对提出的提出某些假设，然后根据样本对提出的假设作出是拒绝还是接受的判断。假设作出是拒绝还是接受的判断。假设检验假设检验（hypothesis testing）922-93n实例：实例：Bush和和Kerry竞选总统，竞选总统，Bush获得获得42%的选的选票而票而Kerry获得获得58%的选票。的选票。Bush怀疑大选中怀疑大选中有作弊行为，雇佣一个咨询机构随机抽取有作弊行为，雇佣一个咨询机构随机抽取100个选民调查其选举意愿，发现有个选民调查其选举意愿，发现有53人支持他，人支持他，47人支持人支持Kerry。由此。由此Bush提出两个假设：提出两个假设：H0(虚拟假设虚拟假设/原假设，原假设，null hypothesis)：v 0.42（没有作弊）（没有作弊）H1(对立假设对立假设/备择假设，备择假设，alternative hypothesis)：v0.42（有作弊）（有作弊）实例：932-94n第第类错误（类错误（type error）拒真错误拒真错误n第第类错误（类错误（type error）取伪错误取伪错误真实情况真实情况H H0 0真真H H0 0假假检验检验结果结果拒绝拒绝类错误类错误无错无错不拒绝不拒绝无错无错类错误类错误第类错误（type error）真实情况H0真H0假检942-95n理论上我们希望犯两类错误的概率都尽可理论上我们希望犯两类错误的概率都尽可能小，但事实上不可能同时最小化两类错能小，但事实上不可能同时最小化两类错误。为此，我们首先考虑减少犯第误。为此，我们首先考虑减少犯第类错类错误的概率，并规定了一个可容忍的犯第误的概率，并规定了一个可容忍的犯第类错误的概率类错误的概率（譬如（譬如0.05,0.01），称为），称为显著性水平显著性水平（level of significance）。）。理论上我们希望犯两类错误的概率都尽可能小，但事实上不可能同时952-96n在选定了显著性水平之后，再考虑把犯第在选定了显著性水平之后，再考虑把犯第类错误的概率减到最小。并把不犯第类错误的概率减到最小。并把不犯第类类错误的概率错误的概率 1-称为称为检验的功效检验的功效（power of the test）。但一般来说我们不考虑检验的功。但一般来说我们不考虑检验的功效。效。在选定了显著性水平之后，再考虑把犯第类错误的概率减到最小962-97假设检验假设检验的两种方法假设检验的两种方法n置信区间法置信区间法n显著性检验法显著性检验法n假设检验的目的不是估计参数，而是对有关参数假设检验的目的不是估计参数，而是对有关参数的假设做出检验，拒绝或不拒绝提出的假设的假设做出检验，拒绝或不拒绝提出的假设假设检验假设检验的两种方法972-98置信区间法置信区间法 982-99置信区间法由于由于680不在上述区间内，因此可以不在上述区间内，因此可以95%的概的概率拒绝总体均值等于率拒绝总体均值等于680的假设。的假设。例：随机变量例：随机变量X1,Xn是是X的样本，的样本，XN(,2)，已知：，已知：的的95%的置信区间为：的置信区间为：置信区间法由于680不在上述区间内，因此可以95%的概率拒绝992-100显著性检验法基本思想显著性检验法基本思想1002-101显著性检验法拒绝域（拒绝域（region of rejection）拒绝原假设的检验统计量的值域（取值范围）称为拒绝域；拒绝原假设的检验统计量的值域（取值范围）称为拒绝域；拒绝域的边界点称为拒绝域的边界点称为临界值（临界值（critical value）1.96-1.9602.5%2.5%2.57-2.570.5%0.5%显著性检验法拒绝域（region of rejection）1012-102显著性检验法n实例：显著性检验法实例：1022-103显著性检验法n双边检验双边检验（Two-tailed test）n单边检验单边检验（One-tailed test）随机变量随机变量X1,Xn是是X的样本，的样本，XN(，2)，2已知。已知。（1）右侧检验：）右侧检验：H0:=*;H1:*。H0的拒绝域为：的拒绝域为：z z （2）左侧检验：）左侧检验：H0:=*;H1:*。H0的拒绝域为：的拒绝域为：z -z 显著性检验法双边检验（Two-tailed test）1032-104显著性检验法n正态总体的均值检验和方差检验原假设H0检验统计量 H0为真时统计量服从的分布对立假设H1拒绝域N(0,1)t(n-1)显著性检验法正态总体的均值检验和方差检验原假设H0检验统计量1042-105显著性检验法非正态总体的渐进检验非正态总体的渐进检验显著性检验法非正态总体的渐进检验1052-106显著性检验法p值值/精确显著性水平精确显著性水平(p value or exact level of significance)根据样本计算出检验统计量的值后，精确地计算出在多大根据样本计算出检验统计量的值后，精确地计算出在多大的显著性水平上可以拒绝原假设，称为的显著性水平上可以拒绝原假设，称为p值。值。对于对于H0:=*;H1:*(2未知未知)检验统计量为：检验统计量为：若根据样本计算出若根据样本计算出T的观测值为的观测值为t，则，则p=P(|T|t|)例如，若例如，若t=2.75,n=31，则要求：，则要求：查表可知查表可知=0.01，故，故p=0.01，即，拒绝原假设的最低显著，即，拒绝原假设的最低显著性水平是性水平是0.01。显著性检验法p值/精确显著性水平(p value or ex106

展开阅读全文

统计学ppt课件-概率论基础

最新文档