概率与数理统计基础.ppt

资源描述

计量经济学数学基础概率论与数理统计概率论与数理统计是研究和揭示随机现象统计规律性的数学分支主要包括随机事件和概率随机变量的分布和数字特征中心极限定理和大数定理抽样分布统计估计假设检验回归分析等主要内容 1 基本概念2 对总体的描述随机变量的数字特征3 对样本的描述样本分布的数字特征4 随机变量的分布5 通过样本估计总体估计量的特征6 通过样本估计总体估计方法7 通过样本估计总体假设检验第一节基本概念总体和个体样本和样本容量随机变量统计量 1 1总体个体样本和样本容量研究对象的全体称为总体或母体通常指研究对象的某项数量指标组成总体的每个基本单位称为个体从总体X中抽出若干个个体称为样本一般记为 X1 X2 Xn n称为样本容量而对这n个个体的一次具体的观察结果 x1 x2 xn 是完全确定的一组数值但它又随着每次抽样观察而改变 x1 x2 xn 称为样本观察值注意抽样是按随机原则选取的即总体中每个个体有同样的机会被选入样本当人们在一定条件下对某一现象加以观察时观察到的结果是多个可能结果中的某一个且在每次观察前都无法预知观测结果到底是哪一个即结果的出现呈现出偶然性但是所有可能出现的结果是知道的随机现象具有偶然性一面也有必然性一面偶然性一面表现在对随机现象做一次观测时观测结果具有偶然性不可预知性必然性一面表现在对随机现象进行大量重复观测观测结果有一定的规律性亦即统计规律性具有不确定性或随机性偶然性的现象称为随机现象特点随机现象定义随机试验举例 E1 掷一颗骰子观察所掷的点数是几 E2 观察某城市某个月内交通事故发生的次数 E3 对某只灯泡做试验观察其使用寿命 E4 对某只灯泡做试验观察其使用寿命是否小于200小时在实际问题中随机试验的结果可以用数量来表示由此就产生了随机变量的概念有些试验结果本身与数值有关本身就是一个数例如掷一颗骰子面上出现的点数七月份济南的最高温度每天从济南下火车的人数昆虫的产卵数它随试验结果的不同而取不同的值因而在试验之前只知道它可能取值的范围而不能预先肯定它将取哪个值由于试验结果的出现具有一定的概率于是这种实值函数取每个值和每个确定范围内的值也有一定的概率 1 2随机变量根据概率不同而取不同数值的变量称为随机变量一个随机变量具有这样的特性可以取许多不同的数值取每一个数值都有相应的概率p 0 p 1 总体随机变量样本间的联系样本就是一个随机变量所谓样本容量为n的样本就是n个相互独立且与总体有相同分布的随机变量X1 X2 Xn每一次具体抽样所得的数据就是n元随机变量的一个观察值记为X1 X2 Xn样本是总体的一部分总体一般是未知的一般要通过样本才能部分地推知总体的情况 1 3统计量由样本值去推断总体情况需要对样本值进行加工这就要构造一些样本的函数它把样本中所含的某一方面的信息集中起来设 x1 x2 xn 为一组样本观察值函数y f x1 x2 xn 若不含有未知参数这种不含任何未知参数的样本的函数称为统计量它是完全由样本决定的量统计量既然是依赖于样本的而后者又是随机变量故统计量也是随机变量几个常见统计量样本均值样本方差第二节对总体的描述随机变量的数字特征 2 1数学期望2 2方差2 3协方差 2 1 1数学期望实际上就是一个加权平均值描述随机变量的集中程度数学期望描述随机变量总体的一般水平定义1离散型随机变量数学期望的定义假定有一个离散型随机变量X有n个不同的可能取值x1 x2 xn 而p1 p2 pn是X取这些值相应的概率则这个随机变量X的数学期望定义如下定义2连续型随机变量数学期望的定义 2 1 2数学期望的性质 1 如果a b为常数则E aX b aE X b 2 如果X Y为两个随机变量则E X Y E X E Y 3 如果g x 和f x 分别为X的两个函数则E g X f X E g X E f X 4 如果X Y是两个独立的随机变量则E X Y E X E Y 2 2 1方差的定义离均差的定义若随机变量X的数学期望E X 存在称 X E X 为随机变量X的离均差方差的定义离均差的平方的数学期望设X是随机变量若E X EX 2 存在则称E X EX 2 为随机变量X的方差记为D X 或Var X 即D X E X EX 2 方差的算术平方根称为随机变量X的均方差或标准差 2 2 2方差的意义离均差和方差都是用来描述随机变量离散程度的即描述x对于它的数学期望的偏离程度这种偏差越大表明变量的取值越分散一般情况下常用方差来描述离散程度因为离均差的和为零无法体现随机变量的总离散程度事实上正偏差大或负偏差大同样是离散程度大方差中由于有了平方从而消除了正负号的影响并易于加总也易于强调大的偏离程度的突出作用 2 2 3方差的性质 1 Var c 0 2 Var c x Var x 3 Var cx c2Var x 4 Var x y Var x Var y 2cov x y Var x y Var x Var y 2cov x y 5 Var a bx b2Var x 6 a b为常数 x y为两个相互独立的随机变量则Var ax by a2Var x b2Var y 7 Var x E x2 E x 2 2 3协方差Cov X Y E X EX Y EY Cov X Y E XY E X E Y 积的期望减期望的积第三节对样本的描述样本分布的数字特征样本均值反映样本集中程度样本方差样本标准差描述样本离散程度第四节随机变量的分布 4 1正态分布4 2t分布4 3卡方分布4 4F分布 4 1正态分布正态分布图形标准正态分布根据以上定理可以将任何一个正态分布化为标准正态分布即将其标准化标准正态分布图形标准正态分布的分位数临界值在实际问题中常取0 1 0 05 0 01 z0 05 1 645z0 01 2 326z0 01 2 2 575z0 05 2 1 96 4 2t分布定理1 若X N 0 1 Y 2 n X与Y独立则定理2 设 X1 X2 Xn 是正态总体N 2 的简单随机样本则性质 1 f x 关于x 0 纵轴对称 2 f x 的极限为N 0 1 的密度函数即当n较大时 t分布近似于标准正态分布若随机变量X的概率密度为那么称X服从自由度为n的分布记作 4 3分布 2分布的密度函数的图形如右图应用中心极限定理可得的分布近似正态分布N 0 1 则可以求得 E X n Var X 2n 若若X1 X2 Xn相互独立且Xi N 0 1 则性质1 性质2 则称X服从自由度为n1和n2的F分布 n1称第一自由度 n2称第二自由度定义若随机变量X的密度函数为 4 4F分布定理1若X 2 n1 Y 2 n2 X Y独立则定理2 设 X1 X2 Xn1 是N 1 12 的样本 Y1 Y2 Yn2 是N 2 22 的样本且相互独立 S12 S22是样本方差则分位数问题第五节通过样本估计总体一估计量的特征 5 1无偏性5 2有效性5 3一致性所谓估计量的特性指的是衡量一个统计量用以估计总体参数的好坏标准 5 1无偏性估计量的观察或试验的结果估计值可能较真实的参数值偏大或偏小而一个好的估计量不应总是偏大或偏小在多次试验中所得的估计量的平均值应与真实参数吻合这就是无偏性所要求的是一个随机变量对一次具体定义是的一个估计量如果则称是的一个无偏估计如果不是无偏的就称该估计是有偏的称为的偏差 5 2有效性最小方差性最优性总体某个参数的无偏估计量往往不只一个而且无偏性仅仅表明的所有可能的取值按概率平均均值等于它的可能取值可能大部分与相差很大为保证的取值能集中于附近必须要求的方差越小越好所以提出有效性标准有效性最小方差性最优性定义对于参数的无偏估计量其取值应在真值附近波动我们希望它与真值之间的偏差越小越好定义设均为未知参数的无偏估计量若则称比有效在的所有无偏估计量中若估计量则称是具有最小方差的无偏显然也是最有效的无偏估计量简称有效估计量为最小方差无偏估计量无偏有效估计量的意义一个无偏有效估计量的取值在可能范围内最密集于真值附近换言之它以最大的概率保证估计量的取值在真值附近摆动第六节通过样本估计总体二估计方法点估计普通最小二乘法所谓点估计就是给出被估计参数的一个特定的估计值区间估计区间估计的概念所谓区间估计就是以一定的可靠性给出被估计参数的一个可能的取值范围具体做法是找出两个统计量与使称为置信区间称为置信系数置信度称为冒险率测不准的概率一般取5 或1 对区间估计的形象比喻我们经常说某甲的成绩大概80分左右可以看成一个区间估计问题某甲的成绩为被估计的参数下限上限大概80分左右置信系数大概准确的程度冒险率显著性水平区间估计的步骤找一个含有该参数的统计量构造一个概率为的事件通过该事件的概率解出该参数的区间估计关于区间估计的说明在进行区间估计时应针对不同的情况采用不同的方法例如分清分布的形式是已知还是未知是大样本还是小样本小样本又得分清是已知方差还是未知方差充分利用分布信息可以得到较精确的估计一般地越大置信度越低反之则反第六节通过样本估计总体三假设检验 1 假设检验的定义设总体X的分布函数F x 的形式已知但是其中的参数未知现在对参数提出假设然后利用样本值对这个假设作出检验判断其真伪这就是参数的假设检验设总体X的分布函数形式未知现在假设它的分布函数为某个指定函数然后利用样本信息进行检验判断其真伪这就是非参数的假设检验一般研究参数的假设检验问题 2 原假设与备择假设原假设是我们进行统计假设检验欲确定其是否成立的假设体现进行假设检验的目的而且往往是希望否定这个假设一般用H0表示备择假设是原假设的对立面统计假设检验是二择一的判断当原假设不成立时不得不接受它一般用H1表示 3 显著性水平显著性水平可以理解为事件显著不可能发生的水平可以理解为原假设的数值与真实值显著差异大小的水平是小概率事件是指犯第一类错误原假设的可能性一般取值很小 0 1 0 05 0 01 0 005 4 基本思想小概率原理数理统计学中的小概率原理认为概率很小的事件在一次抽样试验中几乎是不可能发生的小概率事件的构造找到在原假设成立的条件下统计量的分布特征然后根据分位数可以构造一个小概率事件如后面的图示如果小概率事件发生了说明出错了那么错在那里呢因为在整个假设检验过程中抽样是正确的统计量的选择是正确的根据显著水平确定的临界值是正确的统计量的计算是正确的统计量与临界值的比较也是正确的因而只能是原假设发生了错误所以必须拒绝H0 思想在假设检验中首先提出原假设备择假设然后构造一个小概率事件把求得的统计量与查表得到的临界值比较看看小概率事件是不是发生如果发生拒绝原假设否则接受 5 两类错误的概念由于我们是用样本推断总体因而假设检验的结果不可能绝对正确它有可能是错误的错误有两类第一类弃真原假设符合实际情况而检验结果把它否定了第二类纳伪原假设不符合实际情况而检验结果却把它肯定下来 6 假设检验的步骤 1 提出原假设和备择假设H0 0H1 02 根据原假设找到统计量的分布构造小概率事件 3 根据抽样所得样本计算检验统计量4 确定显著性水平和相应的临界值5 将计算的统计量与临界值进行比较看看小概率事件是不是发生如果发生拒绝原假设否则接受

展开阅读全文