第二章 统计学基础回顾

上传人:痛*** 文档编号:244202777 上传时间:2024-10-03 格式:PPT 页数:31 大小:599KB
返回 下载 相关 举报
第二章 统计学基础回顾_第1页
第1页 / 共31页
第二章 统计学基础回顾_第2页
第2页 / 共31页
第二章 统计学基础回顾_第3页
第3页 / 共31页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第二章 统计学基础回顾,2.1,统计数据的整理与描述,2.2,几种重要的概率分布,2.3,多元分布的基本概念,2.4,多元正态分布,2.5,参数估计,2.6,假设检验,思考与练习,2.1,统计数据的整理与描述,统计学是研究数据的方法论学科,统计数据是统计学研究的主要内容。借助统计学方法研究任何实际问题,首先要做的工作是收集数据。收集数据的一般方法是查阅各种统计年鉴和报表,再就是运用某种调查方法获取研究问题的有关数据。抽样调查获取数据的方式在我国方兴未艾。对抽样方法及其应注意的问题有兴趣者可参阅参考文献,5,和,6,。,一、总体与样本,1.,总体:,在一个统计问题中,通常把所要调查研究的事物及现象的全体称为总体。,2.,个体:,把组成总体的每个元素(成员)称为个体。,3.,总体的容量:,一个总体中所含的个体的数量称为总体的容量。,例如:要研究某城市居民的家庭收入状况,那么这个城市所有家庭的收入状况是研究的总体,而每个家庭的收入状况就是个体。,4.,抽样:,为了推断总体的某些特征,需要从总体中按一定的抽样技术抽取若干个体,将这一抽取过程称为抽样。,5.,样本:,所抽取的部分个体称为样本。,6.,样本容量:,样本中所含个体的数量称为样本容量。,例如:研究居民家庭收入时,随机抽取,1000,户来进行调查,这,1000,户就是,一个样本,,,样本容量,就是,1000.,二、统计量,通过抽样或查统计年鉴得到的原始数据,一般是杂乱无章的,很难从中直接看出有价值的东西。因此,需要对原始数据进行整理。画原始数据的散点图、饼图、直方图等方法是直观表达数据的常见方式。统计学中最主要的提取信息方式就是对原始数据进行一定的运算,以算出某些代表性的数字。,用以反映出数据某些方面的特征,这种数字被称为统计量。用统计学语言表述就是:,统计量是样本的函数,它不依赖任何未知参数。,均值和方差是最常用的统计量。,均值是对数据集中特征的描述,方差是对数据波动特征的描述。,设是 一组独立的随机样本,则,样本均值,为:,样本方差,为:,样本标准差,为,:,例如:有两组数据,(,4,,,6,,,8,,,10,,,12,),(,6,,,7,,,8,,,9,,,10,),它们的均值 都是,8,,说明两组数据都是以,8,为中心。计算可知,第一组数据的方差比第二组的要大,说明第一组数据相对均值,8,来说比较分散,而第二组数据相对均值,8,来说比较集中。,需要注意的是:方差带单位没有意义,标准差带上单位才有实际意义。,三、变异系数,如果两组数据的计量单位相同,且均值一样,可以利用标准差来比较两组数据的离散程度。但是,两组数据的计量单位不同或均值不同时,就不能直接比较两组数据的标准差来分析两组数据的离散程度。,由此引入变异系数,V,:,例如:两组数据(,4,,,5,,,6,,,7,,,8,)与(,40,,,50,,,60,,,70,,,80,)的标准差分别是,1.58,和,15.8,,如果仅从标准差来看显然第二组数据分散程度较大。但是由于两组数据的均值不同,分别为,6,和,60,,单纯由标准差来判断数据的分散程度就不合适。,当我们计算出两组数据的变异系数时,得到,V,都是,0.26.,比较而言,两组数据的分散程度就是相同的了。,四、偏度与峭度,偏度和峭度是描述统计数据分布偏斜程度的统计量。,偏度用偏度系数,V,1,来描述:,式中,,S,为样本标准差。,偏度系数,V1,的意义由图,2-1,可表示出来。,V,1,=0,V10,V13,V22,时,T,分布的图形是对称的,见,P22,图,2-7,。当,n30,时,,t,分布的分散程度比标准正态分布大,密度函数曲线比较平缓,随着,n,的增大,,t,分布逐渐逼近标准正态分布。当 时,,t,分布渐近标准正态分布。,T,分布可用于方差未知时对有关均值的假设进行的检验。关于回归系数的显著性检验就用到,t,分布。,四、,F,分布,设随机变量 ,且,X,与,Y,相互独立,则称随机变量,遵从自由度为 的,F,分布,记作,F,分布的形状为正偏态分布状,但随着 的增大,其概率密度曲线的偏斜度虽然有所减缓却仍保持偏态分布,并不以正态分布为其极限分布形式。,如果 ,则 ;,如果 ,则 。,五、自由度,自由度是统计学中一个经常见到的重要概念。,所谓自由度就是指可以自由取值的数据个数,或者指不受任何约束,可以自由变动的变两个数。,还有另一种解释:即一共有,n,个样本,有,n,个自由度。,例如:的表达式 为,n,个量的平方和,而自由度为,n-1,。这是因为 这,n,个量并不能 自由变化,受到 的约束,这使得自由度少了一个。,用矩阵秩的概念也可以解释自由度。自由度是对随机变量的二次型而言的,自由度就是二次型矩阵的秩。但用矩阵的秩判断统计量比较困难,一般采用直观的方法。有线性代数的知识可知,一个二次型的秩为它所含变量个数减去变量间独立线性约束条件的个数,从而可以得到统计量的自由度。,例如:前面关于样本方差 的自由度,就是因,为 含有,n,个变量,但,n,个变量有一个线性,约束条件 ,故 的自由度为,n-1,。,2.3,多元分布的基本概念,在研究社会、经济现象和许多实际问题时,经常会遇到的是多指标的问题。这时如果只研究某个指标或是将这些指标分裂开来分别研究,都不能从整体上把握所研究问题的实质。下面我们介绍多元分布的基本概念。,一、随机变量,我们所讨论的是多个变量的总体,所研究的数据是同时观测,P,个指标(即变量),又进行了,N,次观测得到的。我们把,p,个指标表示为 ,常用向量,表示对同一个体观测的,p,个变量。若观测了,n,个个体,则可得到如表,2-2,的数据,称每一个个体的,p,个变量为一个样品,而全体,n,个样品相成一个样本。,变量,序号,X1,X2,XP,1,2,n,横看表,2-2,,记,它表示第,a,个样品的观测值。竖看表,2-2.,第,j,列的元素,记,表示对第,j,个变量,X,j,的,n,次观测数值。,定义,2.1,设 为,p,个随机变量,由它们组成的向量 称为随机向量。,二、分布函数与密度函数,定义,2.2,设 是一随机向量,它的多元分布函数是,式中,并记成,定义,2.3,设 ,若存在一个非负的函数 ,使得,对一切 成立,则称,X,(或,F,(,x,)有分布密度 ,并称,X,为连续性随机变量。,一个,p,维变量的函数 能作为 中某个随机向量的分布密度,当且仅当,三、多元变量的独立性,定义,2.4,两个随机变量,X,和,Y,称为是相互独立的,若,对一切,2.5,参数估计,一、点估计:,点估计问题就是要根据样本,构造一个统计量 作为参数,的估计(,T,的维数与 的维数相同),我们称,T,为的统计量。如果 是样本的一组观测值,带入统计量,T,就得到,T,的具体数值,这个数值常称为 的估计值。,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!