概率论与数理统计-协方差和相关系数.ppt

上传人:tian****1990 文档编号:14448866 上传时间:2020-07-21 格式:PPT 页数:17 大小:986KB
返回 下载 相关 举报
概率论与数理统计-协方差和相关系数.ppt_第1页
第1页 / 共17页
概率论与数理统计-协方差和相关系数.ppt_第2页
第2页 / 共17页
概率论与数理统计-协方差和相关系数.ppt_第3页
第3页 / 共17页
点击查看更多>>
资源描述
(1)定义:D(X)=,1. 设C是常数,则D(C)=0;,2. 若k是常数,则D(kX)=k2 D(X);,3. 若X1与X2 独立,则D(X1+X2)= D(X1)+D(X2);,复习:方差,(2)计算:,方法2:,方法1:由定义,(3)性质:,一般地: D(X1+X2)= D(X1)+D(X2) + 2 EX-E(X) Y-E(Y)。,(3)泊松分布:,(1)(0-1)分布:,D(X)=p (1-p ),(2) 二项分布:,D(X)=np(1-p),D(X)=,(4)正态分布:,(5)均匀分布:,D(X)=,D(X)=,(6) 指数分布,(4)常见分布的方差:,(5) 切比雪夫不等式,设r.vX具有均值E(X)= ,方差D(X)=2,则对 0 ,有不等式,证明:根据数学期望与方差的性质:,证明E(Y)=0,D(Y)=1,P99T10: 设E(X),D(X)均存在,且D(X) 0,通常把由 r.v X 构造r.v Y的过程叫做对r.v X 标准化。 注意:更重要的是要知道如何将一个随机变量标准化.,3 协方差和相关系数 Covariance and,correlation coefficient,对于一个二维随机向量(X,Y),期望和方差只反映了它们各自的平均取值与相对于其均值的偏离程度,没有反映出X与Y之间的相互关系。,D(X+Y)=D(X)+D(Y)+2EX-E(X)Y-E(Y),注意到公式,若X、Y相互独立,D(X+Y)=D(X)+D(Y)。,EX-E(X)Y-E(Y)=0,,可以发现 EX-E(X)Y-E(Y) 这个数在一定程度上反映了X与Y之间的关系,称为X与Y的协方差。,一、协方差,1、定义:,设(X,Y)是一随机向量,称EX-E(X)Y-E(Y),Cov(X,Y)= EX-E(X)Y-E(Y),为X与Y的协方差,记作Cov(X,Y)或XY,即,若X、Y相互独立,说明,对于r. vX,Y,,D(X+Y)=D(X)+D(Y)+2Cov(X,Y),协方差是刻划r.vX与Y间取值的相互关系的数 字特征.显然:,意义:,Cov(X,Y)=0,1)用定义式 Cov(X,Y)= EX-E(X)Y-E(Y),2、计算方法,2)用简单公式 Cov(X,Y)=E(XY)-E(X)E(Y),Cov(X,X)=D(X),例1 设r.vX和Y的联合分布律为,求Cov(X,Y),解:,用公式 Cov(X,Y)=E(XY)-E(X)E(Y),可求出(X,Y)关于X,Y的边缘分布律, Cov(X,Y)=0-0=0,说明:虽然Cov(X,Y)=0,但,即X与Y不独立。,3、性质) Cov(X,Y)=Cov(Y,X);(对称性) ) Cov(aX,bY)=abCov(X,Y), a,b是任意常数; ) Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y),注:,协方差的大小在一定程度上反映了X和Y相互间的关系, 但它还受X与Y本身的系数影响. 例如:,Cov(10X, 10Y)=100Cov(X,Y),为了克服这一缺点,将协方差标准化,即在计算协方差时,先对X与Y进行标准化.即:,实际上,10X与10Y之间的关系和X与Y之间的关系应一致。,标准化的协方差称为X,Y的相关系数,二、相关系数 (correlation coefficient),设(X,Y)是一随机向量,当D(X)0, D(Y)0,则称数值,为X,Y的线性相关系数,简称相关系数.,注:,1、定义:, 相关系数也就是标准化的随机变量X*,Y*的协方差。, XY 是没有单位的量,只与两个r.v有关,能更好地反映X与Y之间的关系。,2、性质:,相关系数刻划了X和Y间“线性相关”的程度.,将e视为关于a,b的二元函数,求驻点:,解得,性质1)成立。,对应的误差平方为,性质2)证明略。,要使Y与X的某个线性函数a+bX最为接近,就是要找a,b使得误差平方e值最小.,证:,e=EY-(a+bX)2=E(Y2)+b2E(X2)+a2 -2bE(XY)+2abE(X)-2aE(Y),对任意的a,b,令,刻画了Y与a+bX的偏离程度,(*),若 = 0, Y与X无线性关系;,若0| |1,| |的值越接近于1, Y与X的线性相关程度越高;,| |的值越接近于0, Y与X的线性相关程度越弱.,=0时,称X和Y不相关。,由(*)式知, XY 的含义,说明:,1)对于随机变量X,Y,下面事实是等价的,2) X与Y相互独立,X与Y不相关,X与Y不相关,只说明X与Y之间没有线性关系,但可以有非线性关系;,但是,对于二维正态分布,独立与不相关等价。,即:若二维r.v,E(XY)=E(X)E(Y);,即X与Y不相关,3、重要结论,Cov(X,Y)=0;, X与Y不相关;,则X与Y相互独立, D(X+Y)=D(X)+D(Y).,而X与Y独立是指X,Y之间既无线性关系, 也无非线性关系,故“独立”必然不相关,但反之不然。,例2 设随机变量(X,Y)的概率密度函数为,证明:先求边缘概率密度函数,fY(y),同理,所以,f(x,y)fX(x)fY(y),故X与Y不独立,验证X与Y不相关, 且不相互独立。,Cov(X,Y)=E(XY)-E(X)E(Y)=0,即X与Y不相关,三、几个常用的数字特征,1、矩 (moment) :,则称之为X与Y的k+l 阶混合中心矩。,定义:设X与Y是随机变量,,显然,E(X)为一阶原点矩,D(X)是二阶中心矩; Cov(X,Y)是二阶混合中心矩。,2、协方差矩阵 (了解),二维r.v(X,Y)有四个二阶中心矩即D(X) 、cov(X,Y) 、cov(Y,X) 、D(Y),将它们排成矩阵 称为X,Y的协方差矩阵.,n维r.v (X1,X2,.Xn),称为r.v (X1,X2,.Xn)的协方差矩阵。,小结:,这一节我们介绍了协方差和相关系数。,相关系数是刻划两个变量间线性相关程度的一个重要的数字特征.,注意独立与不相关并不是等价的.,当(X,Y)服从二维正态分布时,有,作业: P99 T12,13,14,15,预习内容:4,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!