资源描述
Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第九讲基本(jbn)统计分析,第一页,共17页。,我们利用(lyng)MATLAB中的函数来计算正态分布的分布函数、概率密度函数值、做出密度函数曲线、分位数.,在MATLAB中计算上述(shngsh)分布函数的命令为:,P=NORMCDF(x,mu,sigma),Default values for MU and SIGMA are 0 and 1 respectively.,例,1,已知 试求:,解:,normcdf(3,2,0.5)=0.9772;,normcdf(2,2,0.5)-normcdf(1,2,0.5)=0.4772,1.计算(j sun)分布函数与概率密度函数值:,2.,做出密度函数曲线、求分位数,第二页,共17页。,已知X的均值和标准差及概率(gil)p=PXx,求x的命令为:,X=NORMINV(P,MU,SIGMA),例,2.XN(1,0.04),pX0时称正偏,当s0时称负偏,当s接近于零时,可以认为分布是对称的.,位于(wiy)以外的点,第九讲基本(jbn)统计分析,P=NORMCDF(x,mu,sigma),normcdf(2,2,0.,计算结果如下(rxi):,b=a(:);%将矩阵(j zhn)变成数列,为了直观地了解随机变量的分布(fnb)特征,如对称性,峰值等,直方图是广泛使用的方法.,计算结果为:,y=,15.143 1 1.9307 1.1647 1 99 1400.1 37.418 0 24.245,如果例5的数据全部为1,则各种(zhn)平均值都应等于1,所有的变异特征全部为零,由于有一个异常值100,于是导致上述的一些特征受影响(不稳健),但是中位数、切尾平均与四分位极差没有改变,它们对异常值是稳健的.,三.异常(ychng)值的判别,在探索性数据分析时,有一种(y zhn)判别异常值的简单方法,首先计算数据的下、上截断点,数据中小于下截断点的数据为特小值,大于上截断点的数据为特大值,二者都是异常值.,1.,数据的下、上截断点,第七页,共17页。,计算上、下截断点的公式(gngsh)如下:,其中,,R,为四分位极差,分别称为下四分位数与上四分位数,.,对于0p0,时称正偏,当,s,3,则表明数据分布有较厚的尾部,.,第十页,共17页。,变异系数用于刻画数据的变化大小,不同(b tn)指标的变异系数常用来计算客观性权重.,例7.下表给出了15种资产的收益率ri(%)和风险(fngxin)损失率qi(%),计算峰度与偏度.,S,i,r,i,(%),q,i,(%),S,i,r,i,(%),q,i,(%),S,1,9.6,42,S,9,33.6,53.3,S,2,18.5,54,S,10,36.8,40,S,3,49.4,60,S,11,11.8,31,S,4,23.9,42,S,12,9,5.5,S,5,8.1,1.2,S,13,35,46,S,6,14,39,S,14,9.4,5.3,S,7,40.7,68,S,15,15,23,S,8,31.2,33.4,第十一页,共17页。,解:x=9.6,18.5,49.4,23.9,8.1,14,40.7,31.2,33.6,36.8,11.8,9,35,9.4,15;,y=42,54,60,42,1.2,39,68,33.4,53.3,40,31,5.5,46,5.3,23;,sx=skewness(x)=0.4624,kx=kurtosis(x)=1.8547,sy=skewness(y)=-0.4215,ky=kurtosis(y)=2.2506,从计算结果可知(k zh):收益率是正偏,而风险损失率为负偏;二者峰度都小于3属于平阔峰.,五.直方图与概率(gil)纸检验函数,1.直方图:,为了直观地了解随机变量的分布(fnb)特征,如对称性,峰值等,直方图是广泛使用的方法.,格式:hist(data,k).,说明:data是原始数据,该命令将区间(min(data),max(data)分成k等份,并描绘出频数直方图,k的缺省值为10.,第十二页,共17页。,如果需要(xyo)事先给出小区间,则将区间的中点存放在向量nb然后用命令:,n,x=hist(data),,或n,x=hist(data,k),,或n,x=hist(data,nb),,其中,n返回k个小区间的频数,x返回小区间的中点.,2.MATLAB中的概率(gil)纸检验函数.,格式:normplot(data)%如果数据data服从正态分布,则做出的图形基本上都位于一条直线上.,weibplot(data)%如果数据data服从威布尔分布,则做出的图形基本上都位于一条直线上,,例8.作出例4 数据的直方图,该数据服从正态分布还是(hi shi)威布尔分布?,第十三页,共17页。,解:输入(shr)命令hist(a(:),30)得到图7.2,从图7.2所示的直方图发现数据(shj)比较接近于正态分布,我们用命令normplot(a(:)进行检验.,从图7.3 中可见数据点基本上都位于(wiy)直线上,故可认为该数据服从正态分布,由于已经计算出该数据的均值为600,标准差为196.629,所以数据服从,图,7.2,图,7.3,第十四页,共17页。,正态分布的检验(jinyn):,1.大样本(yngbn),h=jbtest(x),h=0,接受(jishu)正态分布,h=1拒绝正态分布,2.,小样本,h=lillietest(x),h=0,接受正态分布,,h=1,拒绝正态分布,第十五页,共17页。,作业:1.根据(gnj)下表计算七项指标的均值、方差、偏度与峰度,表,7.6,各地区“三资”工业企业主要经济效益指标(,2001,年),工业增,加值率,总资产,贡献率,资产,负债率,流动资产,周转次数,成本费用,全员劳动,生产率,产品销售率,(,次,/,年,),利润率,(,元,/,人,/,年,),全 国,26.19,9.83,54.87,1.89,5.85,75913,97.64,北京,22.42,12.23,59.97,2.01,5.63,132887,97.94,天津,23.75,11.17,50.53,1.89,8.15,97342,99.01,河北,28.80,8.19,62.90,1.67,5.50,50801,98.07,山西,34.55,4.75,68.80,1.48,0.50,72910,94.50,内蒙古,30.52,8.23,43.41,0.88,7.25,62099,100.88,辽宁,26.70,8.32,50.32,1.91,5.02,82779,96.70,吉林,29.46,25.29,52.29,2.65,13.75,161233,96.52,黑龙江,31.94,6.55,70.18,1.00,3.40,75143,92.41,上海,26.23,10.43,48.39,1.68,7.09,122310,99.16,江苏,25.07,10.06,57.53,2.05,5.23,88883,97.66,浙江,23.80,11.25,55.09,2.00,6.68,56016,97.01,安徽,31.65,9.27,56.43,1.73,5.64,81460,98.97,福建,26.92,7.24,54.60,1.98,3.93,55816,96.79,江西,27.53,9.27,58.14,1.60,4.09,52256,98.03,山东,29.63,11.23,57.06,2.04,6.23,63755,97.36,湖南,33.08,9.47,55.59,1.24,8.29,80287,96.43,第十六页,共17页。,工业增,加值率,总资产,贡献率,资产,负债率,流动资产,周转次数,成本费用,全员劳动,生产率,产品销售率,(,次,/,年,),利润率,(,元,/,人,/,年,),湖北,35.32,10.47,57.39,1.85,6.50,103638,98.00,河南,29.26,10.83,54.06,1.72,7.11,73090,98.67,广东,25.36,8.88,56.41,2.03,4.99,64161,97.28,广西,30.48,9.64,56.08,1.50,6.73,63371,96.34,海南,25.28,6.44,55.14,1.28,3.10,59593,91.59,重庆,31.38,10.08,45.14,1.52,5.63,106491,96.64,四川,31.84,8.61,56.74,1.50,6.66,86379,97.13,贵州,30.57,2.17,61.90,0.80,2.36,35622,98.56,云南,32.10,9.97,48.35,1.30,11.69,86255,96.88,西藏,50.00,NAN,30.00,0.33,NAN,5000,150.00,陕西,33.62,12.93,55.83,1.29,13.59,138768,96.99,甘肃,28.57,5.13,63.65,1.11,2.02,67697,99.86,青海,20.96,11.66,50.51,1.88,18.28,94167,95.92,宁夏,33.47,3.62,61.15,1.08,-3.00,61714,91.12,新疆,29.55,6.11,59.39,0.95,7.08,70000,94.25,第十七页,共17页。,
展开阅读全文