金融统计02-统计描述.ppt

上传人:max****ui 文档编号:3278810 上传时间:2019-12-10 格式:PPT 页数:46 大小:698.50KB
返回 下载 相关 举报
金融统计02-统计描述.ppt_第1页
第1页 / 共46页
金融统计02-统计描述.ppt_第2页
第2页 / 共46页
金融统计02-统计描述.ppt_第3页
第3页 / 共46页
点击查看更多>>
资源描述
第2章统计描述,第1节统计描述的图形法第2节统计描述的数值法,统计描述方法,统计描述方法是描述数据特征的表、图和数值等各种方法的总称实用中主要是图形法和数值法两种目的研究如何对客观现象的数量特征进行描述、概括,并通过图表等形式对所收集的数据进行加工处理和显示,进而得出反映客观现象的规律性数量特征,第1节统计描述的图形法,主要内容原始数据图构成图频率分布图散点图,常用的图形法,原始数据图按一定顺序显示各个体的数值常用的有线形图、柱状图等频率分布图(FrequencydistributionorHistogram)将样本分组,显示各组的个数构成图(饼图)将样本分组,显示各组的个数占样本总数的比率散点图(Scatterplot)个体的一个变量值在横轴,另一个变量值在纵轴,用来揭示两个变量间的关系,是回归分析中变量取舍的重要参考,图形法例:影响房价的因素,对美国321个商品房进行调查,获得如下数据(数据来源:Wooldridge,“IntroductoryEconometrics”)价格(price)、房间数(rooms)、面积(area)、建筑年代(age)等用图形法分析:价格、房间数、面积,房屋价格的原始数据图(线形图),按一定顺序显示各个体的数值信息量大规律性小原始数据图用于时间序列数据时可显示趋势,样本序号,价格(万美元),房屋价格的频率分布(Histogram),频率分布图将样本分组,显示各组的个数信息量小规律性强本图显示:低价房偏多,暗示研究结论更适合解释低价房的价格,各价格组(万美元),各价格组包含的房屋个数,房间数的频率分布图,频率分布图将样本分组,显示各组的个数信息量小规律性强大部分房屋的房间数为6、7,各组包含的房屋个数,各房间组(房间个数),房间数的构成图(饼图),饼图将样本分组,显示各组的个数占样本总数的比率7个房间的商品房最多,占总房屋数的一半以上,其次是6个房间,约占1/3,占比最少的是10个房间的商品房,价格和房间数的散点图,散点图显示两变量间的关系价格随房间数增加而上升,但趋势很散乱,表明房间数对房价的影响力比较有限,例:此房屋有10个房间,价格为5.4万美元,价格(万美元),房间数(个数),红线:相关性,价格和面积的散点图,散点图显示两变量间的关系价格随面积增加而上升,趋势较强,表明面积是影响房价的重要因素,此房屋面积约500平米,价格为10万美元,红线:相关性,价格(万美元),房屋面积(m2),第2节统计描述的数值法,主要内容平均指标:算术平均数、几何平均数变异指标:标准差、离散系数相关指标:相关系数,平均指标,平均指标说明样本某一变量取值的一般水平或取值的集中趋势平均指标分为数值平均数和位置平均数数值平均数:对统计数列的所有各项数据来计算的平均数,有算术平均数、几何平均数等位置平均数:根据样本中处于特殊位置上的个别单位或部分单位的数值确定的代表值,有中位数、众数数值平均数分为总体平均数和样本平均数,样本平均数,样本平均数使用简单算术平均数公式计算,式中:为算术平均数为样本个体总数为第个个体的值,算术平均数的主要数学性质,变量值与其算术平均数的离差之和等于0变量值与其算术平均数的离差平方和最小,表明样本平均值是不偏的(unbiased)统计量,表明样本方差是衡量离散程度最准确的指标,总体平均数(加权平均数)(此内容涉及概率论基础知识),总体平均数即随机变量的期望值()离散型随机变量的期望值连续型随机变量的期望值总体平均数例投一枚硬币,设X为结果的随机变量,正面取值1,反面取值0,则期望值,总体平均数例:指数分布(1)(此内容涉及概率论基础知识),某旧机器平均1年发生损毁故障次数=12次,则平均故障间隔时间多长?因为故障后即损毁,所以故障间隔时间就是该机器的使用寿命,故障可随时发生,故使用寿命是随机变量虽然已知平均使用寿命为1个月,但是技术人员更关心的是:具体使用寿命为1个月、2个月、3个月等的概率描述这些不同具体使用寿命的概率的函数称为密度函数,总体平均数例:指数分布(2)(此内容涉及概率论基础知识),指数分布的概率密度函数前述旧机器的概率密度函数问题如果另一个旧机器的=4次/年,两者使用寿命的概率分布有什么区别?,总体平均数例:指数分布(3)(此内容涉及概率论基础知识),使用寿命(年)x,概率f(x),不同的年平均故障次数下,使用寿命的概率分布的区别:低(即故障率低)的机器,寿命短的概率较低,寿命长的概率较高,几何平均数,几何平均数是算术平均数的变化方式,计算方法为几何平均数的使用对于随时间变化的变量,计算其各期的平均值,必须使用几何平均数例:GDP平均增长率、平均利率等,几何平均数例:复利,单利与复利的本质区别单利:利息不计入下期增长基数复利:利息计入下期增长基数单利与复利的积累公式单利:复利:,几何平均数与复利,复利以几何平均数的形式反映了货币增值的规律,复利的利率等于几何平均数减去1,复利例,一笔3年期贷款第1、2年的年利率为5%,第3年的年利率为10%,求该贷款的年平均利率。解:,变异指标,变异指标样本中各个体数值背离分布中心的程度也可以衡量平均数代表性的大小变异指标的种类极差、平均差、标准差其中最常用的是标准差平均指标和变异指标统称为基本统计量,样本标准差,样本标准差样本各个体数值与样本平均数的离差平方的平均数的开平方根,标准差的平方称为方差样本标准差的特点不易受极端数值的影响,能综合反映差异程度用平方的方法消除各标志值与平均数离差的正负值问题,可方便地用于数学处理和统计分析运算,样本标准差例:12名商学院毕业生的起始月薪数据样本,离散系数,离散系数指消除平均数影响后的变异指标,其形式为相对数。常用的离散系数为平均差系数和标准差系数标准差系数公式离散系数的作用用来对比不同水平的同类现象,特别是平均数代表性的大小标准差系数小的总体,其平均数的代表性大;反之,代表性小,离散系数例,某年级一、二两班某门课的平均成绩分别为82分和76分,其成绩的标准差分别为15.6分和14.8分,比较两班平均成绩代表性的大小解,一班成绩的标准差系数为:,二班成绩的标准差系数为:,因为,所以一班平均成绩的代表性比二班大,相关关系,相关关系(Correlation)的定义指现象之间客观存在的、在数量上的变化受随机因素的影响,非确定性的依存关系。相关关系以相关系数度量相关关系的主要特点相关关系表现为数量上的依存关系,即一个现象在数量上发发生变化,另一个现象也会相应发生数量上的变化现象之间数量依存关系的具体关系值是不固定的相关关系既有线性相关、也有非线性相关,协方差(1),协方差(Covariance)衡量两随机变量间线性相关关系的数值。正值表示正相关,负值表示负相关样本协方差(Samplecovariance)思考互相独立的两随机变量间的协方差为什么为0?,协方差(2),总体协方差如果X、Y互相独立,则,协方差(3):总体协方差例,投两次硬币X表示第1次结果,正面取值1,反面取值0Y表示第2次结果,正面取值1,反面取值0求协方差,并指出协方差为0的条件解,协方差(4):总体协方差例,相关系数,样本相关系数(correlationcoefficient)衡量两随机变量间线性相关关系的标准化数值,取值是正负1(含)之间的一个实数统计描述中一般使用相关系数表示两变量间的相关关系,作为标准化数值,可在不同变量间作比较,相关关系的种类与相关系数,相关关系按相关的方向分为:正相关:现象的数量同方向变动;相关系数0负相关:现象的数量反方向变动;相关系数0相关关系按相关的程度分为:完全相关:一种现象的数量变化完全由另一个现象的数量变化所确定;|相关系数|=1不相关:现象之间彼此互不影响,其数量变化各自独立;相关系数=0不完全相关:界于前两者之间;,相关关系分析中应注意的问题例1:Anscombes四组图,统计学家Anscombe于1973年设计的四组数据揭示的问题:单纯的基本统计量及相关关系不一定真实反映数据的主要特征解决途径:在统计量分析的基础上,还要对数据作图示描述,例1(续1)四组图的数据,数据特点如下表:(其中Mean:均值Variance:方差Correlation:相关系数),数据表(每组由x、y随机变量构成),例1(续2)四组图的图示,4组数据中,X、Y的均值、方差及X-Y相关系数都相同,但图示的相关性截然不同。只有Y1呈现通常认为的相关性,相关关系分析中应注意的问题(续)例2:虚假相关,虚假相关(pseudocorrelation)两随机变量间源于偶然的相关关系解决途径:针对社会经济现象的统计分析一定要以一定的理论为基础,注:横轴-年份;纵轴(左)-美国GDP;纵轴(右)-太阳黑子;均为对11年平均值的偏离程度(百分比)Source:Modis,T.,2007,Sunspots,GDPandthestockmarket,TechnologicalForecasting&SocialChange74,1508-1514,例2(续)虚假相关例:太阳黑子与GDP的正相关,本章总结,应用统计研究中,对数据进行描述的步骤(1)作图形法统计描述(2)作数值法统计描述作统计描述时应注意以下问题(1)使用这两种方法时,应结合所描述出的特点作相关背景介绍,比如房价例中采样以低价房为主等(2)作出的图、表应规范,可参照后面内容,规范的图形法统计描述(1),相关背景介绍如:本图显示,低价房偏多,因此本研究结论主要合解释低价房的价格,各价格组(万美元),各价格组包含的房屋个数,图1房屋价格的分布图,图下方必须有编号和标题,坐标轴必须有文字说明,规范的图形法统计描述(2),相关描述如:价格随面积增加而上升,趋势较强,表明面积是影响房价的重要因素,价格(万美元),房屋面积(m2),图2房屋价格与面积的关系,规范的数值法统计描述(1),表1房屋价格和面积的基本统计量,表上方必须有编号和标题,相关描述,表一般只要三根线,规范的数值法统计描述(2),注:AREA=面积,AGE=房龄,ROOMS=房间数,BATHS=卫生间数,NBH=neighborhood=附近社区数,表2房屋价格等相关变量间的相关系数,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!