资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,关联性分析的重要性,根底统计书中的估量和假设检验所涉及的仅仅是对一些相互没有关系(独立)的变量的描述.,但是现实世界的问题都是相互联系的。不争论变量之间的关系,就无从谈起任何有深度的应用;而没有应用,前面讲过的那些根本概念就仅仅是摆设而已。,第六章 相关和回归,变量间的关系,人们每时每刻都在关心事物之间的关系。,比方,职业种类和收入之间的关系、政府投入和经济增长之间的关系、广告投入和经济效益之间的关系、治疗手段和治愈率之间的关系等等。,这些都是二元的关系。,还有更简单的诸多变量之间的相互关系,比方企业的固定资产、流淌资产、预算安排、治理模式、生产率、债务和利润等诸因素的关系是不能用简洁的一些二元关系所描述的。,广告投入和销售之间的关系,:,这两个变量是否有关系?,明显,它们有关系;这从散点图就很简洁看出。,根本上销售额是随着广告投入的递增而递增。,假设有关系,它们的关系是否显著?,这也可以从散点图得到。当广告投入在6万元以下,销售额,增长很快;但大于这个投入时,销售额增长就不明显了。,因此,这两个变量的关系是由强变弱。,这些关系是什么关系,是否可以用数学模型来描述?,本例看上去是可以拟合一个回归模型,但绝不是线性的,(用一条直线可以描述的)。具体细节需要进一步的分析,这两个变量是否有关系?,参数统计的关联性分析,参数统计中衡量两个定量变量之间线性相关程度的常用指标是皮尔逊,(,Pearson,),相关系数,也称积距相关系数或动差相关系数,(,离差相乘,),。,相关系数的定义公式是:,这又是什么关系?,这个关系是否带有普遍性?,也就是说,仅仅这一个样本有这样的关系,还是对于其他企业也有类似的规律。这里的数据还缺乏以答复这个问题。可能需要考虑更多的变量和收集更多的数据。,一般来说,人们希望能够从一些特殊的样本,得到普遍的结论,以利于猜测。,这个关系是不是因果关系?,在本问题中,看来似乎有因果关系。这类似于一种试验;而试验时是简洁找到因果关系的。但是,一般来说,变量之间有关系但绝不意味着存在因果关系。这里布满了危急和未知!,1.,提出假设:,H,0,:,;,H,1,:,0,2.,计算检验的统计量:,3.,确定显著性水平,,并作出决策。,相关系数特别高的样本也有可能来自无相关关系的总体。为了排解这种状况,需要对相关系数进展显著性检验。,注:这一检验是在零假设成立且两个变量听从正态分布的状况下得出的。,参数统计检验的步骤是:,皮尔逊相关系数的局限性,Pearson 相关系数及其显著性检验是建立在数据变量为定量且听从正态分布的前提下。假设这一前提不成立,则结果不行信或是错误的。此时需要非参数方法。,Pearson 相关系数只能用来度量两个变量的线性相关性,不能用来度量两者的相关性.,6.1,Spearman,秩相关检验,根本思路与检验步骤,例题:某班,15,名学生的数学成绩与统计学成绩如下表所示,试分析学生的数学成绩和统计学成绩的相关性,(,),
展开阅读全文