社会统计学习题和问题详解相关及回归分析实施报告

上传人:仙*** 文档编号:98154951 上传时间:2022-05-28 格式:DOC 页数:13 大小:324.50KB
返回 下载 相关 举报
社会统计学习题和问题详解相关及回归分析实施报告_第1页
第1页 / 共13页
社会统计学习题和问题详解相关及回归分析实施报告_第2页
第2页 / 共13页
社会统计学习题和问题详解相关及回归分析实施报告_第3页
第3页 / 共13页
点击查看更多>>
资源描述
-第十二章 相关与回归分析第一节 变量之间的相关关系相关程度与方向因果关系与对称关系第二节 定类变量的相关双变量交互分类列联表削减误差比例PRE系数与系数第三节 定序变量的相关分析同序对、异序对和同分对Gamma系数肯德尔等级相关系数a系数、b与c系数萨默斯系数d系数斯皮尔曼等级相关相关肯德尔和谐系数第四节 定距变量的相关分析相关表和相关图积差系数的导出和计算积差系数的性质第五节 回归分析线性回归积差系数的PRE性质相关指数R第六节 曲线相关与回归可线性化的非线性函数实例分析二次曲线指数曲线一、填空1对于表现为因果关系的相关关系来说,自变量一般都是确定性变量,依变量则一般是随机性变量。2变量间的相关程度,可以用不知Y与*有关系时预测Y的全部误差E1,减去知道Y与*有关系时预测Y的联系误差E2,再将其化为比例来度量,这就是 削减误差比例 。3依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:1实际观察值Y围绕每个估计值是服从 ;2分布中围绕每个可能的值的 是一样的。4在数量上表现为现象依存关系的两个变量,通常称为自变量和因变量。自变量是作为 变化根据 的变量,因变量是随 自变量 的变化而发生相应变化的变量。5根据资料,分析现象之间是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进展测定,即建立一个相关的数学表达式,称为 回归方程 ,并据以进展估计和预测。这种分析方法,通常又称为 回归分析 。6积差系数r是 协方差 与*和Y的标准差的乘积之比。二、单项选择1当*按一定数额增加时,y也近似地按一定数额随之增加,则可以说*与y之间存在A关系。A直线正相关 B直线负相关 C曲线正相关 D曲线负相关2评价直线相关关系的密切程度,当r在0.50.8之间时,表示 C 。A无相关 B低度相关 C中等相关 D高度相关3相关分析和回归分析相辅相成,又各有特点,下面正确的描述有 D 。A在相关分析中,相关的两变量都不是随机的;B在回归分析中,自变量是随机的,因变量不是随机的;C在回归分析中,因变量和自变量都是随机的;D在相关分析中,相关的两变量都是随机的。4关于相关系数,下面不正确的描述是B。A当01时,表示两变量不完全相关;B当r=0时,表示两变量间无相关;C两变量之间的相关关系是单相关;D如果自变量增长引起因变量的相应增长,就形成正相关关系。5欲以图形显示两变量*和Y的关系,最好创立D。A 直方图 B 圆形图C 柱形图 D 散点图6两变量*和Y的相关系数为0.8,则其回归直线的判定系数为C 。A 0.50 B 0.80C 0.64 D 0.907在完成了构造与评价一个回归模型后,我们可以D。A 估计未来所需样本的容量B 计算相关系数和判定系数C 以给定的因变量的值估计自变量的值D 以给定的自变量的值估计因变量的值8两变量的线性相关系数为0,说明两变量之间D。A 完全相关B 无关系C 不完全相关D 不存在线性相关9身高和体重之间的关系是C。A 函数关系 B 无关系C 共变关系 D 严格的依存关系10在相关分析中,对两个变量的要求是A 。A 都是随机变量B 都不是随机变量C 其中一个是随机变量,一个是常数D 都是常数11在回归分析中,两个变量D。A 都是随机变量 B 都不是随机变量C 自变量是随机变量 D 因变量是随机变量12一元线性回归模型和多元线性回归模型的区别在于只有一个B。A 因变量 B 自变量 C 相关系数 D 判定系数13以下指标恒为正的是D。A 相关系数r B 截距a C 斜率b D 复相关系数14以下关系中,属于正相关关系得是A。A 身高与体重 B 产品与单位本钱C 正常商品的价格和需求量 D 商品的零售额和流通费率三、多项选择1关于积差系数,下面正确的说法是ABCD 。A积差系数是线性相关系数B积差系数具有PRE性质C在积差系数的计算公式中,变量*和Y是对等关系D在积差系数的计算公式中,变量*和Y都是随机的2关于皮尔逊相关系数,下面正确的说法是 。 A皮尔逊相关系数是线性相关系数B积差系数能够解释两变量间的因果关系 Cr公式中的两个变量都是随机的Dr的取值在1和0之间E皮尔逊相关系数具有PRE性质,但这要通过r2加以反映3简单线性回归分析的特点是ABE。A 两个变量之间不是对等关系B 回归系数有正负号C 两个变量都是随机的D 利用一个回归方程,两个变量可以互相推算E 有可能求出两个回归方程4反映*一线性回归方程y=a+b*好坏的指标有ABD。A 相关系数 B 判定系数C b的大小 D 估计标准误E a的大小5模拟回归方程进展分析适用于ACDE。A 变量之间存在一定程度的相关系数B 不存在任何关系的几个变量之间C 变量之间存在线性相关D 变量之间存在曲线相关E 时间序列变量和时间之间6判定系数r2=80%和含义如下ABC。A 自变量和因变量之间的相关关系的密切程度B 因变量y的总变化中有80%可以由回归直线来解释和说明C 总偏差中有80%可以由回归偏差来解释D 相关系数一定为0.64 E 判定系数和相关系数无关7回归分析和相关分析的关系是ABE。A 回归分析可用于估计和预测B 相关分析是研究变量之间的相互依存关系的密切程度C 回归分析中自变量和因变量可以互相推导并进展预测D 相关分析需区分自变量和因变量E 相关分析是回归分析的根底8以下指标恒为正的是BC。A 相关系数 B 判定系数C 复相关系数 D 偏相关系数E 回归方程的斜率9一元线性回归分析中的回归系数b可以表示为BCA 两个变量之间相关关系的密切程度B 两个变量之间相关关系的方向C 当自变量增减一个单位时,因变量平均增减的量D 当因变量增减一个单位时,自变量平均增减的量E 回归模型的拟合优度10关于回归系数b,下面正确的说法是 。 Ab也可以反映*和Y之间的关系强度。;B回归系数不解释两变量间的因果关系; C b公式中的两个变量都是随机的;Db的取值在1和-1之间;Eb也有正负之分。四、名词解释1消减误差比例变量间的相关程度,可以用不知Y与*有关系时预测Y的误差,减去知道Y与*有关系时预测Y的误差,再将其化为比例来度量。将削减误差比例记为PRE。2 确定性关系当一个变量值确定后,另一个变量值夜完全确定了。确定性关系往往表现成函数形式。3非确定性关系在非确定性关系中,给定了一个变量值,另一个变量值还可以在一定*围内变化。4因果关系变量之间的关系满足三个条件,才能断定是因果关系。1连个变量有共变关系,即一个变量的变化会伴随着另一个变量的变化;2两个变量之间的关系不是由其他因素形成的,即因变量的变化是由自变量的变化引起的;3两个变量的产生和变化有明确的时间顺序,即一个在前,另一个在后,前者称为自变量,后者称为因变量。5单相关和复相关单相关只涉及到两个变量,所以又称为二元相关。三个或三个以上的变量之间的相关关系则称为复相关,又称多元相关。6正相关与负相关正相关与负相关:正相关是指一个变量的值增加时,另一变量的值也增加;负相关是指一个变量的值增加时,另一变量的值却减少。7散点图散点图:将相关表所示的各个有对应关系的数据在直角坐标系上画出来,以直观地观察*与Y的相互关系,即得相关图,又称散点图。8皮尔逊相关系数r皮尔逊相关系数是协方差与两个随机变量*、Y的标准差乘积的比率。9同序对在观察*序列时,如果看到,在Y中看到的是,则称这一配对是同序对。10异序对在观察*序列时,如果看到,在Y中看到的是,则称这一配对是异序对。11同分对如果在*序列中,我们观察到此时Y序列中无,则这个配对仅是*方向而非Y方向的同分对;如果在Y序列中,我们观察到此时*序列中无,则这个配对仅是Y方向而非*方向的同分对;我们观察到,也观察到,则称这个配对为*与Y同分对。五、判断题1由于削减误差比例的概念不涉及变量的测量层次,因此它的优点很明显,用它来定义相关程度可适用于变量的各测量层次。 2不管相关关系表现形式如何,当1时,变量*和变量Y都是完全相关。 3不管相关关系表现形式如何,当0时,变量*和变量Y都是完全不相关。 4通过列联表研究定类变量之间的关联性,这实际上是通过相对频数条件分布的比拟进展的。而如果两变量间是相关的话,必然存在着Y的相对频数条件分布一样,且和它的相对频数边际分布一样。 5如果众数频数集中在条件频数分布列联表的同一行中,系数便会等于0,从而无法显示两变量之间的相关性。 6从分析层次上讲,相关分析更深刻一些。因为相关分析具有推理的性质,而回归分析从本质上讲只是对客观事物的一种描述,知其然而不知其所以然。 六、计算题1对*市市民按老中青进展喜欢民族音乐情况的调查,样本容量为200人,调查结果示于下表,试把该频数列联表:转化为相对频数的联合分布列联表转化为相对频数的条件分布列联表;指出对于民族音乐的态度与被调查者的年岁有无关系,并说明理由。对于民族音乐的态度Y年岁*老 中 青 喜 欢 不喜欢38 38 3015 33 462十名学生身高和体重资料如下表,1根据下述资料算出身高和体重的皮尔逊相关系数和斯皮尔曼相关系数;2根据下述资料求出两变量之间的回归方程设身高为自变量,体重为因变量。身高cm171167177154169体重kg5356644955身高cm175163152172162体重kg6652475850【皮尔逊相关系数:0.889,斯皮尔曼相关系数:0.94,回归方程:Y=-54.48+0.66*】3假定有不同文化程度的3545岁育龄妇女100人的生育情况如下表,求文化程度与平均生育数的相关系数r。序号一二三四五育龄妇女人数2020202020文化程度年平均生育数04.7463.3193.08122.41161.944*市有12所大专院校,现组织一个评审委员会对各校校园及学生体质进展评价,结果如下,试求环境质量与学生体质的关系的斯皮尔曼相关系数和肯得尔等级相关系数。环境名次397512810211416体质名次596712811110324【斯皮尔曼相关系数:0.94,肯德尔等级相关系数:0.83】5以下是婚姻美满与文化程度的抽样调查的结果,请计算婚姻美满与文化程度之Gamma系数和肯德尔相关系数c。 文化程度婚姻美满大学中学小学美 满9165一 般83018不美满347【c=0.18】6以下为两位评判员对10名参赛人名次的打分。试用斯皮尔曼等级相关系数来描述两评判员打分的接近程度。参赛人ABCDEFGHIJ评判员1评判员21122433455866778991010【斯皮尔曼相关系数:0.95】7*原始资料为:*65739188765396678285Y571313.574.5156.71011要求:1求回归方程;2这是正相关还是负相关;3求估计标准误差;4用积差法求相关系数。【Y=-11.48+0.27*】【正相关】【相关系数r=0.95】8两变量*、Y之间的关系如下表,*24681012Y141097541求回归方程; 2求相关系数。【Y=-0.957*+14.867】【r=0.98】9试就下表所示资料,计算关于身高和体重的皮尔逊相关系数。N0身高厘米体重千克1 2 3 4 5 6 7 8 910 160 161 16516516717017217417618051565966637069738065【r=0.77】10青年歌手大奖赛评委会对10名决赛选手的演唱水平*和综合素质Y进展打分,评价结果如下表表中已先将选手按演唱水平作了次序排列所示,试计算选手的演唱水平和综合素质间的肯德尔等级相关系数及斯皮尔曼等级相关系数。 选手名 A B C D E F G H I J 演唱水平*综合素质Y 1 2 3 4 5 6 7 8 9 10 3 1 5 2 7 4 10 8 6 9 【肯德尔系数:0.56,斯皮尔曼系数:0.76】11青年歌手大奖赛,假设五位评委对10名决赛选手的演唱水平进展排序,他们的有关评价结果列于下表,试通过计算肯德尔和谐系数,检验专家意见的一致性和相关程度。 五位评委10名决赛选手A B C D E F G H I J A B C D E 1 2 3 4 5 6 7 8 9 10 3 2 1 4 5 8 9 7 10 6 1 3 2 4 8 7 6 5 9 10 4 2 1 5 3 10 8 6 7 9 5 2 1 9 3 8 4 6 10 7【0.76】12*地区失业率与通货膨胀率之间的资料如下表所示,试求:1拟合指数回归方程;2失业率与通货膨胀率之间的相关系数。失业率%1.0 1.6 2.0 2.5 3.1 3.6 4.0 4.5 5.1 5.6 6.0 6.5通胀率%1.6 1.5 1.1 1.3 0.6 0.9 0.8 0.8 0.7 0.6 0.6 0.6【】【相关系数0.76】13试就下表所示资料,求算员工工作满足感高与归属感之Gamma系数,并解释Gamma系数具有削减误差比例PRE性质。工作满足感与归属感 归属感Y 工作满足感* 低1 中2 高3 低1 中2 高3 8 4 3 6 5 1 4 4 5151213F* 18 13 9 40【G=0.092】14相关系数r0.6,估计标准误差8,样本容量为62。求: 1剩余变差值;2剩余变差占总变差的百分比;3求总变差值。15在相关和回归分析中,以下资料:16,25,19,a30。要求:1计算相关系数r,说明相关程度;2求出直线回归方程。16在相关和回归分析中,以下有关资料:5,10,n20,r0.9,2000。试计算:1回归系数b;2回归变差和剩余变差;3估计标准误差。17根据下述假设资料求回归方程。*1234567Y23.023.424.125.226.126.927.318*10户家庭样本具有以下收入元和食品支出元/周数据:收入*20303340151326382543支出Y7981154810910要求:1写出最小平方法计算的回归直线方程; 2在95.46把握下,当*45时,写出Y的预测区间。19根据下述假设资料,试用积差法求相关系数。输出*亿元12106168910输出Y亿元1286111081120对40个企业的横截面样本数据进展一元回归分析,因变量与其平均数的离差平方和为6000,而回归直线拟合的剩余变差为2000,求:1变量间的相关指数R;2该方程的估计标准误差。七、问答题1简述积差系数的特性。2简述回归分析和相关分析之间的密切联系。局部计算参考:见计算题六2. 十名学生身高和体重资料如下表,1根据下述资料算出身高和体重的皮尔逊相关系数和斯皮尔曼相关系数;2根据下述资料求出两变量之间的回归方程设身高为自变量,体重为因变量。编号身高cm体重kg1171532167563177644154495169556175667163528152479172581016250皮尔逊相关系数与回归方程编号身高cm*体重kgy*y1171532924128099063216756278893136935231776431329409611328415449237162401754651695528561302592956175663062543561155071635226569270484768152472310422097144917258295843364997610162502624425008100合计16625502768623060091830斯皮尔曼相关系数编号身高cm次序体重kg次序d11714536-24216765642431771642-114154949900516955550061752661117163752700815210471000917235830010162850800合计104. *市有12所大专院校,现组织一个评审委员会对各校校园及学生体质进展评价,结果如下,试求环境质量与学生体质的关系的斯皮尔曼相关系数和肯得尔等级相关系数。环境名次397512810211416体质名次596712811110324斯皮尔曼等级相关系数环境名次体质名次d35-249900761157-2412120088001011-112111111011431112-116424合计18肯德尔等级相关系数ABCDEFGHIJKL环境名次*397512810211416体质名次(y)596712811110324 1 A: 同序对 AC AB AD AE AF AG AH AI AK 9 异序对 AJ AL 2 2 B: 同序对 BC BD BG BH BI BJ BK BL BE BF 10 3 C: 同序对 CE CF CG CH CI CJ CK CL 8 异序对CD 1 4 D: 同序对 DE DF DG DH DI DJ DK 7 异序对 DL 1 5 E: 同序对 EG EH EI EJ EK EL EF 7 6 F: 同序对 FG FH FI FJ FK FL 6 7 G: 同序对 GH GJ GK GL 4 异序对GI 1 8 H: 同序对 HI HJ HK HL 4 9 I: 同序对 IJ IK IL 3 10J: 同序对 JK JL 2 11K: 同序对 KL 1合计:同序对 异序对5. 以下是婚姻美满与文化程度的抽样调查的结果,请计算婚姻美满与文化程度Gamma系数和肯德尔相关系数c。 文化程度婚姻美满大学中学小学美 满9165一 般83018不美满347=930+18+4+7+1618+7+8(4+7)+307=1229=5(30+8+3+4)+18(3+4)+16(8+3)+303=6170.186以下试两位评判员对10名参赛人名次的打分。试用斯皮尔曼等级相关系数来描述两评判员打分的接近程度。参赛人ABCDEFGHIJ评判员1评判员21122433455866778991010参赛人评审员1评审员2dA1100B2200C4311D34-11E5500F8624G67-11H78-11I9900J101000合计87*原始资料为:*65739188765396678285Y571313.574.5156.71011要求:1求回归方程; 2这是正相关还是负相关;【正相关】 3求估计标准误差; 4用积差法求相关系数。*Y*y6554225253257375329495119113828116911838813.57744182.251188767577649532534.5280920.25238.5961592162251440676.7448944.89448.9821067241008208511722512193577692.761818985.397621.417根据下述假设资料求回归方程。*1234567Y23.023.424.125.226.126.927.3编号*y *y1123.01529232223.44547.5646.83324.19580.8172.34425.216635.04100.85526.125681.21130.56626.936723.61161.47727.349745.29191.1合计28176.01404442.52725.97rab0.99283222.01430.78214318*10户家庭样本具有以下收入元和食品支出元/周数据:收入*20303340151326382543支出Y7981154810910要求:1写出最小平方法计算的回归直线方程; 2在95.46把握下,当*45时,写出Y的预测区间。收入*支出Y *y2074004914030990081270338108964264401116001214401552252575134169165226867664208381014441003802495768121643101849100430282818928701247519根据下述假设资料,试用积差法求相关系数。输出*亿元12106168910输出Y亿元12861110811输出*亿元输出y亿元 *y121214414414410810064806636363616112561211768106410080988164721011100121110. z.
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!