资源描述
课 程 论 文住房状况调查分析报告课程名称: 统计软件应用 所在专业: 工商管理 所在班级: 姓 名: 郭喆 学 号: 目 录前 言1一、数据基本介绍1二、研究对象的基本特征22.1现有住房基本状况22.2住房未来需求的基本状况8三、研究对象的联合分布特征123.1 现在住房状况联合分布特征123.2 未来住房需求状况联合分布特征25四、变量间的相关分析361、家庭收入与现住面积的相关分析372、家庭收入与计划面积的相关分析373、计划面积与购房价位的相关分析40五、研究对象变量间的回归分析411、购房价位与计划面积的回归分析412、家庭收入与计划面积的回归分析46六、总结与建议50前 言住房一直是我国经济发展的支柱产业,它的持续、稳定和健康发展,关系到人民生活水平的提高,关系到区域经济发展的稳定,它反映了住户的居住质量和数量, 并影响个人身体健康和社会稳定。为了了解该区现有住房的基本状况及其存在的问题,系统了解该区住户的住房需求,我们展开了这次调研。望通过此次调研,可以为完善住房保障政策、合理进行地产开发、引导合理的住房消费模式、稳定市场预期发挥微薄的作用。本次调研的涉及内容广泛,除了包括该区住户的基本信息之外,还有目前居民的居住现状、居民未来购房需求等,以期能够全面、准确地反映被调查者的居住现状和未来房屋需求。在进行报告分析时,同样是先对住户的基本信息做简单的分析,然后分别就该区居民目前的居住状况和未来购房需求两大块进行分析,这两部分的分析以现住面积和计划面积为主要分析的因素,研究其他因素对两者的影响。本文利用SPSS软件对该区住房状况抽样调查数据进行了频数分析、描述分析、探索分析、方差分析、t检验、相关分析、回归分析等一系列的分析,以期能够对该区住户的现有住房状况和住房的未来需求状况进行分析,并就对二者产生影响的因素进行分析,试图了解变量间的相互关系。对于调研分析中得到的一些现存问题,提出比较合理化的建议。本次调查的主要方式是问卷调查,在发放的问卷中,成功收回有效问卷2993份,样本量数目较大,可以代表该区住户的基本状况。一、数据基本介绍报告的数据来源于住房状况调查.sav,为某区2993户住房状况统计表,其中共包含二十二个变量,分别为:编码,数据类型为Scale;所在区,数据类型为Nominal,(1.00代表A区,2.00代表B区,3.00代表C区,4.00代表D区,5.00代表E区);性别,数据类型为Nominal(1.00代表男,2.00代表女);年龄,数据类型为Scale;文化程度,数据类型为Ordinal,(1.00代表初中及以下,2.00代表高中(中专),3.00代表大学(专、本科),4.00代表研究生及以上);从业状况,数据类型为Nominal,(1.00代表行政事业单位,2.00代表国营企业,3.00代表私营企业,4.00代表大专院校科研单位,5.00代表失业,6.00代表其他);婚姻,数据类型为Nominal,(1.00代表已婚,2.00代表否);常住人口,数据类型为Scale;户口状况,数据类型为Nominal,(1.00代表本市户口,2.00代表外地户口);家庭收入,数据类型为Scale;现住面积,数据类型为Scale;人均面积,数据类型为Scale;房屋产权,数据类型为Nominal,(1.00代表无产权,2.00代表部分产权,31.00代表二手房,32.00代表经济适应房,33.00代表多层商品房,34.00代表高层商品房,35.00 代表别墅,36.00代表其它);住房满意,数据类型为Nominal,(1.00代表满意,2.00代表不满意);未来三年,数据类型为Nominal,(1.00代表不买,2.00代表购买);计划面积,数据类型为Scale;计划户型,数据类型为Nominal,(1.00代表一室一厅,5.00代表更大户型,21.00代表两室一厅,22.00代表两室两厅31.00代表三室一厅,32.00代表三室两厅,33.00代表三十三厅,421.00代表四室两厅单卫,422代表四室两厅双卫,431代表四室三厅单卫);购买类型,数据类型为Nominal,(1.00代表二手房,2.00代表多层商品房,3.00代表高层商品房,4.00代表别墅);地理位置,数据类型为Nominal,(1.00代表甲新区,4.00代表乙新区,5.00代表其它,21.00代表环城快速路东侧,22.00代表环城快速路西侧,23.00环城快速路南侧,24.00环城快速路北侧,31.00代表京广铁路以东A大道以北,32.00代表京广铁路以东A大道以南,33.00代表京广铁路以西B路以南,34.00京广铁路以西B路以北);购房价位,数据类型为Scale;是否贷款,数据类型为Nominal ,(1.00代表自筹,2.00);mj,数据类型为Ordinal,(1.00代表10平米以下,2.00代表10-20平米,3.00代表21-30平米,4.00代表31平米以上)。运用SPSS统计分析软件,对变量进行相应的频数分析、描述统计分析、探索分析、参数检验、非参数检验、方差分析、t检验、相关分析和回归分析等,以了解该区上述方面的综合状况,并分析各变量的分布特点及相互间的关系。二、研究对象的基本特征2.1现有住房基本状况统计分析往往从了解数据的基本特征开始。通过频数分析能够了解变量的取值状况,对把握数据的分布特征尤为重要。通过对该区2993户住房的基本状况的统计数据表,在性别、所在区、文化程度、从业状况、婚姻、常住人口、户口状况、房屋产权、住房满意的不同的状况下的频数分析,从而了解该区居民及其现有住房的基本状况。在频数分析的同时,结合饼图、直方图等会使数据分布特征更加清晰,方便直观理解。1、对该区的性别分布状况进行频数分析,结果如下:表2-1 性别 FrequencyPercentValid PercentCumulative PercentValid男189463.363.363.3女109936.736.7100.0Total2993100.0100.0 从表2-1可以看出,该地区被调查的2993个对象中,有1894位为男性,1099位为女性,男女所占的比例分别为63.3%和36.7%,可得被调查的人员男性较女性多。2、对该区住户的所在区分布状况进行频数分析,结果如下:图2-1 该区居民所在区的直方图表2-2 所在区 FrequencyPercentValid PercentCumulative PercentValidA108036.136.136.1B74024.724.760.8C67422.522.583.3D45915.315.398.7E401.31.3100.0Total2993100.0100.0 从表2-2中可以看出,该地区被调查的对象中,有1080户住在A区,有740户住在B区,有674户住在C区,有459户住在D区,有40户住在E区。A区的住户最多,达到36.1%,其次是B区、C区,分别占总数的24.7%和22.5%,再次是D区,占到15.3%,最少的是E区,仅占1.3%。由图2-1也可直观地可出调查对象在各区的分布情况。3、对该区的文化程度分布状况进行频数分析,结果如下:表2-3 文化程度 FrequencyPercentValid PercentCumulative PercentValid初中及以下80526.926.926.9高中(中专)125842.042.068.9大学(专、本科)89629.929.998.9研究生以及上341.11.1100.0Total2993100.0100.0 从表2-3中可以看出,该区参与调查的2993个对象中,初中及以下文化程度的人有805人,高中(中专)文化程度的人有1258人,大学(专、本科)文化程度的人有896人,研究生及以上文化程度的有34人,分别占到总人数的26.9%,42.0%,29.9%,1.1%。可见,拥有高中(中专)学历的人最多,而研究生及以上的人数最少。4、对该区的从业状况分布状况进行频数分析,结果如下:从表2-4中可以看出,该地区住户在不同类型的单位从业的比例分别为16.8%,43.4%,15.6%,4.7%,9.5%,9.9%,就业于行政事业单位的有504人,就业于国营企业的有1300人,就业于私营企业的有467人,就业于大专院校科研单位的有142人,失业的有285人,其它为295人。可得在国营企业中就业的最多,其次是行政事业单位和私营企业,在大专院校科研单位从业的人最少。从图2-2中也可以直观的看出该区住户的从业状况的分布状况。图2-2 从业状况饼图表2-4 从业状况 FrequencyPercentValid PercentCumulative PercentValid行政事业单位50416.816.816.8国营企业130043.443.460.3私营企业46715.615.675.9大专院校科研单位1424.74.780.6失业2859.59.590.1其它2959.99.9100.0Total2993100.0100.0 5、对该区的婚姻分布状况进行频数分析,结果如下所示:从表2-5中可以看中婚姻的均值为1.1029,可以大致了解被调查人员大多数已婚。从表2-6中可以详细的看出,被调查的2993人中,已婚的有2685人,未婚的有308人。已婚的和未婚的所占比例分别为89.7%和10.3%,可见大多数被调查人员已婚。表25 Statistics婚姻NValid2993Missing0Mean1.1029表2-6 婚姻 FrequencyPercentValid PercentCumulative PercentValid已婚268589.789.789.7否30810.310.3100.0Total2993100.0100.0 6、对该区的常住人口分布状况进行频数分析,结果如下所示:表2-7 Statistics常住人口 FrequencyPercentValid PercentCumulative PercentValid1.001284.34.34.32.0045515.215.219.53.00157152.552.572.04.0050516.916.988.85.0030310.110.199.06.0026.9.999.87.003.1.199.98.002.1.1100.0Total2993100.0100.0 从表2-7可以看出,在该地区被调查的2993户中,有128户常住人口为1人,455户常住人口为2人,1571户常住人口为3人,505户常住人口为4人,303户常住人口为5人,26户常住人口为6人,3户常住人口为7人,2户常住人口为8人,所占比例分别为4.3%,15.2%,52.5%,16.9%,10.1%,0.9%,0.1%,0.1%。常住人口为3人的住户最多,所占比例高达52%。由图2-3也可以直观的看出常住人口为3.00的住户最多。图2-3 常住人口饼图7、对该地区的户口状况分布状况进行频数分析,结果如下:表2-8 Statistics户口状况NValid2993Missing0Mean1.0561表2-9 户口状况FrequencyPercentValid PercentCumulative PercentValid本市户口282594.494.494.4外地户口1685.65.6100.0Total2993100.0100.0 从表2-8可以看出,该地区的户口状况的均值为1.0561,大致可以了解该地区的大部分居民是本市户口,只有小部分人是外地户口。从表2-9可以看出,在该地区被调查的2993户中,有2825户为本地户口,168户为外地户口,本地户口和外地户口的比例分别为94.4%和5.6%,该地区的本地人明显多于外地人。8、对该地区的房屋产权分布状况进行频数分析,结果如下:从表2-10中可以看出,在该地区被调查的2993人中,有715户所住房屋无产权, 420户所住房屋有部分产权, 61户所住房屋为二手房, 214户所住房屋为经济适用房, 1456户所住房屋为多层商品房, 9户所住房屋为高层商品房, 118户所住房屋产权为其他,各比例分别为23.9%,14%,2%,7.2%,48.6%,0.3%,3.9%。房屋产权中多层商品房的所占的比例最大。表2-10 房屋产权 FrequencyPercentValid PercentCumulative PercentValid无产权房71523.923.923.9部分产权房42014.014.037.9二手房612.02.040.0经济适用房2147.27.247.1多层商品房145648.648.695.8高层商品房9.3.396.1其它1183.93.9100.0Total2993100.0100.0 9、对该地区的住房满意分布状况进行频数分析,结果如下:表2-11 住房满意 FrequencyPercentValid PercentCumulative PercentValid满意112837.737.737.7 不满意186562.362.3100.0 Total2993100.0100.0 从表2-11中可以看出,该地区被调查的2993人中,有1128户对目前所住房屋感到满意,有1865户对目前所住房屋感到不满意,各比例分别为37.7%和62.3%。对现有住房满意的住户还是占多数,但接近40%的不满意的住户还是值得引起注意的。通过简单的频数分析我们了解了该区住户现有房屋的基本状况,为了对数据中的年龄、家庭收入、现住面积、人均面积等变量有更为精确的认识,进一步对其进行描述统计分析,得到它们的均值、标准差、偏度、峰度等数据,以进一步把握数据的集中趋势和离散趋势。通过对年龄、家庭收入、现住面积、人均面积的描述统计分析,来了解居民现有的住房基本状况。分析结果如下:表2-12 描述统计由表2-12知,被调查的2993户中,年龄最小值为20岁,最大为65岁,平均值为39.2583岁,标准差为9.37173,方差为87.829,偏度系数和峰度系数分别为0.061和-1.002,误差分别为0.045和0.089。家庭收入最小值为1200.00元,最大为元,平均值为17696.1567月,标准差为15298.80341平方米,方差为.722平方米,偏度系数和峰度系数分别为5.546和55.425,误差分别为0.045和0.089。现住面积最小值为6平方米,最大为300平方米,平均值为62.7241平方米,标准差为25.90383平方米,方差为671.008平方米,偏度系数和峰度系数分别为0.910和3.078,误差分别为0.045和0.089。人均面积最小值为2.40平方米,最大为115.00平方米,平均值为22.0060平方米,标准差为12.70106平方米,方差为161.317平方米,偏度系数和峰度系数分别为2.160和7.739,误差分别为0.045和0.089。2.2住房未来需求的基本状况通过分析该区2993户住房的未来三年、计划户型、购买类型、地理位置、是否贷款、mj(面积)的不同的状况下的频数,来了解该区住户在未来购房需求上的基本状况。表2-13 未来三年 FrequencyPercentValid PercentCumulative PercentValid不买216172.275.075.0买71924.025.0100.0Total288096.2100.0 MissingSystem1133.8 Total2993100.0 1、对该区的未来三年分布状况进行频数分析,结果如表2-13所示:从表2-13可以看出,该地区被调查的2880户中,有2161户在未来三年不准备购买房屋,有719户在未来三年准备购买房屋,各比例分别为72.2%和24%。可见大部分被调查者在未来三年没有购房计划。2、对该区的计划户型分布状况进行频数分析,结果如下:表2-14 计划户型 FrequencyPercentValid PercentCumulative PercentValid一室一厅12.41.41.4更大户型13.41.63.0两室一厅2036.824.427.4两室两厅1043.512.539.9三室一厅2086.925.064.9三室两厅2237.526.891.7三室三厅5.2.692.3四室两厅单卫19.62.394.6四室二厅双卫371.24.499.0四室三厅单卫2.1.299.3四室三厅双卫6.2.7100.0Total83227.8100.0 MissingSystem216172.2 Total2993100.0 从表2-14可以看出,该地区被调查的2993户中,仅有有832户有相应的计划户型,其中有12人准备购买一室一厅,13人准备购买更大户型,203人准备购买两室一厅,104人准备购买两室两厅,208人准备购买三室一厅,223人准备购买三室两厅,5人准备购买面三室三厅,19人准备购买四室两厅单卫,37人准备购买四室二厅双卫,2人准备构买四室三厅单卫,6人准备购买四室三厅双卫,所占的比例分别为1.4%,1.6%,24.4%,12.5%,25.0%,26.8%,0.6%,2.3%,4.4%,0.2%,0.7%。在有计划户型的被调查者中,大部分人偏向于购买两室一厅,三室一厅和三室两厅。3、对该区的购买类型分布状况进行频数分析,结果如下:表2-15 购买类型 FrequencyPercentValid PercentCumulative PercentValid二手房1133.813.613.6 多层商品房57919.369.683.2 高层商品房1314.415.798.9 别墅9.31.1100.0 Total83227.8100.0 MissingSystem216172.2 Total2993100.0 从表2-15可以看出,在832户计划购买类型的被调查者中,有113人准备购买二手房,579人准备购买多层商品房,131人准备购买高层商品房,9人准备购买别墅,各比例分别为13.6%,69.6%,15.7%,1.1%。可见,大部分人偏向于购买多层商品房。4、对地理位置分布状况进行频数分析,结果如下:表2-16 地理位置 FrequencyPercentValid PercentCumulative PercentValid甲新区1304.315.615.6 乙新区571.96.922.5 其它26.93.125.6 环城快速路东侧28.93.429.0 环城快速路西侧13.41.630.5 环城快速路南侧6.2.731.3 环城快速路北侧411.44.936.2 京广铁路以东A大道以北1635.419.655.8 京广铁路以东A大道以南1625.419.575.2 京广铁路以西B路以南1434.817.292.4 京广铁路以西B路以北632.17.6100.0 Total83227.8100.0 MissingSystem216172.2 Total2993100.0 从表2-16可以看出,在832户计划购买房屋的被调查者中,有130人选择甲新区,有57人选择乙新区,有26人选择其它地方,有28人选择环城快速路东侧,有13人选择环城快速路西侧,有6人选择环城快速路南侧,有41人选择环城快速路北侧,有163人选择京广铁路以东A大道以北,有162人选择京广铁路以东A大道以南,有143人选择京广铁路以西B路以南,有63人选择京广铁路以西B路以北。各比例分别为15.6%,6.9%,3.1%,3.4%,1.6%,0.7%,4.9%,19.6%,19.5%,17.2%,7.6%。大部分被调查者对甲新区,京广铁路以东A大道以北,京广铁路以东A大道以南和京广铁路以西B路以南的房屋表现出更大的偏爱。5、对该地区的购房是否贷款分布状况进行频数分析,结果如下:表2-17 是否贷款 FrequencyPercentValid PercentCumulative PercentValid自筹39613.247.647.6申请贷款43614.652.4100.0Total83227.8100.0 MissingSystem216172.2 Total2993100.0 从表2-17可以看出,在832户计划购买房屋的被调查者中,有396人之自筹房款,436人申请贷款,两者所占的比例分别为47.6%、52.4%,两种方式的选择上差别不大。通过对计划面积、购房价位的描述统计分析,来了解居民对未来住房的计划需求状况。分析结果如下:表2-18 描述统计从表2-18可得,在被调查的2993户中,计划面积最小值为18平方米,最大为300平方米,平均值为101.5707平方米,标准差为29.54992平方米,方差为873.198平方米,偏度系数和峰度系数分别为1.097和3.807,误差分别为0.085和0.169。购房价位最小值为0.8,最大为83,平均值为14.0907平方米,标准差为9.68077平方米,方差为93.717平方米,偏度系数和峰度系数分别为2.939和13.874,误差分别为0.085和0.169。三、研究对象的联合分布特征3.1 现在住房状况联合分布特征通过频数分析能够掌握单个变量的数据分布状况,但是在实际分析中,不仅要了解单个变量的分布特征,还要分析多个变量不同取值下的分布,掌握多个变量的联合分布特征,进而分析变量之间的相互影响和关系。就本数据而言,需要了解不同文化程度、从业状况、婚姻、户口状况的住房差异,来了解住户现在的实际住房状况,观察每个因素对住房水平的影响程度。在此主要用到的分析方法有交叉列联表分析、探索分析和均值比较等。1、通过交叉列联表分析文化程度与现住面积的分布状况,为了方便分析,现在将现住面积进行分组,重新定义一个“现住面积分组”变量,分组情况如下,35平米以下为1.00,36-65平米为2.00,66-95平米为3.00,96-125为4.00,126以上为5.00。分析结果如下:表3-1列联表3-2及图3-1涉及两个变量,即文化程度和现住面积(分组后)的二维交叉,反映了不同文化程度和现住面积的交互影响情况。由表知,在所调查的2993个样本中,有2992个有效数据,有一个数据因为缺失而没有参与分析,如表3-1。在2992个有效数据中分析二者的交互关系,其中805人为初中及以下文化程度,1258人为高中(中专)文化程度,895人为大学(专、本科)文化程度,34人研究生及以上的文化程度,分别占样本的26.9%、42.0%、29.9%、1.1%,可见有高中(中专)文化程度的占多数;现住面积为1.00,2.00,3.00.4.00,5.00的样本数分别为353、1437、872、275/55,分别占样本的11.8%、48.0%、29.1%、9.2%、1.8%,可见现住面积为2.00的占较大比例。表3-2表3-3 Chi-Square Tests ValuedfAsymp. Sig. (2-sided)Pearson Chi-Square217.011(a)12.000Likelihood Ratio216.82412.000Linear-by-Linear Association174.7981.000N of Valid Cases2992 a. 3 cells (15.0%) have expected count less than 5. The minimum expected count is .63.对不同文化程度进行分析:在拥有初中及以下文化程度的805个样本中,现住面积为2.00的所占的比例最大;在拥有高中(中专)文化程度的1258个样本中,同样是现住面积为2.00的所占的比例最大;在拥有大学(专、本科)文化程度的895个样本中,现住面积为3.00所占的比例最大,高于总体比例;在拥有研究生及以上文化程度的34个样本中,也是现住面积为3.00所占的比例最大,且所占的百分比(44.1%)明显高于总体中现住面积为3.00所占的百分比(29.1%)。对不同现住面积进行分析:在现住面积为1.00的353个样本中,初中及以下、高中(中专)、大学(专、本科)、研究生及以上文化程度的人分别是151、150、52和0,分别占总样本的42.8%、42.5%、5.8%和0.0%,初中及以下、高中(中专)文化程度所占的比重较大,比例相差较为悬殊;在现住面积为2.00的1258个样本中,初中及以下、高中(中专)、大学(专、本科)、研究生及以上文化程度的人分别是424、659、342和12,分别占总样本的29.5%、45.9%、23.8%和35.3%,高中(中专)文化程度的比重较大,且比例相差较为悬殊;以此类推,在现住面积为3.00的102个样本中,高中(中专)、大学(专、本科)文化程度所占的比重加大,比例相差较为悬殊;在现住面积为4.00的102个样本中,高中(中专)、大学(专、本科)文化程度的比重较大,比例相差还是很悬殊。但应注意的是,四种文化程度的的样本量本身存在较大悬殊,因此这里的分析是存在一定问题的。这些分析可在图4-12中得到直观印证。从图表中的数据可以看出,户主为不同受教育程度下家庭的住房状况有差异虽然不明显,但还是有差异的,文化程度越高现住面积越大。由表3-3,由于显著性水平检验结果为0.00远小于0.05,因此应拒绝原假设,接受被择假设,认为文化程度与现住面积不是独立的,二者有一定的联系,文化程度对现住面积有一定的影响。图3-12、通过探索分析分析户口状况与现住面积(分组后)的分布状况,分析结果如下:户口状况往往影响到人们的购房心理,会对人们的住房面积的现状产生一定的影响。结合表3-4、图3-2和图3-3的对比以及图3-4来看,本市户口和外地户口的均值2.4274和2.1607,通过盒须图也可以看出,其平均数几乎无差别,因此在住房面积的均值方面差异不大,但从盒须图的四分位点的分布可以明显地看出,本市户口的现住面积集中在2-3之中,而外地户口的现住面积分布于1-3之中,可见,本市户口的现住面积的分布比外地户口的要集中,面积上也要稍大一点。总体来说,户口状况对现住面积影响不大,但有细小的影响。表3-4图3-2图3-3图3-43、通过探索分析分析婚姻与现住面积(分组后)的分布状况,结果如下:图3-5表3-5一般来讲,婚姻状况对住房状况影响很大,通常结婚伴随着住房状况的改善,组建家庭之后会使得居住环境更为稳定,住户会寻求更大面积的房屋,通常结婚的住户的住房面积应大于未婚住户的住房面积。然而从表3-5中可以看出,已婚住户的现住面积均值为2.4251,与未婚住户的现住面积均值的2.3019差异不大。通过图3-6和图3-7的对比可以看出,已婚和未婚的现住面积均值相差不大,两幅茎叶图的分布情况也基本相同。通过图3-5可以看出,盒须图的平均数也几乎无差别,且最大值均为4.00,最小值均为1.00,因此可以看出该地区的婚姻状况对住房状况的影响不显著。Stem-and-Leaf Plots图3-6图3-74、通过均值比较分析比较从业状况与现住面积的分布状况,结果如下:表3-6Report现住面积从业状况MeanNStd. DeviationMaximumMinimum行政事业单位73.545150425.35075150.0014.00国营单位59.1633130023.87122300.009.00私营单位64.490946728.93807180.006.00大专院校科研单位69.119114222.37618160.0010.00失业55.893428523.76951175.006.00其它60.652329527.69902170.007.00Total62.7241299325.90383300.006.00从表3-6可以看出,本次被调查的住户中,不同从业状况的居民的住房面积的均值差异较大,住房状况的差异比较明显,其中最好的为行政事业单位,均值达73.5451平方米,其次是大专院校科研单位,均值面积为69.119平方米1,然后是私营企业、国营企业、其他,住房状况最差的是失业居民,仅55.8934平方米。从图3-8中可以对这种差异有明显的感受。图3-85、通过均值比较分析常住人口与现住面积之间的关系,分析结果如下:表3-7由表3-7可知常住人口为1.00,2.00,3.00,4.00,5.00,6.00,7.00,8.00的住户的现住面积的均值分别为46.5451、60.9599、62.3486、66.4923、67.7345、63.462、73.0000、63.0000。为了判断不同常住人口的现住面积均值差异的显著性,现进行单因素方差分析。结果如下:表3-8表3-9表3-8给出了基本描述性统计量,从表中可以看出各组样本数、均值、标准差、标准误、最大小值等,与表3-7分析的结果一致。表3-9给出了方差齐次性检验结果。由表可知,输出的相伴概率为0.861,远大于显著性水平0.05,因此可以认为各组的总体方差是相等的。在进行了方差的齐性检验的基础上,继续对均值差异的显著性进行分析。表3-10在表3-10的方差分析表中可知,总离差平方和为,组间离差平方和为50241.711,组内离差平方和为,组间离差平方和中能够被线性解释的部分为15848.472;方差检验F为10.945,对应的相伴概率为0.000,小于显著性水平,因此,八组变量中至少有一组与另外一组差异显著,但不能说明是哪两组之间差异显著。继续对输出结果进行分析,来确定该差异到底是由哪两组之间的差异造成的,或者说是哪几组的差异造成的。表3-11输出的是多重比较表,为LSD法多重比较结果。从表中知,常住人口为1.00的住户和常住人口为7.00以及常住人口为8.00的相伴概率分别为0.77和0.367,均大于显著性水平0.05,说明常住人口为1.00的住户和常住人口为7.00的住户的现住面积差异不显著,与常住人口为8.00的住户的现住面积差异也不显著。同理,可以看出,常住人口为2.00的住户与常住人口为3.00、6.00、7.00、8.00的住户的差异不显著。常住人口为3.00的住户与常住人口为6.00、7.00、8.00的住户的差异不显著。常住人口为4.00的住户与常住人口为5.00、6.00、7.00、8.00的住户的差异不显著。常住人口为5.00的住户与常住人口为、6.00、7.00、8.00的住户的差异不显著。常住人口为6.00的住户只与常住人口为1.00的住户的差异显著。常住人口为7.00、8.00的住户与其它的差异都不显著。其它各种组合的两组之间的相伴概率都小于0.05,说明他们两两之间差异显著,表格中也用“*”标识出来,方便观察。表3-116、通过探索分析分析现住面积与住房满意度的分布状况,分析结果如下:表3-12由表3-12可以看出,对住房表示满意的家庭的现住面积的均值为75.6130,均值标准误差为0.77708;对住房表示不满意的家庭的现住面积的均值为54.9286,均值标准误差为0.51980。对该区的现住面积与住房满意进行双样本T检验,来判断以户口状况分组的计划面积均值是否存在显著差异,即对双样本的均值差异来源进行判断,推断其是由抽样误差造成的还是系统性的。检验结果如下:从表3-13可以看出,对于现住面积来说,F值为41.260,相伴概率为0.000,小于显著性水平0.05,拒绝方差相等的假设,可以认为满意和不满意的现住面积方差存在显著差异;然后看方差不相等时t检验的结果,t统计量的相伴概率为0.000小于显著性水平0.05,拒绝原假设,也就是说,满意和不满意的现住面积的均值存在显著差异。表3-133.2 未来住房需求状况联合分布特征1、户口状况与未来三年是否打算购房的交叉列联表分析,结果如下:表3-14表3-15由表3-14、3-15知,在所调查的2880样本中(有113个样本因缺失值而被剔除),2712户为本市户口,168户为外地户口,分别占总样本的94.2%和5.8%,可见本市户口占多数;未来三年不准备买房、准备买房的样本数分别为2161和719,各占总样本的75%和25%,不准备买房的占较大比例。表3-16Chi-Square Tests ValuedfAsymp. Sig. (2-sided)Exact Sig. (2-sided)Exact Sig. (1-sided)Pearson Chi-Square9.819(b)1.002 Continuity Correction(a)9.2521.002 Likelihood Ratio9.1481.002 Fishers Exact Test .002.002Linear-by-Linear Association9.8161.002 N of Valid Cases2880 a. Computed only for a 2x2 tableb .0 cells (.0%) have expected count less than 5. The minimum expected count is 41.94.图3-9对不同户口状况进行分析:在拥有本市户口的2712户中,未来三年不打算买房和打算买房的样本数分别为2052和660,各占总样本的75.7%和24.3%,不打算买房的仍占较大比例,但打算买房的比例低于总体比例;在外地户口的168户中,未来三年不打算买房和打算买房的样本数分别为109和59,各占总样本的64.9%和35.1%,未来三年不打算买房的仍占较大比例,但打算买房的比例高于总体比例。对未来三年不同的购房意向进行分析:在未来三年不打算买房的2161户样本中,本市户口和外地户口的家庭数是2052和109,分别占总样本的95.0%和5.0%,比例相差较为悬殊;在未来三年打算买房的719样本中,本市户口和外地户口家庭数分别为660和59,分别占总样本的91.8%和8.2%,比例差距仍较大。但应注意的是,本市户口和外地户口的样本量本身存在较大悬殊,因此这里的分析是存在一定问题的。这些分析可在图3-9中得到直观印证。从图表中的数据可以大致看出,本市户口中打算买房的比例低于总体比例,而在外地户口中打算买房的比例高于总体比例,户口状况对于未来三年是否打算购房的决定是有影响的。结合表3-11,由于显著性水平检验结果为0.00远小于0.05,因此应拒绝原假设,接受被择假设,认为户口状况与未来三年的购房计划是有联系的,互相影响的,即不同的户口状况对计划买房的看法是不一致的。2、通过探索分析分析户口状况与计划面积(分组后)的分布状况,为方便分析,现将计划面积进行分组,定义一个新变量“计划面积分组”,具体分组情况如下,55平米以下为1.00,56-95平米为2.00,96-136平米为3.00,136以上为4.00。分析结果如下:表3-17图3-10图3-11图3-12一般来讲,户口状况往往影响到人们的购房心理,会对人们的购房计划产生一定的影响。结合表3-17、图3-10和图3-11的对比以及图3-12来看,本市户口和外地户口的计划面积的均值分别为2.7296和2.5254,二者在数值上差异不大,通过盒须图可以看出,二者的分布都集中于2-3之中,虽然本市户口的计划面积均值与其上四分位点(约为3)几近一致,而外地户口的计划面积均值几近与其下四分位点(约为2)一致,但就均值而言,差异不大。因此户口状况对计划面积有一定影响的,但影响不大。为了进一步判断户口状况对计划面积的影响,我们进行双样本t检验。来判断以户口状况分组的计划面积均值是否存在显著差异,即对双样本的均值差异来源进行判断,推断其是由抽样误差造成的还是系统性的。检验结果如下:由表3-18可以看出,本市户口和外地户口的计划面积的样本平均值分别为101.9856和96.1356,二者存在一定的差距。由表3-19可知,两样本方差是否相等检验的结果为统计量F=0.366,对应的置信水平为0.545,大于显著性水平0.05,故接受原假设,认为两样本方差相等。因此采用双样本等方差t检验,自由度为830,计算的统计量t=31.467,对应的临界置信水平为0.143。计算的统计量t值对应的临界置信水平大于设置的置信水平0.05,因此接受原假设,认为本市户口与外地户口的计划面积均值没有显著差异。由此可见,盒须图中的微量的差异是抽样误差形成的。表3-18表3-19 3、通过探索分析分析婚姻状况与计划面积(分组后)的分布状况,分析结果如下:图3-13表3-20一般来说, 婚姻状况对住房计划的影响很大,通常结婚会使得住房条件改善,婚姻会使得在规划未来住房需求时倾向于更大的面积。然而从表3-20 中可以看出,已婚住户的计划面积均值为2.7038,而未婚的计划面积均值为2.8061,两者差异不大。由茎叶图3-14和图3-15的对比来看,已婚和未婚的计划面积均值相差不大,两茎叶图的分布情况也基本相同。通过盒须图3-13可以看出,已婚的和未婚的计划面积的平均数也几乎无差别,且最大值均为4.00,最小值均为1.00,分布均集中于2.00到3.00之间,因此可以看出婚姻状况对该区的住户对于未来购房面积的影响不显著。Stem-and-Leaf Plots图3-14图3-154、通过交叉列联表分析分析分析文化程度与计划面积(分组后)的分布状况,分析结果如下:表3-21表3-22列联表3-22反映了不同文化程度和计划面积(分组后)的交互影响情况。由表3-12知,在所调查的2993个样本中,有832个有效数据。在832个有效数据中分析二者的交互关系,其中167个为初中及以下文化程度,351个为高中(中专)文化程度,297个为大学(专、本科)文化程度,17个位研究生及以上的文化程度,分别占样本的20.1%、42.2%、35.7%、2.0%,可见高中(中专)文化程度的占多数;计划面积为1.00,2.00,3.00.4.00的样本数分别为27、285、418、102,分别占样本的3.2%、34.3%、50.2%、12.3%,可见计划面积为3.00的占较大比例。图3-16表3-23根据列联表3-22,对不同文化程度进行分析:在拥有初中及以下文化程度的167人中,计划面积为1.00,2.00,3.00,4.00的样本数分别为9、95、56和7,分别占总样本的5.4%、56.9%、33.5%和4.2%,计划面积为2.00所占的比例最大,低于总体比例3.00;在拥有高中(中专)文化程度的351人中,计划面积为1.00,2.00,3.00,4.00的样本数分别为17、137、170和27,分别占总样本的4.8%、39.0%、48.4%和7.7%,计划面积为3.00所占的比例最大,与总体比例大致持平;在拥有大学(专、本科)文化程度的297人中,计划面积为1.00,2.00,3.00,4.00的样本数分别为0、53、180和64,分别占总样本的0.0%、17.8%、60.6%和21.5%,计划面积为3.00所占的比例最大,与总体比例持平,且所占的百分比(60.6%)明显高于总体中计划面积为3.00所占的百分比(50.2%);在拥有研究生及以上文化程度的17人中,计划面积为1.00,2.00,3.00,4.00的样本数分别为1、0、12和4,分别占总样本的5.9%、0.0%、70.6%和3.9%,计划面积为3.00所占的比例最大,与总体比例3.00持平,但所占的百分比(70.6%)明显高于总体中计划面积为3.00所占的百分比(50.2%)。对不同计划面积进行分析:在计划面积为1.00的27个样本中,初中及以下、高中(中专)、大学(专、本科)、研究生及以上文化程度的人分别是9、17、0和1,分别占总样本的33.3%、63.0%、0.0%和5.9%,比例相差较为悬殊;在计划面积为2.00的285个样本中,初中及以下、高中(中专)、大学(专、本科)、研究生及以上文化程度的人分别是95、137、53和0,分别占总样本的33.3%、48.1%、18.6%和0.0%,比例相差较为悬殊;在计划面积为3.00的102个样本中,初中及以下、高中(中专)、大学(专、本科)、研究生及以上文化程度的人分别是56、170、180和12,分别占总样本的13.4%、40.7%、43.1%和2.9%,比例相差较为悬殊;在计划面积为4.00的102个样本中,初中及以下、高中(中专)、大学(专、本科)、研究生及以上文化程度的人分别是7、27、64和4,分别占总样本的20.1%、42.2%、35.7%和2.0%,比例相差还是很悬殊;但应注意的是,四种文化程度的的样本量本身存在较大悬殊,因此这里的分析是存在一定问题的。这些分析可在图3-16中得到直观印证。从图表中的数据可以大致看出,文化程度越高对于大面积的住房的计划需求也越高。结合表3-23,由于显著性水平检验结果为0.00远小于0.05,因此应拒绝原假设,认为文化程度与计划面积不是独立的,二者有联系,文化程度对计划面积有一定的影响,即不同文化文化程度的住户的计划面积不一样。5、通过均值比较分析从业状况与计划面积的分布状况,分析结果如下:从表3-24中可以看出,本次被调查的住户中,不同从业状况的居民的计划面积的均值差异较大,从事行政事业单位、私营企业、大专院校科研单位的计划面积均值较高,分别为112.8731平方米、105.7937平方米、110.4309平方米,三者均高于总体平均值101.5707平方米;国营企业、其它的计划面积均值次之,分别为96.3811平方米、93.8276平方米,计划面积均值最少的事失业居民,仅为91.6158平方米,但与国营企业、其它类的差异不明显,三者均低于总体的计划面积均值。可见不同从业状况对计划面积有很大的影响,即不同从业状况的计划面积均值是有差异的。这种差异可以在线性图3-17中直观的看出。表3-24图3-17四、变量间的相关分析相关分析是用来研究变量之间的相互关系的密切程度和变化趋势,并用适当的统计指标进行描述的分析方法。如果要把变量间相互关系用函数表达出来,用一个或多个变量的取值来估计另一个变量的取值,就需要用到后面的回归分析。而通过散点图这一相关分析最常用的工具,能够直观的观察出分析变量的相关关系,与相关分析的数量描述相结合以达到更为理想的分析效果。简单相关系数研究两变量间相关性,若还存在其他因素影响,其往往夸大变量间的相关性,不是两变量间相关强弱的真实体现。在还有其他变量影响的情况下,单纯利用简单相关系数来评价变量间的相关性是不准确的,需要在剔除其他相关
展开阅读全文