信息分析与决策Chapert32数据的特征分析与描述课件

上传人:29 文档编号:252237071 上传时间:2024-11-13 格式:PPTX 页数:48 大小:559.25KB
返回 下载 相关 举报
信息分析与决策Chapert32数据的特征分析与描述课件_第1页
第1页 / 共48页
信息分析与决策Chapert32数据的特征分析与描述课件_第2页
第2页 / 共48页
信息分析与决策Chapert32数据的特征分析与描述课件_第3页
第3页 / 共48页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2020-12-24,#,第,3,章 数据的特征与描述,(2),第3章 数据的特征与描述(2),1,3.7,交叉分组下的频数分析,通过基本的频数分析能够掌握单个变量的数据分布情况。但在实际分析中,不仅需要了解单变量的分布特征,常常,需要分析多个变量不同取值下的分布,掌握多变量的联合分布特征,,从而进一探讨变量之间的互相影响和关系。,3.7交叉分组下的频数分析 通过基本的频数分,2,3.7,交叉分组下的频数分析,Ex,:对居民储蓄问题的分析,Data:“,居民储蓄调查数据,.sav”,分析任务:,分析,不同特征的储户群(,如,城镇储户和农村储户)对调查问题的态度,储户特征和所调查问题之间,的关系。,3.7 交叉分组下的频数分析Ex:对居民储蓄问题的分析,3,3.7,交叉分组下的频数分析,交叉分组下的频数分析,又称为,列联表,Crosstabulation,分析,两大基本任务:,根据收集到的数据产生二维或多维的交叉列联表,.,在交叉列联表的基础之上,对两两变量间是否存在一定的相关性进行分析。,3.7 交叉分组下的频数分析交叉分组下的频数分析又称为列联表,4,3.7,交叉分组下的频数分析,命令,:,Analyze,DescriptiveStatistic,Crosstabs,3.7 交叉分组下的频数分析命令:,5,3.7,交叉分组下的频数分析,结果:,二维的交叉列联表,观察频数和各种百分比,总户数,282,282,户中,城镇户口为,200,,农村户口为,82,,构成的分布为交叉列联表的,列边缘分布,61,175,46,为,行边缘分布,,为认同未来收入增加,基本不变,减少的人的频数统计值,3.7 交叉分组下的频数分析结果:二维的交叉列联表观察频数和,6,3.7,交叉分组下的频数分析,18,41,23,为,在农村户口中,,认同未来,收入增加,基本不变,减少,的户数的频数分布。由于频数不利于交叉分组下的分布比较,引进了相应的百分比。,认为未来收入会增加的,61,户,中,城镇户口为,43,户,,农村户口占,18,户,,这一分布被称为交叉列联表的,条件分布,。即在行或列的取值条件下的分布。,3.7 交叉分组下的频数分析18,41,23为在农村户口中,,7,3.7,交叉分组下的频数分析,21.5%,为,200,户城镇人口中认同未来收入会增加的人所占的百分比,为,行百分比,70.5%,为认同未来收入会增加的,61,户中,城镇人口所占的百分比。为,列百分比,15.2%,为认同收入增加的城镇人口,43,户占总户数,282,的百分比,称为,总百分比。,3.7 交叉分组下的频数分析21.5%为200户城镇人口中,8,3.7,交叉分组下的频数分析,分析:城镇和农村储户对“未来两年内收入状况的变化趋势”是否持相同的态度?,3.7 交叉分组下的频数分析分析:城镇和农村储户对“未来两年,9,3.7,交叉分组下的频数分析,在所调查的,282,个样本中,城镇户口,200,,农村户口,82,,分别占总样本的,70.9%,和,29.1%,,可见,城镇户口占多数,。认为未来收入会增加,基本不变,减少的样本数分别为,61,,,175,46,,各占样本的,21.6%,,,62.1%,,,16.3%,,因此认为,未来收入基本不变的占较大的比例,。,3.7 交叉分组下的频数分析在所调查的282个样本中,城镇户,10,3.7,交叉分组下的频数分析,在城镇储户,(200),中,认为未来收入会增加,基本不变,减少的样本数分别为,43,134,23,,占总样本比例为,21.5%,,,67%,,,11.5%,,,认为未来收入不变的占较大比例,。,农村户口中,82,户,样本数分别为,18,41,23,,各占总样本,(82),的,22.0%,50.0%,28%,这说明,认同未来收入不变的仍占较大比例,但认为未来收入会减少的比例高于会增加的比例,。,对不同类储户进行分析,3.7 交叉分组下的频数分析在城镇储户(200)中,认为未来,11,3.7,交叉分组下的频数分析,在认为未来收入会减少的的,46,个样本中,城镇储户和农村储户均为,23,,各占,50%,。比例相当。,在认为未来收入会增加的样本,(61),中,城镇户口和农村户口分别为,43,18,,百分比为,70.5%,和,29.5%,,,比例相差较大,。,对不同看法进行分析,在认为基本不变的,175,个样本中,城镇储户和农村储户分别为,134,和,41,,各占总样本,(175),的,76.6%,和,23.4%,,,比例差距进一步加大。,3.7 交叉分组下的频数分析在认为未来收入会减少的的46个样,12,3.7,交叉分组下的频数分析,分析总结:,总体上讲,,较大部分储户认为未来收入会基本不变,且认为收入会增加的比例高于会减少的比例,;城镇储户中认为收入会增加的比例高于会减少额比例,(70.5%50%),但农村储户认为收入会增加的比例低于减少的比例,(29.5%50%).,可见,,城镇和农村储户在对该问题的看法上存在分歧,。,3.7 交叉分组下的频数分析分析总结:,13,3.7,交叉分组下的频数分析,上述分析,在分组展示的,Bar,图中得到直观的印证。,选中,显示分组的,Bar,图,3.7 交叉分组下的频数分析上述分析,在分组展示的Bar图中,14,3.7,交叉分组下的频数分析,多维的交叉列联表,Ex,:,职工基本情况数据的交叉列联分析,Data:,“数据加工职工数据,.sav,”,命令:,Analyze,DescriptiveStatistic,Crosstabs,3.7 交叉分组下的频数分析多维的交叉列联表,15,3.7,交叉分组下的频数分析,性别变量定义为层变量,Layer,,生成一张涉及,三变量的三维的交叉列联表,。反映不同性别和不同职称以及不同文化程度交叉分组下职工频数分布情况。,3.7 交叉分组下的频数分析 性别变量定义为,16,3.7,交叉分组下的频数分析,3.7 交叉分组下的频数分析,17,3.8,多重反应分析,SPSS,的多重反应分析,(Multiple Response),又称为,多选项分析,,主要是,针对问卷调查的多选问题,。,多选问题在问卷调查中普遍存在,要求被调查者从高问卷中给出的若干个可选答案中选择,1,个以上的答案。但,SPSS,变量每个变量只对应一个值,因此出现多个选项答案时,要特别处理。,3.8 多重反应分析 SPSS 的多重反应分析,18,3.8,多重反应分析,处理方法,二分法,Multiple Dichotomies Method,分解问题,将多选项问题中的每个答案看成一个,0/1,变量,分别表示,是否,选择了答案。,3.8 多重反应分析处理方法,19,Ex:,某商业公司在进行消费者偏好调查中,为分析消费者消费倾向性,设计了以下问题:,Q-,请按次数选择您经常购买物品的场所:,超市,(2),大型商店,(3),专卖店,网购,(5),不固定,这是一个多选问题,二分法将其分解为,5,个小问题,设置,5,个相应的,0/1,变量。,Ex:某商业公司在进行消费者偏好调查中,为分析消费者消费倾,20,变量名,Name,标签,Lable,Value,S1,经常去超市购物吗?,0/1,S2,经常去大型商场购物吗?,0/1,S3,经常去专卖店购物吗?,0/1,S4,经常网购吗?,0/1,S5,购物场所不固定吗?,0/1,如果一个消费者选择了超市,大型商场和网购,则,S1,,,S2,,,S4,的取值为,1,,其余变量为,0,。,利用二分法解决问卷中多选项问题的统计。,变量名Name标签LableValueS1经常去超市购物吗?,21,3.8,多重反应分析,处理方法,分类法,Multiple Category Method,基本思想:,估计多选项问题最多可能出现的答案数,,然后为每个答案定义一个变量,,变量的取值为备选答案,。,3.8 多重反应分析处理方法,22,3.8,多重反应分析,Ex,:某地区高三学生的高考志愿调查中,为分析学生填报志愿的倾向性,设计了如下问题:,Q,:按照你的志愿,请按顺序依次选择你打算报考的三所大学:,北京大学,(2),清华大学,(3),中国人民大学,(4),北京师范大学,(5),北京航空航天大学,(6),北京外国语大学,3.8 多重反应分析Ex:某地区高三学生的高考志愿调查中,为,23,3.8,多重反应分析,根据问题要求,采用分类法设置三个,SPSS,变量,如下定义,SPSS,变量名,Lable,Value,V1,志愿一,1/2/3/4/5/6,V2,志愿二,1/2/3/4/5/6,V3,志愿三,1/2/3/4/5/6,若某考生选择了北大,清华和北航,则变量,V1,V2,V3,依次取值,1,2,5.,3.8 多重反应分析根据问题要求,采用分类法设置三个SPSS,24,分析案例,实例:消费者购物场所的调查,Data,:,response.sav,45,名消费者调查进场购物场所的结果。,年龄:,1-,中老年人,,2-,青年人,性别:,1-,男性,,2-,女性,六个备选答案,每个设置了一个变量,分析案例实例:消费者购物场所的调查,25,分析案例,操作:,Step-1,定义多重数据集,Analyze,Multiple ResponseDefine Sets,二分法分解,将定义好的多选项变量集加入到,Mult Response Sets,中,分析案例操作:二分法分解将定义好的多选项变量集加入到Mult,26,分析案例,Step-2,多选项频数分析,Analyze,Multiple Response,Frequencies,分析案例Step-2 多选项频数分析,27,分析案例,结果:,从频数表中看出,,45,份的调查表中,选择在不同场所购物有,136,次,其中选择经常在超市购物游,16,人,网购,29,人,说明调查人员中,网购已逐渐成为主流。,分析案例结果:从频数表中看出,45份的调查表,28,分析案例,Step-3,多重反应,列联表,分析,Multiple Response Crosstabs,Analyze,Multiple ResponseCrosstabs,分析案例Step-3 多重反应列联表分析,29,分析案例,分析结果,可以得到不同年龄层次人对不同购物方式选择的各种百分比。数据表明,76.5%,的老年人会选择在专卖店购物,,体现他们对品牌的信赖。,58%,的老年人趋向于超市或批发市场,网上购物则只有,41.2%,。,而年青人网购的比例达到,78.8%,,成为购物主要方式。,分析案例分析结果可以得到不同年龄层次人对不同购物方式选择的各,30,分析案例,分析结果,从表中可以看出不同年龄结构的被访者对选择购物场所的态度,,超市的,购物人群中,中老年人占较大比重,62.5%,,年青人只占,37.5%,。,而,网购的人员构成中,年轻人占到,75.9%,,,体现出年轻人追赶时尚的趋势。,整体分析中,年青人占购物群体的主体,62.2%,在购物场所的选择方面,,网购比例占到,64.4%,,逐渐成为购物的主流方式,。,分析案例分析结果 从表中可以看出不同年龄结构,31,3.9,探索性分析,探索性分析是指对数据的探索和考察。,通过对数据的分析,,寻求和确定适合所研究问题的统计方法,。,SPSS,的数据探索过程,Explore,是解决此类问题的有效方法。,3.9 探索性分析 探索性分析是指对数据的探索,32,3.8,探索性分析,探索过程提供了很多关于,数据的概括分析和图表直观描述的方法,,不仅对个案数据有效,而且还可以针对,分组个案,。探索过程的因变量必须是,定距型变量,,分组变量可为,定序或名义级变量,。,3.8 探索性分析 探索过程提供了很多关于,33,3.8,探索性分析,对数据进行初步的考察,考察数据中是否有明显不合理的数值,通常是过大或过小的,极端值,Extreme values,以及不符合现实的,离群点,outlier
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!