《现代社会调查方法》课件_10

上传人:考试不挂****2941... 文档编号:242965415 上传时间:2024-09-13 格式:PPT 页数:43 大小:484.50KB
返回 下载 相关 举报
《现代社会调查方法》课件_10_第1页
第1页 / 共43页
《现代社会调查方法》课件_10_第2页
第2页 / 共43页
《现代社会调查方法》课件_10_第3页
第3页 / 共43页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第十章 资料的统计分析,调查资料的分析是在调查资料审核和整理基础上进行的。,资料分析包括统计分析、,理论分析,。,统计分析,资料分析,理论分析,统计分析方法是一种定量分析。它是进行科学预测的重要方法。统计数据不是指单个的数据,而是由多个数据构成的数据集。单个数据显然用不着统计方法进行分析,我们也得不出任何规律,只有通过对数据集的统计才能探索内在规律。,观,察,问卷,访谈,12 22 99 86 489,如何使用各种统计表与统计图来描述一组数据的分组与分布情况,如何通过一组数据计算一些特征数,简缩数据,进一步显示与描述一组数据的全貌(集中情况、分散情况、分布特征),数据如何分组,收集方法,原始数据,表达形式,作 用,分析过程,(图示),统计分析的特点:,(,1,)统计分析要以定性分析为基础;,(,2,)统计分析方法必须和其他分析结合运用;,统计分析有一套专门的方法和技术。,单变量统计分析,统计分析,多变量统计分析,一、单变量统计分析,(单个问题的表格化分析),由一种变量的全部分数或观察值组成的一组或一批数据称为一个分布。单变量数据的描述统计就是对其分布情况进行说明。单变量描述统计包括集中量数分析、离散量数分析。,众数,集中趋势 中位数,平均数,单变量统计分析,四分位差,离散程度 全距,标准差,异众比率,集中量数分析(,P280,),集中量数就是代表数据分布集中趋势的量数。,集中量数分析指的是用一个典型值或代表值来反映一组数据的一般水平,或者说反映这组数据向这个典型值集中的情况。,最常见的集中量数有算术平均数,(,简称平均数,也称为均值,),、众数和中位数三种。,集中量数的作用:,说明某一个社会现象在一定历史条件下的一般水平和规模;,从空间上比较社会现象的数量规律;,对一定社会现象在不同时期的变化进行比较,以说明这些现象发展的趋势和规律;,分析社会现象之间的依存关系;,众数:是指一组数据中重复,次数最多的标志值。,1,、在单项分组数据资料中求众数,方法:用观察方法,A.1 3 5 6 7 7 8,B.1 3 4 6 7 8 8 9 9 9,C.2 2 4 5 6 6 6 6 9 12 15,D.1 3 4 5 5 5 6 7 8 8 8 8 10 25,平均数,标准差,中位数,四分位差,众数,异众比率,2,、在组距分组资料中求众数,方法:,组中值方法:,1.,采用观察法找出次数最多的组作为众数所在组;,2.,计算众数组的组中值即可。,计算众数的条件,(P283),中位数:是指将一列变量数值,按大小顺序排列出来,,处于中间位置的那个数。,中位数,(,M,d,),中位数,(,M,d,),,,又称中数,是频数分布上,50%,处的数值,即将观察总数一分为二的变量值。在这个值的两边各有相同个数的数据。当数据的个数为偶数时,取分布,50%,(最中心)处的两个数据的平均数作为中数。,方法:,1,、对未经分组的数据资料计算中位数(,P283,面),2,、对经过分组的数据资料计算中位数;,平均数:是指总体各个单位数值之和,除以总体单位数目之商。,平均数是一个表示某变量所有数值集中趋势或平均水平的统计量。它是市场调查中最常用的调查数据。,如调查,300,户居民的月均食品消费为,130,元, 这说明居民月均食品消费大多数集中在,130,元左右或平均水平为,130,元。,又如调查消费者对某一商品评价平均分为,8.5,分,则说明消费者对此商品评价大多数集中在,8.5,分左右,换言之,大部分消费者对商品印象良好。,1,、简单算术平均数,2,、加权算术平均数,3,、几何平均数,简单算术平均数,通常称平均数,又称均数或均值。英文为,Mean,,,故以,M,表示。如果是由变量,X,计算得来的就记为 (读,X,杠),现在一般都 以表示样本的平均数,以,U,表示总体的平均数。,算术平均数就是各个变量值相加求和再除以变量的总次数,。,=,=,简单算术平均数的计算方法,用原始数据计算平均数 。当一组数据个数不多时,可直接用原始数据来计算。,如某实验小组,10,人的实验成绩为,11,,,13,,,15,,,16,,,16,,,16,,,17,,,18,,,18,,,20,。其平均数为:,=,=,=,16,加权算术平均数,(,见,P286,面,),几何平均数,(,M,g,),是,n,个数据的连乘积开,n,次方的根。,常用作速率的集中量数,如学龄儿童人数的增加率、学校经费的增加率、阅读能力的进步率等。,M,g,=,中位数与平均数的比较,(,1,),平均数要求计算所有的数值,而中位数只用到数值的相对位置,一般说来平均数利用了更多的信息,更全面和准确,.,(,2,)平均数容易受到极端值的影响,中位数则不会受到这种影响,.,平均数是一种比中位数更为稳定的量度,它随样本的变化比较少,.,(,3,)当资料是定序,定类测量或者是有开口组的定距测量时,中位数能够拟补不足,.,离中量数分析,(P287),总体中各个标志值的差异程度。,离散量数分析,离散(中)量数分析,指的是用一个特别的数值来反映一组数据相互之间的离散(中)程度,.,即各组数据相对于平均数的差异程度(离中程度)。差异程度小,平均数的代表性高;差异程度大,代表性低。,它与集中量数一起分别从两个不同的侧面描述和揭示一组数据的分布情况,.,共同反映出资料分布的全面特征,同时它还对集中量数的代表性做出补充说明,.,常见的离散量数统计量有全距,标准差,异众比率,和四分位差,.,全距(,R,),全距也叫极差,它是一组数据中,最大值与最小值之差,.,它是表示数据分布离散程度最简单的方式,即一组数据中最大数与最小数差,故称两极差。,R,=,X,max,-,X,min,当数据较多时,应用频数分布表求全距。其方法为:最大组与最小组的组中值之差或最大组上限与最小组下限之差。,R=,X,cmax,-X,cmin,R=,U,max,-L,min,R= 98,(,最大值), 43,(最小值),= 55,求全距,步 骤,标准差分析,标准差是表示一组数据中各个数值与平均数的离散趋势。具体一点说,标准差越大,说明各个数值彼此之间的差异就越大,各个数值距离平均数这个中心的离散趋势也越大。标准差越小,说明各个数值之间差异就小,各个数值与平均数的离散趋势小。,标准差,标准差,:,一组数据对其平均数的偏差平方的算术平均数的平方根。一般以,S,(,或 来表示 ),S,=,=,例如,要调查居民人均月购买副食品的状况,从甲、乙两个街道各抽选户调查,调查数据如下:,甲街道:,75,元、,80,元、,82,元、,85,元、,78,元,乙街道:,90,元、,60,元、,100,元、,40,元、,110,元,通过计算,这两个街道的居民人均月购买副食品都是,80,元。我们再来计算它们的标准差分别为,3.8,和,29.2,。,甲街道的抽样标准差为,3.8,,乙街道抽样的标准差为,29.2,,乙街道抽样标准差明显高于甲街道抽样标准差。这说明乙街道,5,户居民之间购买副食品额差异大, 它们与平均数这一中心差距大,即离散趋势大。而甲街道,5,户居民之间购买副食品额差异较小,它们与平均数这一中心差距也小即离散趋势也小。,例,1,:某校三个系各选,5,名同学,参加智力竞赛,他们的成绩分别如下:,中文系:,78 79 80 81 82,数学系:,65 72 80 88 95,英语系:,35 78 89 98 100,平均成绩,=80,标准差:一组数据对其平均数的偏差平方的算术平均数的平方根。,S,(,中文系),=1.414,(分),S,(,数学系),=10.8,(分),S,(,英语系),=23.8,(分),S,=,异众比率:,指非众数的次数与全部变量值总次数的比率。,异众比率越小,众数的代表性越大。,四分位差,把一组数据按大小排列成序列,然后分成四个数据数目相等的段落,各段落分界点上的数,叫四分位数。(即每组占,25,),舍去资料中数值最高的,25,和最低的,25,,仅就中间,50,数据求其量数作为离中量数,就是四分位差。,四分位差之间的间距越小,中位数的代表性越大。,Q=Q3-Q1,离散系数,离散系数是一种相对的离散量数统计量,它使我们能够对同一总体中的两种不同的离散量数进行比较,或者对两个不同总体中的同一离散量数进行比较。,离散系数的定义是:标准差与平均数的比值,用百分比表示。,CV=S/X,CV,= 100,例,1,:一项调查得到下列结果,某市人均平均收入为,92,元,标准差为,17,元,人均住房面积,7.5,平方米,标准差为,1.8,平方米。试比较该市人均收入和人均住房情况哪一个差异程度比较大。,解,人均收入的离散系数为,CV=S/,100%=18.5%,人均住房面积的离散系数为,CV=1.8/7.5,100%=24%,例,2,:对广州和武汉两地居民生活质量调查发现,广州居民平均收入为,680,元,标准差为,120,元;武汉居民平均收入为,360,元,标准差为,80,元。问广州居民相互之间的差异程度,与武汉居民相互之间在收入上的差异程度哪一个更大一些?,解,广州居民收入的离散系数为,CV=120/680 100%=17.6%,武汉居民收入的离散系数为,CV=80/360 100%=22.2%,目前,我国各类学校招考新生和对学生进行学习成绩考查评定的主要手段是考试。而对考试成绩的评分一般是用百分制来表示,并用各科成绩相加按总分来决定被试者的优劣取舍。这种做法开来似乎公平,实际上很不合理。因为各科试题的难易程度不同,造成评分标准的宽严不一,因此各科考试成绩的统计量数,,如平均数、标准差也不相等。我们不能说语文的考分,80,分等价于数学的考分的,80,分,也不能说英语考分,75,分等价于物理的考分,75,分,,在这种情况下,把考生的各科考分等量齐观地相加起来,凭个考生的总分来决定优劣取舍,显然是十分不合理的。科学的方法,就是把考生是各科分数,经过一个标准化的转化过程,把每个考生的各科分数变成标准分数,然后再进行相加和比较。,甲乙两位考生七科分数的标准化表,二、多问题和多因素的综合分析,横列表法,多变量统计分析,(几组变量之间的相关关系),多变量统计分析,是指根据某一变量分组,计算另一变量的统计量分析。例如,我们对消费品商品评价进行单变量统计分析,求出评价平均分和标准差。在进一步统计分析中,我们想进一步了解不同职业的消费者对商品评价打分各是多少,评价的标准差又是多少,这就需要作多变量统计分析。,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!