社会调查方法与统计课件

上传人:94****0 文档编号:241506914 上传时间:2024-06-30 格式:PPT 页数:44 大小:213.27KB
返回 下载 相关 举报
社会调查方法与统计课件_第1页
第1页 / 共44页
社会调查方法与统计课件_第2页
第2页 / 共44页
社会调查方法与统计课件_第3页
第3页 / 共44页
点击查看更多>>
资源描述
社会调查方法与统计张凯天津师范大学政治与行政学院应用社会学系.社会调查方法与统计张凯.1第九讲资料的统计分析.第九讲资料的统计分析.2本讲内容安排n n一、频数分布与频率分布n n二、集中趋势分析n n三、离散趋势分析.本讲内容安排一、频数分布与频率分布.3一、频数分布与频率分布.一、频数分布与频率分布.41.频数分布n n频数分布(频数分布(frequency distributionfrequency distribution)是指一组数据中取不同值的个案的次数分布情况,它是指一组数据中取不同值的个案的次数分布情况,它一般以频数分布表的形式表达。一般以频数分布表的形式表达。n n频数分布表的作用频数分布表的作用一是简化资料,将调查所得到的一长串原始数据,以一是简化资料,将调查所得到的一长串原始数据,以一个十分简洁的统计表反映出来。一个十分简洁的统计表反映出来。二是从频数分布表中,我们可以更清楚地了解调查数二是从频数分布表中,我们可以更清楚地了解调查数据的众多信息。据的众多信息。.1.频数分布频数分布(frequency distribu5表 9-1 某班学生父亲职业的频数分布表n某班有20名学生,我们通过对他们的父亲的职业情况进行调查,得到下列结果:工人、工人、工人、工人、干部、干部、干部、干部、干部、干部、教师、教师、教师、商人、商人、商人、商人、商人、农民、农民。职业类别人数工人4干部6教师3商人5农民2合计20.表 9-1 某班学生父亲职业的频数分布表某班有20名学生,62.频率分布n n频率分布(频率分布(percentages distributionpercentages distribution)是一组数据中不同取值的频数相对于总数的比率分布是一组数据中不同取值的频数相对于总数的比率分布情况,这种比率在社会调查中经常是以百分比的形式情况,这种比率在社会调查中经常是以百分比的形式来表达。来表达。n n频率分布表与频数分布表频率分布表与频数分布表频数表是不同类别在总体中的绝对数量分布,而频率频数表是不同类别在总体中的绝对数量分布,而频率分布表则是不同类别在总体中的相对数量分布(相对分布表则是不同类别在总体中的相对数量分布(相对比重)。比重)。n n正是由于这一特点,频率分布表除具备频数分布表的优点外,正是由于这一特点,频率分布表除具备频数分布表的优点外,还有一个十分重要的优点,这就是它十分方便地用于不同总体还有一个十分重要的优点,这就是它十分方便地用于不同总体或不同类别之间的比较。因此,这种分布表的应用更为普遍。或不同类别之间的比较。因此,这种分布表的应用更为普遍。.2.频率分布频率分布(percentages distri7表 9-2 某班学生父亲职业的频率分布表n某班有20名学生,我们通过对他们的父亲的职业情况进行调查,得到下列结果:工人、工人、工人、工人、干部、干部、干部、干部、干部、干部、教师、教师、教师、商人、商人、商人、商人、商人、农民、农民。职业类别比例(%)工人20干部30教师15商人25农民10合计100(n=20).表 9-2 某班学生父亲职业的频率分布表某班有20名学生,8例题 1n n某班有10名学生,其年龄如下:20岁、19岁、18岁、19岁、18岁、20岁、21岁、17岁、18岁、18岁。请做出关于该班学生的年龄分布的频数表和频率表。.例题 1某班有10名学生,其年龄如下:20岁、19岁、18岁9表 9-3 某班学生年龄的频数分布年龄(岁)学生人数171184192202211合计10.表 9-3 某班学生年龄的频数分布年龄(岁)学生人数17110表 9-4 某班学生年龄的频率分布年龄(岁)比例(%)17101840192020202110合计100(n=10).表 9-4 某班学生年龄的频率分布年龄(岁)比例(%)1711二、集中趋势分析.二、集中趋势分析.12n n集中趋势分析(集中趋势分析(Central Tendency AnalysisCentral Tendency Analysis)是指用一个典型值或代表值来反映一组数据的一般水是指用一个典型值或代表值来反映一组数据的一般水平,或者说反映这组数据向这个典型值集中的情况。平,或者说反映这组数据向这个典型值集中的情况。n n常见的集中趋势分析常见的集中趋势分析平均数(均值)平均数(均值)众数众数中位数中位数.集中趋势分析(Central Tendency Analys131.平均数n n平均数(平均数(MeanMean)总体各单位数值之和除以总体单位数目所得之商。总体各单位数值之和除以总体单位数目所得之商。n n计算公式计算公式.1.平均数平均数(Mean).14例题 2n n某班有10名学生,其年龄如下:20岁、21岁、19岁、19岁、20岁、20岁、21岁、22岁、18岁、20岁,求他们的平均年龄。.例题 2某班有10名学生,其年龄如下:20岁、21岁、19岁15(1)单值分组数据的均值n n如果是单值分组资料,那么,计算平均数时首先如果是单值分组资料,那么,计算平均数时首先要将每一个变量值乘以所对应的频数要将每一个变量值乘以所对应的频数f f,得出各,得出各组的数值之和,然后将各组的数值之和全部相加,组的数值之和,然后将各组的数值之和全部相加,最后除以单位总数(即各组频数之和)。最后除以单位总数(即各组频数之和)。.(1)单值分组数据的均值如果是单值分组资料,那么,计算平均数16例题 3n n调查某年级调查某年级150150名学生名学生的年龄,得到表的年龄,得到表 9-5 9-5 所所示的结果,求平均年示的结果,求平均年龄。龄。年龄(岁)人数17101825195020402120225合计150表 9-5 某年级学生的年龄分布.例题 3调查某年级150名学生的年龄,得到表 9-5 所示的17(2)组距分组数据的均值n n组中值组中值组中值=(组上限(组上限+组下限)组下限)2 2n n当组中值为小数时,通常采取四舍五入的办法将其当组中值为小数时,通常采取四舍五入的办法将其化为整数后再计算。化为整数后再计算。.(2)组距分组数据的均值组中值.18例题 4n n调查某大学调查某大学100100名学生勤工助学的收入,得到表名学生勤工助学的收入,得到表9-9-6 6所示的资料,计算他们的平均收入。所示的资料,计算他们的平均收入。表表 9-6 9-6 某大学某大学100100名学生勤工助学收入的分布名学生勤工助学收入的分布收入(元)学生数(人)组中值f X10019910150150020029910250250030039940350140004004992045090005005992055011000合计10038000.例题 4调查某大学100名学生勤工助学的收入,得到表9-6所192.众数n n众数(众数(ModeMode)众数是一组数据中出现次数最多(即频数最高)的那众数是一组数据中出现次数最多(即频数最高)的那个数值。个数值。n n众数的确定众数的确定在单值分组资料中,最大频数对应的数值即众数。在单值分组资料中,最大频数对应的数值即众数。n n(在表(在表9-39-3中,众数为中,众数为1818岁。)岁。)在组距分组资料中,最大频数对应的分组的组中值即在组距分组资料中,最大频数对应的分组的组中值即众数。众数。n n(在表(在表9-69-6中,众数为中,众数为350350元。)元。).2.众数众数(Mode).203.中位数(Median)n n中位数(中位数(MedianMedian)的定义)的定义把一组数据按值的大小顺序排列起来,处于中央位置把一组数据按值的大小顺序排列起来,处于中央位置的那个数值就叫中位数。的那个数值就叫中位数。n n中位数的适用范围中位数的适用范围中位数所描述的是定序变量以上层次的变量。中位数所描述的是定序变量以上层次的变量。n n中位数的含义中位数的含义整个数据中,有一半数据的值在它之上(比它大),整个数据中,有一半数据的值在它之上(比它大),另一半数据的值在它之下(比它小)。另一半数据的值在它之下(比它小)。n n中位数的位置中位数的位置(n+1n+1)2 2n nn n为数据个数为数据个数.3.中位数(Median)中位数(Median)的定义.21例题 5n n调查5个学院的学生人数,按规模由小到大以此为200人、300人、500人、800人、1000人,求中位数。n n解:其中间位置为(其中间位置为(5+15+1)2=32=3,即第三个学院所,即第三个学院所对应的数值对应的数值500500为中位数。为中位数。.例题 5调查5个学院的学生人数,按规模由小到大以此为200人22n n当数据为偶数个时,中位数的位置处于中间两个数值之间,而没有直接对应的数值。此时一般以中间这两个数值的平均数作为中位数。.当数据为偶数个时,中位数的位置处于中间两个数值之间,而没有直23例题 6n n调查6个学院的学生人数,按规模由小到大以此为200人、300人、500人、800人、1000人、1200人,求中位数。n n解:中间位置为(中间位置为(6+16+1)2=3.5 2=3.5,即中间位置处在,即中间位置处在第三个和第四个学院之间,中位数所对应的数第三个和第四个学院之间,中位数所对应的数值为(值为(500+800500+800)2=650 2=650 人。人。.例题 6调查6个学院的学生人数,按规模由小到大以此为200人24单值分组数据的中位数n n当资料为单值分组数据时,也是先求出数据组的中间位置,然后再找出其对应值。n n以例题3 表9-5数据为例.单值分组数据的中位数当资料为单值分组数据时,也是先求出数据组25例题 3n n调查某年级调查某年级150150名学生名学生的年龄,得到表的年龄,得到表 9-5 9-5 所所示的结果,求平均年示的结果,求平均年龄。龄。年龄(岁)人数17101825195020402120225合计150表 9-5 某年级学生的年龄分布.例题 3调查某年级150名学生的年龄,得到表 9-5 所示的26n n先由公式计算中间位置:(n+1n+1)2=2=(150+1150+1)2=75.52=75.5n n即中间位置落在第即中间位置落在第7575个与第个与第7676个数值之间。个数值之间。n n为了找到这个数值,需要先列出累计频数。累计频数的计算既可以从上到下,也可以从下到上(见表9-7中的第三、第四两栏)。.先由公式计算中间位置:.27表 9-7 例题3的累计频数年龄(岁)人数(频数)累计频数累计频数1710101501825351401950851152040125652120145252251505合计150n列出累计频数后,我们从上往下找(或者从下往上找),看看中间位置最先落在哪一累计频数内。在本例中,无论按哪种方式寻找,中间位置75.5总是最先落入人数为50的那一行。这一行对应的19岁即所求中位数。.表 9-7 例题3的累计频数年龄(岁)人数(频数)累计频284.平均数与中位数的比较n n(1 1)平均数对数据总体的描述和反映,在一般情)平均数对数据总体的描述和反映,在一般情况下比中位数更加全面和准确。况下比中位数更加全面和准确。计算平均数时要求用到数据中所有的数值,而求中位计算平均数时要求用到数据中所有的数值,而求中位数时只用到数值的相对位置,因而平均数比中位数利数时只用到数值的相对位置,因而平均数比中位数利用了更多的有关数据的信息。用了更多的有关数据的信息。n n(2 2)平均数非常容易受到极端值的变化的影响,)平均数非常容易受到极端值的变化的影响,而中位数则不会受到这种影响。而中位数则不会受到这种影响。当样本中数据值的分布是高度偏斜的,即在一个方向当样本中数据值的分布是高度偏斜的,即在一个方向上有较多的极端个案,中位数一般总是比平均数更适上有较多的极端个案,中位数一般总是比平均数更适合一些。合一些。.4.平均数与中位数的比较(1)平均数对数据总体的描述和反映29n n(3 3)对于抽样调查来说,平均数是一种比中位数)对于抽样调查来说,平均数是一种比中位数更为稳定的量度,它随样本的变化比较小。更为稳定的量度,它随样本的变化比较小。即对于从同一总体中、采用同一方式抽出的、同样规即对于从同一总体中、采用同一方式抽出的、同样规模的不同样本来说,它们的平均数相互之间的差别,模的不同样本来说,它们的平均数相互之间的差别,往往比它们的中位数相互之间的差别要小一些。往往比它们的中位数相互之间的差别要小一些。n n(4 4)与中位数相比,平均数比较容易进行算术运)与中位数相比,平均数比较容易进行算术运算。算。这是因为,平均数所要求的是定距层次以上的变量,这是因为,平均数所要求的是定距层次以上的变量,而中位数所要求的是定序层次以上的变量。而中位数所要求的是定序层次以上的变量。.(3)对于抽样调查来说,平均数是一种比中位数更为稳定的量度,30三、离散趋势分析.三、离散趋势分析.31例题 7n n某校3个系各选5名同学参加知识竞赛,他们的成绩分别为:中文系:中文系:7878、7979、8080、8181、82 82 平均数平均数=80=80数学系:数学系:6565、7272、8080、8888、95 95 平均数平均数=80=80英语系:英语系:3535、7878、8989、9898、100 100 平均数平均数=80=80.例题 7某校3个系各选5名同学参加知识竞赛,他们的成绩分别为32离散趋势分析(Dispersion Tendency Analysis)n n离散趋势分析是指用一个特别的数值来反映一组离散趋势分析是指用一个特别的数值来反映一组数据相互之间的离散程度。数据相互之间的离散程度。它与集中趋势分析一起,分别从两个不同的侧面描述它与集中趋势分析一起,分别从两个不同的侧面描述和揭示一组数据的分布情况,共同反映出资料分布的和揭示一组数据的分布情况,共同反映出资料分布的全面特征。全面特征。n n常见的离散量数统计量有全距、标准差、异众比常见的离散量数统计量有全距、标准差、异众比率、四分位差等。率、四分位差等。其中,标准差、异众比率、四分位差分别与平均数、其中,标准差、异众比率、四分位差分别与平均数、众数、中位数相对应,判定和说明后三者代表性的大众数、中位数相对应,判定和说明后三者代表性的大小。小。.离散趋势分析(Dispersion Tendency An331.全距(Range)n n定义定义全距又叫极差,它是一组数据中最大值与最小值之差。全距又叫极差,它是一组数据中最大值与最小值之差。n n意义意义一组数据的全距越大,在一定程度上说明这组数据的一组数据的全距越大,在一定程度上说明这组数据的离散量数越大,而集中量数统计量的代表性越低。离散量数越大,而集中量数统计量的代表性越低。n n以例题以例题7 7为例,为例,3 3个代表队成绩的全距分别为:个代表队成绩的全距分别为:中文系:中文系:828278=478=4(分)(分)数学系:数学系:959565=3065=30(分)(分)英语系:英语系:10010035=6535=65(分)(分).1.全距(Range)定义.342.标准差(Standard Deviation)n n定义一组数据对其平均数的偏差平方的算术平均数一组数据对其平均数的偏差平方的算术平均数的平方根。的平方根。n n计算公式n n例题7中,S S(中文系)(中文系)=1.414=1.414(分)(分)S S(数学系)(数学系)=10.8=10.8(分)(分)S S(英语系)(英语系)=23.8=23.8(分)(分).2.标准差(Standard Deviation)定义.35单值分组数据的标准差n n例例 6 6 调查调查200200户家庭的户家庭的规模,得到如规模,得到如 表表 9-9 9-9所所示资料,求其标准差。示资料,求其标准差。家庭规模户数2人103人1204人505人20合计200表 9-9 200户家庭资料.单值分组数据的标准差例 6 调查200户家庭的规模,得到如363.异众比率(Variation Ratio)n n定义异众比率是指一组数据中非众数的次数相对于异众比率是指一组数据中非众数的次数相对于总体全部单位的比率。总体全部单位的比率。n n意义是指众数所不能代表的其他数值(即非众数的是指众数所不能代表的其他数值(即非众数的数值)在总体中的比重。数值)在总体中的比重。n n因此,当异众比率越大,即众数所不能代表的其他因此,当异众比率越大,即众数所不能代表的其他数值在总体中的比重越大时,众数在总体中所占的数值在总体中的比重越大时,众数在总体中所占的比重自然就越小,这样,众数的代表性就越小。比重自然就越小,这样,众数的代表性就越小。.3.异众比率(Variation Ratio)定义.37n n异众比率的计算异众比率的计算以表以表 9-5 9-5 的数据为例的数据为例年龄(岁)人数17101825195020402120225合计150表 9-5 某年级学生的年龄分布.异众比率的计算年龄(岁)人数1710182519502040384.四分位差(Inter-quartile Range)n n定义四分位差是先将一组数据按大小排列成序,然四分位差是先将一组数据按大小排列成序,然后将其四等分,去掉序列中最高的后将其四等分,去掉序列中最高的1/41/4和最低的和最低的1/41/4后,中间的一半数值之间的全距。后,中间的一半数值之间的全距。n n四分位差的符号用Q表示。.4.四分位差(Inter-quartile Range)定39例题 8n n调查11位同学的年龄如下:17岁、18岁、18岁、19岁、19岁、19岁、20岁、20岁、21岁、21岁、22岁、22岁,求其四分位差。.例题 8调查11位同学的年龄如下:17岁、18岁、18岁、1405.离散系数(Coefficient of Variation)n n定义离散系数也称变差系数,它是标准差与平均差离散系数也称变差系数,它是标准差与平均差的比值。的比值。n n离散系数用百分比表示,记为CV。.5.离散系数(Coefficient of Variati41例题 9n n一项调查得到下列结果,某市人均月收入为920元,标准差为170元,人均住房面积7.5平方米,标准差1.8平方米。请比较该市人均收入和人均住房情况哪一个差异程度比较大。.例题 9一项调查得到下列结果,某市人均月收入为920元,标准42例题 10n n对广州和武汉两地居民生活质量调查发现,广州居民平均收入为6800元,标准差为1200元;武汉居民平均收入为3600元,标准差为800元。请问广州居民相互之间在收入上的差异程度,与武汉居民相互之间在收入上的差异程度哪一个更大一些?.例题 10对广州和武汉两地居民生活质量调查发现,广州居民平均43THE END.THE END.44
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!