社会统计学卢淑华第4版课件

上传人:29 文档编号:241575626 上传时间:2024-07-05 格式:PPTX 页数:77 大小:1.05MB
返回 下载 相关 举报
社会统计学卢淑华第4版课件_第1页
第1页 / 共77页
社会统计学卢淑华第4版课件_第2页
第2页 / 共77页
社会统计学卢淑华第4版课件_第3页
第3页 / 共77页
点击查看更多>>
资源描述
第2章 单变量描述统计分析第1节 统计分组单项式分组组距式分组统计分组按数量标志分组等距、不等距重合、不重合按品质标志分组第第2章章 单变单变量描述量描述统计统计分析第分析第1节节 统计统计分分组单项组单项式分式分组组组组距式分距式分1一、分布(distribution)变量各种可能取值及其出现的次数或频次,又称频次分布。频数、频次、次数(frequency)一、分布(一、分布(distribution)变变量各种可能取量各种可能取值值及其出及其出现现2二、统计表表2.5 家庭结构的频次分布家庭结构频次百分比(%)核心家庭105049.30 直系家庭72033.80 联合家庭1105.16 其他25011.74 总数2130100.00 二、二、统计统计表表表表2.5 家庭家庭结结构的构的频频次分布家庭次分布家庭结结构构频频次百分比(次百分比(%3多选项二分法abcde样本1样本2样本3样本4样本5多多选项选项二分法二分法abcde样样本本1样样本本2样样4多选项二分法abcde样本111101样本200111样本310011样本411001样本511001合计43225多多选项选项二分法二分法abcde样样本本111101 样样本本200111 样样本本5多选项分类法P26 例2P27 例3多多选项选项分分类类法法P26 例例263、加权平均法P28 例43、加、加权权平均法平均法P28 例例47(二)定序变量 表2-7 单位对武打片的反映统计喜爱程度频次百分比(%)很反感37.69 不爱看1025.64 一般1025.64 爱看923.08 非常爱看717.95 总数39100.00(二)定序(二)定序变变量量 表表2-7 单单位位对对武打片的反武打片的反8(三)定距变量统计分组的步骤(等距、重合、组距式分组)第一:确定组数。经验公式 k=1+lgn/lg2k=1+lg100/lg2=7.64第二:确定组距。组距=(最大值-最小值)/组数 =(1.56-1.27)/10=0.029原则:以5或10的倍数作为组距。本例选择:0.03第三:确定组限。要求:第一组下限要小于所有数据的最小值,最后一组上限要大于所有数据的最大值原则:以5或10的倍数作为组限。(三三)定距定距变变量量统计统计分分组组的步的步骤骤(等距、重合、(等距、重合、组组距式分距式分组组)第一)第一9(三)定距变量统计分组的步骤(等距、重合、组距式分组)第四:计数。以0.03作为组距的分组情况。1.265-1.295;1.295-1.325,1.255-1.285;1.285-1.315,1.245-1.275;1.275-1.305,(三三)定距定距变变量量统计统计分分组组的步的步骤骤(等距、重合、(等距、重合、组组距式分距式分组组)第四)第四10(三)定距变量身高组中值人数频率向上累计向下累计人数频率人数频率1.2651.2951.2811111001001.2951.3251.31445599991.3251.3551.3477121295951.3551.3851.372222343488881.3851.4151.402424585866661.4151.4451.432424828242421.4451.4751.461010929218181.4751.5051.49669898881.5051.5351.52119999221.5351.5651.551110010011合计100100表2.11 100名儿童身高统计分组表(三三)定距定距变变量身高量身高组组中中值值人数人数频频率向上累率向上累计计向下累向下累计计人数人数频频率人率人11向上累计:由低到高,上限以下向下累计:由高到低,下限以上思考:360体您本次开机共用时1分10秒,击败了全国12%的电脑向上累向上累计计:由低到高,上限以下思考:由低到高,上限以下思考:360体体12关于统计分组的个人认识原则:统计分组没有对错,只有好坏。开口组实际中应用更广。极端值,extreme value判断依据:发生概率非常小,后果很严重911事件2004印度洋海啸飞机失事、英法核潜艇相撞、美、俄卫星相撞,股灾,亚洲金融危机关于关于统计统计分分组组的个人的个人认识认识原原则则:统计统计分分组组没有没有对错对错,只有好坏。开口,只有好坏。开口13图2.1 家庭结构分布图饼图(Pie)图图2.1 家庭家庭结结构分布构分布图饼图图饼图(Pie)14条形图 bar 按年龄和分人口数(2012年,0.83%人口抽样调查)条形条形图图 bar 按年按年龄龄和分人口数和分人口数(2012年,年,0.83%人人15100名儿童身高向上累计直方图100名儿童身高向上累名儿童身高向上累计计直方直方图图16 100名儿童身高向下累计直方图 100名儿童身高向下累名儿童身高向下累计计直方直方图图17 父亲身高(800名)父父18母亲身高(800名)母母亲亲身高(身高(800名)名)19父亲体重(800名)父父亲亲体重(体重(800名)名)20母亲体重(800名)母母亲亲体重(体重(800名)名)21分年龄别的死亡率分年分年龄别龄别的死亡率的死亡率22三次产业构成比三次三次产业产业构成比构成比23社会社会统计统计学学卢卢淑淑华华第第4版版课课件件24数据描述的数值方法数据描述的数值方法数据描述的数值方法分布的形状分布的形状集中趋势集中趋势离散程度离散程度众众 数数中位数中位数均均 值值离散系数离散系数方差和标准差方差和标准差峰峰 度度四分位距四分位距极差极差偏偏 态态第第2节节第第3节节数据描述的数数据描述的数值值方法数据描述的数方法数据描述的数值值方法分布的形状集中方法分布的形状集中趋势趋势离散程离散程25一、众数(Mode)概念:出现次数最多的标志值计算(一)定类数据 表2.5 P24 第二节:集中趋势的测量一、众数(一、众数(Mode)第二)第二节节:集中:集中趋势趋势的的测测量量26表2.5 家庭结构的频次分布家庭结构频次百分比(%)核心家庭105049.30 直系家庭72033.80 联合家庭1105.16 其他25011.74 总数2130100.00 Mo=“核心家庭”表表2.5 家庭家庭结结构的构的频频次分布家庭次分布家庭结结构构频频次百分比(次百分比(%)核心家庭)核心家庭27(二)定序 表2.7 P29 表2-7 单位对武打片的反映统计喜爱程度频次百分比很反感37.69 不爱看1025.64 一般1025.64 爱看923.08 非常爱看717.95 总数39100.00 Mo=“不爱看”Mo=“一般”(二)定序(二)定序 表表2.7 P29 表表2-7 单单位位对对28(三)定距1.未分组资料 表2.102.单项式 表2.143.组距式 表2.11Mo=1.38,1.39,1.40,1.41,1.42,1.43,1.44Mo=1,2Mo=1.40,1.43(三)定距(三)定距1.未分未分组资组资料料 表表2.102.单项单项式式 表表2.129二、中位数Median(一)定序 表2.7 找中位数组:向上累计次数首次超过N/2的组即为中位数组;该组的标志值即为中位数值Me=“一般”二、中位数二、中位数Median(一)定序(一)定序 表表2.7 Me=“一般一般”30(二)定距1.未分组资料 表2.10方法:中位数位置=(N+1)/2(二)定距(二)定距1.未分未分组资组资料料 表表2.10方法:中位数位置方法:中位数位置=(N+31 概念解释:次序统计量概念解释:次序统计量 (order statisticsorder statistics)x1x2x3x4x59.229.659.209.259.309.209.229.259.309.65 概念解概念解释释:次序:次序统计统计量量 (order statis32表2.10表表2.10332.分组资料(1)单项式分组 表2.18向上累计次数首次超过N/2的组即为中位数组;该组的标志值即为中位数Me=“乙”2.分分组资组资料(料(1)单项单项式分式分组组 表表2.18Me=“乙乙”34(三)组距式分组(三)组距式分组首先确定中位数组;首先确定中位数组;使用公式使用公式下限公式:下限公式:上限公式:上限公式:(三)(三)组组距式分距式分组组首先确定中位数首先确定中位数组组;使用公式使用公式35公式中各字母含义公式中各字母含义U:中位数组的上限;L:中位数组的下限;fm:中位数组的频数;Sm-1:向上累计时中位数组前一组的累计频数,即中位数前一组所对应的向上累计频数;Sm+1:向下累计时中位数组后一组的累计频数 即中位数后一组所对应的向下累计频数;i:中位数组的组距。公式中各字母含公式中各字母含义义U:中位数:中位数组组的上限;的上限;36f2x向上累计Sm-1SmLUMeAb中位数组中位数组前一组前一组中位数组中位数组BCaED下限公式Me=L+a上限公式Me=U-b下下限限公公式式推推导导fx向上累向上累计计Sm-1SmLUMeAb中位数中位数组组中位数中位数组组BCa37身高组中值人数频率向上累计人数频率1.2651.2951.2811111.2951.3251.3144551.3251.3551.347712121.3551.3851.37222234341.3851.4151.40242458581.4151.4451.43242482821.4451.4751.46101092921.4751.5051.496698981.5051.5351.521199991.5351.5651.5511100100合计100100表2.11 100名儿童身高统计分组表f中位中位数组数组次数次数中位中位数组数组上限上限首次大于首次大于50%首次大于首次大于50中位数组中位数组前一组所前一组所对应向上对应向上累计次数累计次数中位中位数组数组中位中位数组数组下限下限身高身高组组中中值值人数人数频频率向上累率向上累计计人数人数频频率率1.2651.2951.38L=1.385U=1.415fm=24Sm-1=34i=0.03L=1.385U=1.415fm=24Sm-1=34i=0.39西西藏藏辽宁辽宁天津天津上海上海图1 我国分地区人口年龄中位数(2000年)北京北京河南河南西藏西藏辽辽宁天津上海宁天津上海图图1 我国分地区人口年我国分地区人口年龄龄中位数(中位数(2000年)年)40三、四分位数(quartile)概念:数据排序后处在25%,50%和75%位置上的数。25%25%25%25%Q1Q2Q3Q2=Me三、四分位数三、四分位数(quartile)概念:数据排序后概念:数据排序后处处在在25%,41(一)定序 表2.7 找Q1、Q2、Q3所在组 Q1所在组:向上累计次数首次超过f/4的组;Q2所在组:向上累计次数首次超过f/2的组;Q3所在组:向上累计次数首次超过3f/4的组;Q1=Q1所在组标志值;Q2=Q2所在组标志值;Q 3=Q3所在组标志值;(一)定序(一)定序 表表2.7 42喜爱程度频次百分比向上累计很反感37.69 3不爱看1025.64 13一般1025.64 23爱看923.08 32非常爱看717.95 39总数39100.00 19.59.75Q1所在所在组组Q1=“不爱看不爱看”Q2所在所在组组Q2=“一般一般”29.25Q3所在所在组组Q3=“爱看爱看”喜喜爱爱程度程度频频次百分比向上累次百分比向上累计计很反感很反感37.69 3不不爱爱看看102543(二)定距数据1、未分组资料(spss版本)Q1位置=(n+1)/4;Q2位置=(n+1)/2;Q3位置=3(n+1)/4表2.10Q1位置=(n+1)/4=25.25;Q2位置=(n+1)/2=50.5;Q3位置=3(n+1)/4=75.75Q1=x(25)+0.25 x(26)-x(25)=1.37+0.25 1.37-1.37=1.37Q2=x(50)+0.5 x(51)-x(50)=1.4+0.5 1.41-1.4=1.405Q3=x(75)+0.75 x(76)-x(75)=1.44+0.75 1.44-1.44=1.44(二)定距数据(二)定距数据1、未分、未分组资组资料(料(spss版本)版本)Q1位置位置=(n+44(二)定距数据1、未分组资料(excel版本)Q1位置=(n+3)/4;Q2位置=(n+1)/2;Q3位置=(3n+1)/4表2.10Q1位置=(n+3)/4=25.75;Q2位置=(n+1)/2=50.5;Q3位置=(3n+1)/4=75.25Q1=x(25)+0.75 x(26)-x(25)=1.37+0.75 1.37-1.37=1.37Q2=x(50)+0.5 x(51)-x(50)=1.4+0.5 1.41-1.4=1.405Q3=x(75)+0.25 x(76)-x(75)=1.44+0.25 1.44-1.44=1.44(二)定距数据(二)定距数据1、未分、未分组资组资料(料(excel版本)版本)Q1位置位置=(n45Excel 操作:quartileExcel 操作操作:quartile462.分组资料(1)单项式分组 找Q1、Q2、Q3所在组 Q1所在组:向上累计次数首次超过f/4的组;Q2所在组:向上累计次数首次超过f/2的组;Q3所在组:向上累计次数首次超过3f/4的组;Q1=Q1所在组标志值;Q2=Q2所在组标志值;Q 3=Q3所在组标志值;2.分分组资组资料料47(2)组距式分组使用公式 找Q1、Q2、Q3所在组 Q1所在组:向上累计次数首次超过f/4的组;Q2所在组:向上累计次数首次超过f/2的组;Q3所在组:向上累计次数首次超过3f/4的组;(2)组组距式分距式分组组使用公式使用公式 找找Q1、Q2、Q3所在所在组组48社会社会统计统计学学卢卢淑淑华华第第4版版课课件件49社会社会统计统计学学卢卢淑淑华华第第4版版课课件件50身高组中值人数频率向上累计人数频率1.2651.2951.2811111.2951.3251.3144551.3251.3551.347712121.3551.3851.37222234341.3851.4151.40242458581.4151.4451.43242482821.4451.4751.46101092921.4751.5051.496698981.5051.5351.521199991.5351.5651.5511100100合计100100表2.11 100名儿童身高统计分组表f首次大于首次大于50首次大于首次大于25Q3所在组所在组首次大于首次大于75Q1所在组所在组Q2所在组所在组L1=1.355U1=1.385身高身高组组中中值值人数人数频频率向上累率向上累计计人数人数频频率率1.2651.2951.51身高人数向上累计人数频率1.2651.2951111.2951.3254551.3251.355712121.3551.3852234341.3851.4152458581.4151.4452482821.4451.4751092921.4751.505698981.5051.535199991.5351.5651100100合计100表2.11 100名儿童身高统计分组表L1=1.355U1=1.385Sm1-1=12f1=22L2=1.385U2=1.415Sm2-1=34f2=24L3=1.415U3=1.445Sm3-1=58f3=24身高人数向上累身高人数向上累计计人数人数频频率率1.2651.2951111.2952社会社会统计统计学学卢卢淑淑华华第第4版版课课件件53三、均值(一)未分组资料(简单算术平均数)(二)分组资料(加权算术平均数)三、均三、均值值(一)未分(一)未分组资组资料(料(简单简单算算术术平均数)(二)分平均数)(二)分组资组资料(加料(加54三、均值(一)未分组资料(简单算术平均数)(二)分组资料(加权算术平均数)三、均三、均值值(一)未分(一)未分组资组资料(料(简单简单算算术术平均数)(二)分平均数)(二)分组资组资料(加料(加55例 2.10Excel 内置函数 =average()例例 2.10Excel 内置函数内置函数 =average()56例 2.11Excel 内置函数 sumproduct(),sum()例例 2.11Excel 内置函数内置函数 sumproduct(57众数、中位数和算术平均数的关系对称分布对称分布 均值均值=中位数中位数=众数众数分配为钟形、轻微不对称的经验公式:分配为钟形、轻微不对称的经验公式:左偏分布左偏分布均值均值 中位数中位数 众数众数右偏分布右偏分布众数众数 中位数中位数均值均值众数、中位数和算众数、中位数和算术术平均数的关系平均数的关系对对称分布称分布 均均值值=中位数中位数=众众58第三节:离散趋势测量法数据集中趋势的测度指标确实能反映某种事物的一般水平,在比较不同空间和时间上的情况是能消除规模大小的影响,是衡量其差距的重要指标。但只依据平均指标来评价事物的优劣远远不够。因为总体内部各单位标志值具有差异,有高低、大小、多少之别。就总体而言,平均数背后隐藏最大值与最小值之间的差距,有的差距不大,有的则非常悬殊。总体内部各单位标志值差距悬殊的平均数就掩盖着尖锐的矛盾,让人们感到不真实。所以,在反映具体问题时,除了从集中趋势角度分析外,还应把总体内部各单位标志值中最大值、最小值及其差距摆出来,要列出平均差异大小和差异的相对程度,即要对待研究现象进行离散程度的测度。第三第三节节:离散:离散趋势测趋势测量法数据集中量法数据集中趋势趋势的的测测度指度指标标确确实实能反映某种事能反映某种事59一、异众比率一、异众比率一、异众比率60表2.5 家庭结构的频次分布家庭结构频次百分比(%)核心家庭105049.30 直系家庭72033.80 联合家庭1105.16 其他25011.74 总数2130100.00 异众比率=1-1050/2130=50.70%一、异众比率(定类数据)表表2.5 家庭家庭结结构的构的频频次分布家庭次分布家庭结结构构频频次百分比(次百分比(%)核心家庭)核心家庭612.全距(Range)全距也称极差,是一组数据的最大值与最小值之差。R=最大值-最小值组距分组数据可根据最高组上限-最低组下限计算。受极端值的影响。2.全距(全距(Range)全距也称极差,是一)全距也称极差,是一组组数据的最大数据的最大值值与最与最621.未分组资料 表2.10R=1.56-1.27=0.29Excel操作最大值=max(),=large(data,1)最大值=min(),=large(data,1)1.未分未分组资组资料料 表表2.10R=1.56-1.27=0.29E632.分组资料 表2.11R=1.565-1.265=0.32.分分组资组资料料 表表2.11R=1.565-1.265=0.364等于上四分位数与下四分位数之差反映了中间50%数据的离散程度,数值越小说明中间的数据越集中。不受极端值的影响。可以用于衡量中位数的代表性。2 四分位距(Inter-Quartile Range,IQR)2,2,3,4,4,4,5,5,6,6,7Q1=3,Q2=6,Q3=6等于上四分位数与下四分位数之差等于上四分位数与下四分位数之差2 四分位距四分位距(Inter-65方差是一组数据中各数值与其算术平均数离差平方的平均数,标准差是方差正的平方根。总体方差和样本方差的符号不同,计算公式也不一样。是反映定量数据离散程度的最常用的指标。3 方差和标准差方差是一方差是一组组数据中各数数据中各数值值与其算与其算术术平均数离差平方的平均数,平均数离差平方的平均数,标标准差准差66方差的计算公式总体方差 样本方差 未分组数据分组数据 样本方差用(样本方差用(n-1)去除,)去除,从数学角度看是从数学角度看是因为它是总体方差因为它是总体方差2的无偏估计量。的无偏估计量。方差的方差的计计算公式算公式总总体方差体方差 样样本方差本方差 未分未分组组数据分数据分组组数据数据 样样本本67P56.表2-26(一)未分组资料Excel操作总体方差=varp(data)总体标准差=stdevp(data)样本方差=var(data)样本标准差=stdev(data)(二)分组资料表2.11P56.表表2-26(一)未分(一)未分组资组资料料Excel操作操作总总体方差体方差=684 离散系数(Coefficient of Variation)标准差与其相应的均值之比,表示为百分数。特点:反映了相对于均值的相对离散程度;可用于比较计量单位不同的数据的离散程度;计量单位相同时,如果两组数据的均值相差悬殊,离散系数可能比标准差等绝对指标更有意义。4 离散系数(离散系数(Coefficient of Variatio69离散系数:例子对30名经理人员的调查表明年平均收入=$500,000,标准差=$50,000。对30名工人的调查表明平均收入=$32,000,标准差=$5,000。离散系数:经理人员:工人:虽然经理人员收入的绝对离散程度远远大于工人,但经理人员收入的相对离散程度小于工人。离散系数:例子离散系数:例子对对30名名经经理人理人员员的的调查调查表明年平均收入表明年平均收入=$500701 偏态及其测定(Skewness)数据分布的不对称性称作偏态。偏态系数就是对数据分布的不对称性(即偏斜程度)的测度。偏态系数有多种计算方法,在统计软件中(如Excel等)通常采用以下公式:Excel操作:=skew(data)1 偏偏态态及其及其测测定(定(Skewness)数据分布的不数据分布的不对对称称71偏态系数的含义左偏分布左偏分布(也称负偏分布也称负偏分布):偏态系数偏态系数 SK 0;偏态系数的;偏态系数的绝对值越大,偏斜越严重。绝对值越大,偏斜越严重。数据向右边数据向右边延伸得更多延伸得更多对称分布:偏态系数对称分布:偏态系数=0。偏偏态态系数的含系数的含义义左偏分布左偏分布(也称也称负负偏分布偏分布):数据向左:数据向左边边延伸得更多延伸得更多722 峰度及峰度系数(Kurtosis)峰度:数据分布的扁平或尖峰程度。峰度系数:数据分布峰度的度量值,对数据分布尖峰或扁平程度的测度,一般用K表示。统计软件(如Excel等)中常用以下公式计算:Excel操作:=kurt(data)2 峰度及峰度系数峰度及峰度系数(Kurtosis)峰度:数据分布峰度:数据分布73峰度系数的含义扁平分布扁平分布尖峰分布尖峰分布峰度系数峰度系数K0,与正,与正态分布相比该分布一态分布相比该分布一般为尖峰、肥尾,肩般为尖峰、肥尾,肩部较瘦。部较瘦。均值和方差均值和方差相同的正态相同的正态分布分布峰度系数的含峰度系数的含义义扁平分布尖峰分布峰度系数扁平分布尖峰分布峰度系数K0,与正,与正态态分布相比分布相比74Excel 描述统计分析结果Excel 描述描述统计统计分析分析结结果果75SPSS描述统计结果全距全距最小值最小值最大值最大值求和求和均值均值统计量统计量标准误差标准误差SPSS描述描述统计结统计结果全距最小果全距最小值值最大最大值值求和均求和均值统计值统计量量标标准准误误差差76SPSS描述统计结果(样本)标准差(样本)标准差(样本)方差(样本)方差偏度系数偏度系数峰度系数峰度系数SPSS描述描述统计结统计结果(果(样样本)本)标标准差(准差(样样本)方差偏度系数峰度系本)方差偏度系数峰度系77
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!