社会学研究方法分析和综合之定量(统计)分析课件

上传人:29 文档编号:241876578 上传时间:2024-08-01 格式:PPT 页数:79 大小:1.17MB
返回 下载 相关 举报
社会学研究方法分析和综合之定量(统计)分析课件_第1页
第1页 / 共79页
社会学研究方法分析和综合之定量(统计)分析课件_第2页
第2页 / 共79页
社会学研究方法分析和综合之定量(统计)分析课件_第3页
第3页 / 共79页
点击查看更多>>
资源描述
社会学社会学-研究方法研究方法分析和综合之定量(统计)分析和综合之定量(统计)分析分析社会学-研究方法分析和综合之定量(统计)分析n所谓所谓定量(统计)分析定量(统计)分析,就是对社会研究收,就是对社会研究收集来的数据资料进行计算、统计检验、分析集来的数据资料进行计算、统计检验、分析解释,并以此为依据,做出科学推断,揭示解释,并以此为依据,做出科学推断,揭示社会现象中所蕴涵的规律的一种方法。社会现象中所蕴涵的规律的一种方法。n统计分析包括统计分析包括描述统计描述统计和和推断统计推断统计两种类型。两种类型。n统计分析方法的内容还可以根据变量的多少统计分析方法的内容还可以根据变量的多少划分为划分为单变量分析单变量分析、双变量分析双变量分析和和多变量分多变量分析析,前两者可称为,前两者可称为初等统计初等统计,后者可称为,后者可称为高高等统计等统计。所谓定量(统计)分析,就是对社会研究收集来的数据资料进行计算1.描述统计描述统计描述统计描述统计描述统计描述统计主要是对所收集的资料进行整理、分主要是对所收集的资料进行整理、分主要是对所收集的资料进行整理、分主要是对所收集的资料进行整理、分类和简化,描述数据的全貌以表明研究对象的类和简化,描述数据的全貌以表明研究对象的类和简化,描述数据的全貌以表明研究对象的类和简化,描述数据的全貌以表明研究对象的某些特性。某些特性。某些特性。某些特性。描述统计包括数据的初步整理,数据集中趋势描述统计包括数据的初步整理,数据集中趋势描述统计包括数据的初步整理,数据集中趋势描述统计包括数据的初步整理,数据集中趋势和离散趋势以及相关系数的度量等方面。和离散趋势以及相关系数的度量等方面。和离散趋势以及相关系数的度量等方面。和离散趋势以及相关系数的度量等方面。描述统计的目的在于使杂乱无章的数据更清晰描述统计的目的在于使杂乱无章的数据更清晰描述统计的目的在于使杂乱无章的数据更清晰描述统计的目的在于使杂乱无章的数据更清晰直观地显示研究对象的特征,以利于进一步分直观地显示研究对象的特征,以利于进一步分直观地显示研究对象的特征,以利于进一步分直观地显示研究对象的特征,以利于进一步分析。析。析。析。1.描述统计1.描述统计描述统计(1)描述统计的基本技术)描述统计的基本技术(2)集中趋势测量)集中趋势测量(3)离散趋势测量)离散趋势测量1.描述统计(1)描述统计的基本技术)描述统计的基本技术频数频数频数频数(FrequencyFrequency):也称为次数,它是指分布:也称为次数,它是指分布:也称为次数,它是指分布:也称为次数,它是指分布在各类别中的数据个数。在各类别中的数据个数。在各类别中的数据个数。在各类别中的数据个数。频数分布频数分布频数分布频数分布(Frequency DistributionFrequency Distribution):是指一组:是指一组:是指一组:是指一组数据中取不同值的个案的次数分布情况,它一数据中取不同值的个案的次数分布情况,它一数据中取不同值的个案的次数分布情况,它一数据中取不同值的个案的次数分布情况,它一般是以般是以般是以般是以频数分布表频数分布表频数分布表频数分布表的形式表达。的形式表达。的形式表达。的形式表达。频数分布表的作用频数分布表的作用频数分布表的作用频数分布表的作用:简化资料。将调查得到的杂乱的原始数据简化资料。将调查得到的杂乱的原始数据简化资料。将调查得到的杂乱的原始数据简化资料。将调查得到的杂乱的原始数据,以十以十以十以十分简洁的统计表反映出来分简洁的统计表反映出来分简洁的统计表反映出来分简洁的统计表反映出来.清楚地了解调查数据的众多信息。清楚地了解调查数据的众多信息。清楚地了解调查数据的众多信息。清楚地了解调查数据的众多信息。(1)描述统计的基本技术(1)描述统计的基本技术)描述统计的基本技术频率分布频率分布频率分布频率分布(P(P(P(Percentages Distributionercentages Distribution):是一组:是一组:是一组:是一组数据中不同取值的频数相对于总数的比率分布数据中不同取值的频数相对于总数的比率分布数据中不同取值的频数相对于总数的比率分布数据中不同取值的频数相对于总数的比率分布情况。这种比率在社会调查中经常是以百分比情况。这种比率在社会调查中经常是以百分比情况。这种比率在社会调查中经常是以百分比情况。这种比率在社会调查中经常是以百分比的形式来表达。的形式来表达。的形式来表达。的形式来表达。频率分布表频率分布表频率分布表频率分布表:是不同类别在总体中的相对数量:是不同类别在总体中的相对数量:是不同类别在总体中的相对数量:是不同类别在总体中的相对数量分布。它十分便于不同总体和不同类别之间的分布。它十分便于不同总体和不同类别之间的分布。它十分便于不同总体和不同类别之间的分布。它十分便于不同总体和不同类别之间的比较。比较。比较。比较。(1)描述统计的基本技术社会学研究方法分析和综合之定量(统计)分析课件(1)描述统计的基本技术)描述统计的基本技术统计表统计表统计表统计表:表示被说明的事物及其统计指标和数:表示被说明的事物及其统计指标和数:表示被说明的事物及其统计指标和数:表示被说明的事物及其统计指标和数值的表格。值的表格。值的表格。值的表格。统计表的种类统计表的种类统计表的种类统计表的种类 按总体分组的情况分:按总体分组的情况分:按总体分组的情况分:按总体分组的情况分:简单表(简单表(简单表(简单表(P272P272表表表表11-1011-10)分组表分组表分组表分组表 单项分组表(单项分组表(单项分组表(单项分组表(P269P269表表表表11-611-6)组距分组表(组距分组表(组距分组表(组距分组表(P269P269表表表表11-711-7)复合表(又称交互分类表)复合表(又称交互分类表)复合表(又称交互分类表)复合表(又称交互分类表)P271P271表表表表11-911-9(1)描述统计的基本技术(1)描述统计的基本技术)描述统计的基本技术统计表的结构统计表的结构统计表的结构统计表的结构 从外表形式上看,统计表由从外表形式上看,统计表由从外表形式上看,统计表由从外表形式上看,统计表由表号表号表号表号、总标题总标题总标题总标题(上(上(上(上端中部)、端中部)、端中部)、端中部)、横行标题横行标题横行标题横行标题(左端)、(左端)、(左端)、(左端)、纵栏标题纵栏标题纵栏标题纵栏标题(表(表(表(表上方)、上方)、上方)、上方)、指标数值指标数值指标数值指标数值、注释注释注释注释和和和和资料来源资料来源资料来源资料来源等要素组等要素组等要素组等要素组成。成。成。成。从内容上看,统计表由从内容上看,统计表由从内容上看,统计表由从内容上看,统计表由主词主词主词主词和和和和宾词宾词宾词宾词两部分构成。两部分构成。两部分构成。两部分构成。P271P271表表表表11-811-8(1)描述统计的基本技术(1)描述统计的基本技术)描述统计的基本技术统计图统计图统计图统计图 统计图是利用统计资料绘制成的几何图形或具统计图是利用统计资料绘制成的几何图形或具统计图是利用统计资料绘制成的几何图形或具统计图是利用统计资料绘制成的几何图形或具体形象,它可以从数量方面显示出研究对象的体形象,它可以从数量方面显示出研究对象的体形象,它可以从数量方面显示出研究对象的体形象,它可以从数量方面显示出研究对象的规模、水平、结构、发展趋势和比例关系,是规模、水平、结构、发展趋势和比例关系,是规模、水平、结构、发展趋势和比例关系,是规模、水平、结构、发展趋势和比例关系,是表现统计资料的一种重要形式。表现统计资料的一种重要形式。表现统计资料的一种重要形式。表现统计资料的一种重要形式。(1)描述统计的基本技术(1)描述统计的基本技术)描述统计的基本技术统计图统计图统计图统计图条形图条形图条形图条形图 条形图条形图条形图条形图是用宽度相同的直条的高低或长短来表是用宽度相同的直条的高低或长短来表是用宽度相同的直条的高低或长短来表是用宽度相同的直条的高低或长短来表示各项统计指标数值大小的图形。示各项统计指标数值大小的图形。示各项统计指标数值大小的图形。示各项统计指标数值大小的图形。根据条形图表现统计资料内容的不同,条形图根据条形图表现统计资料内容的不同,条形图根据条形图表现统计资料内容的不同,条形图根据条形图表现统计资料内容的不同,条形图又分为又分为又分为又分为单式条形图单式条形图单式条形图单式条形图、复式条形图复式条形图复式条形图复式条形图和和和和结构条形图结构条形图结构条形图结构条形图。(1)描述统计的基本技术(1)描述统计的基本技术)描述统计的基本技术统计图统计图统计图统计图饼形图饼形图饼形图饼形图 饼形图饼形图饼形图饼形图通常是以圆形面积或以圆内各扇形面积通常是以圆形面积或以圆内各扇形面积通常是以圆形面积或以圆内各扇形面积通常是以圆形面积或以圆内各扇形面积的大小来表示统计指标数值大小的图形。的大小来表示统计指标数值大小的图形。的大小来表示统计指标数值大小的图形。的大小来表示统计指标数值大小的图形。(1)描述统计的基本技术(1)描述统计的基本技术)描述统计的基本技术统计图统计图统计图统计图直方图直方图直方图直方图 直方图直方图直方图直方图是由紧挨着的长条构成的,与条形图不是由紧挨着的长条构成的,与条形图不是由紧挨着的长条构成的,与条形图不是由紧挨着的长条构成的,与条形图不同的是,它的条的宽度是有意义的,实际上它同的是,它的条的宽度是有意义的,实际上它同的是,它的条的宽度是有意义的,实际上它同的是,它的条的宽度是有意义的,实际上它不是用长条的高度而是用长条的面积表示频率不是用长条的高度而是用长条的面积表示频率不是用长条的高度而是用长条的面积表示频率不是用长条的高度而是用长条的面积表示频率的大小,长条的纵轴高度表示频率密度(频率的大小,长条的纵轴高度表示频率密度(频率的大小,长条的纵轴高度表示频率密度(频率的大小,长条的纵轴高度表示频率密度(频率密度密度密度密度=频率频率频率频率/组距),长条的宽度表示组距。组距),长条的宽度表示组距。组距),长条的宽度表示组距。组距),长条的宽度表示组距。某班统计学考试成绩分布图2101518505101520 成绩(分)60708090100人数(1)描述统计的基本技术某班统计学考试成绩分布图210151(1)描述统计的基本技术)描述统计的基本技术统计图统计图统计图统计图折线图折线图折线图折线图 折线图折线图折线图折线图是用直线连接直方图中条形顶端的中点是用直线连接直方图中条形顶端的中点是用直线连接直方图中条形顶端的中点是用直线连接直方图中条形顶端的中点而成的。当组距逐渐减小时,折线将逐渐变为而成的。当组距逐渐减小时,折线将逐渐变为而成的。当组距逐渐减小时,折线将逐渐变为而成的。当组距逐渐减小时,折线将逐渐变为平滑,趋向为曲线。平滑,趋向为曲线。平滑,趋向为曲线。平滑,趋向为曲线。(某班统计学考试成绩折线图210151850510152095 成绩(分)人数060708090100(1)描述统计的基本技术某班统计学考试成绩折线图210151(1)描述统计的基本技术)描述统计的基本技术统计图统计图统计图统计图线性图线性图线性图线性图 线性图线性图线性图线性图:表示两个变量之间的函数关系的曲线:表示两个变量之间的函数关系的曲线:表示两个变量之间的函数关系的曲线:表示两个变量之间的函数关系的曲线图,可以表明事物的发展规律、总体单位的分图,可以表明事物的发展规律、总体单位的分图,可以表明事物的发展规律、总体单位的分图,可以表明事物的发展规律、总体单位的分配情况、揭示事物间的依存关系或表明计划执配情况、揭示事物间的依存关系或表明计划执配情况、揭示事物间的依存关系或表明计划执配情况、揭示事物间的依存关系或表明计划执行的进度。行的进度。行的进度。行的进度。(1)描述统计的基本技术1.描述统计描述统计(1)描述统计的基本技术)描述统计的基本技术(2)集中趋势测量)集中趋势测量(3)离散趋势测量)离散趋势测量1.描述统计(2)集中趋势测量)集中趋势测量集中趋势分析集中趋势分析集中趋势分析集中趋势分析:是从一组数据中抽象出一个代:是从一组数据中抽象出一个代:是从一组数据中抽象出一个代:是从一组数据中抽象出一个代表值,以代表现象的共性和一般水平。表值,以代表现象的共性和一般水平。表值,以代表现象的共性和一般水平。表值,以代表现象的共性和一般水平。除可以说明某一社会现象在一定条件下数量的除可以说明某一社会现象在一定条件下数量的除可以说明某一社会现象在一定条件下数量的除可以说明某一社会现象在一定条件下数量的一般水平外;集中趋势还可以对不同空间的同一般水平外;集中趋势还可以对不同空间的同一般水平外;集中趋势还可以对不同空间的同一般水平外;集中趋势还可以对不同空间的同类现象或同一现象在不同时间的状态进行比较;类现象或同一现象在不同时间的状态进行比较;类现象或同一现象在不同时间的状态进行比较;类现象或同一现象在不同时间的状态进行比较;以及分析某些社会现象之间的依存关系。以及分析某些社会现象之间的依存关系。以及分析某些社会现象之间的依存关系。以及分析某些社会现象之间的依存关系。最常见的集中量数有最常见的集中量数有最常见的集中量数有最常见的集中量数有算术平均数算术平均数算术平均数算术平均数(简称平均数,(简称平均数,(简称平均数,(简称平均数,也称为均值)、也称为均值)、也称为均值)、也称为均值)、众数众数众数众数和和和和中位数中位数中位数中位数三种。三种。三种。三种。(2)集中趋势测量(2)集中趋势测量)集中趋势测量众数众数众数众数 众数众数众数众数是一组数据中出现次数最多是一组数据中出现次数最多是一组数据中出现次数最多是一组数据中出现次数最多(即频数最高即频数最高即频数最高即频数最高)的那个数值的那个数值的那个数值的那个数值,用,用,用,用 MoMo 表示。表示。表示。表示。适用条件:只有集中趋势明显时,才能用众数适用条件:只有集中趋势明显时,才能用众数适用条件:只有集中趋势明显时,才能用众数适用条件:只有集中趋势明显时,才能用众数作为总体的代表值。作为总体的代表值。作为总体的代表值。作为总体的代表值。例:有例:有例:有例:有1616例高血压病人的发病年龄例高血压病人的发病年龄例高血压病人的发病年龄例高血压病人的发病年龄(岁岁岁岁)为:为:为:为:42,45,48,51,52,54,55,55,61,61,62,6242,45,48,51,52,54,55,55,61,61,62,62,试求众数。,试求众数。,试求众数。,试求众数。58,58,58,58(2)集中趋势测量58,58,58,58(2)集中趋势测量)集中趋势测量众数众数众数众数 需要注意的几个问题:需要注意的几个问题:需要注意的几个问题:需要注意的几个问题:定性数据可以存在众数。定性数据可以存在众数。定性数据可以存在众数。定性数据可以存在众数。众数是一组数据中出现次数最多的数据,是一众数是一组数据中出现次数最多的数据,是一众数是一组数据中出现次数最多的数据,是一众数是一组数据中出现次数最多的数据,是一组数据中的原数据,而不是相应的次数。组数据中的原数据,而不是相应的次数。组数据中的原数据,而不是相应的次数。组数据中的原数据,而不是相应的次数。例例例例 对于某些数据而言,例如均匀分布,并不存在对于某些数据而言,例如均匀分布,并不存在对于某些数据而言,例如均匀分布,并不存在对于某些数据而言,例如均匀分布,并不存在众数。众数。众数。众数。如,原始数据如,原始数据如,原始数据如,原始数据:10 5 9 12 6 8:10 5 9 12 6 8 对于某些数据存在两个或多于两个的众数。对于某些数据存在两个或多于两个的众数。对于某些数据存在两个或多于两个的众数。对于某些数据存在两个或多于两个的众数。如,如,如,如,原始数据原始数据原始数据原始数据:25 :25 28 2828 28 36 36 42 4242 42(2)集中趋势测量(2)集中趋势测量)集中趋势测量众数众数众数众数 众数的计算方法众数的计算方法众数的计算方法众数的计算方法(1 1)单项数列确定众数,即出现次数最多(频率)单项数列确定众数,即出现次数最多(频率)单项数列确定众数,即出现次数最多(频率)单项数列确定众数,即出现次数最多(频率最大)的标志值就是众数。最大)的标志值就是众数。最大)的标志值就是众数。最大)的标志值就是众数。(2 2)组距数列确定众数:在等距数列条件下,先)组距数列确定众数:在等距数列条件下,先)组距数列确定众数:在等距数列条件下,先)组距数列确定众数:在等距数列条件下,先确定众数组,然后再通过公式进行具体计算,确定众数组,然后再通过公式进行具体计算,确定众数组,然后再通过公式进行具体计算,确定众数组,然后再通过公式进行具体计算,找出众数点的标志值。找出众数点的标志值。找出众数点的标志值。找出众数点的标志值。(2)集中趋势测量(2)集中趋势测量)集中趋势测量众数众数众数众数 计算公式:计算公式:计算公式:计算公式:是众数所在组的下限;是众数所在组的下限;是众数所在组前一组的次数;是众数所在组前一组的次数;是众数所在组后一组的次数;是众数所在组后一组的次数;是众数所在组的次数;是众数所在组的次数;是众数组的组距。是众数组的组距。(2)集中趋势测量 是众数所在组的下限;按成绩分按成绩分组(分)组(分)学生人数学生人数(人)(人)6060以下以下6069606970797079808980899090以上以上 2 2151519191515 3 3合计合计5454按成绩分组(分)学生人数60以下 2合计54(2)集中趋势测量)集中趋势测量中位数中位数中位数中位数 中位数中位数中位数中位数:将总体单位的某一数量标志的各个数:将总体单位的某一数量标志的各个数:将总体单位的某一数量标志的各个数:将总体单位的某一数量标志的各个数值按照大小顺序排列,居于中间位置的那个数值按照大小顺序排列,居于中间位置的那个数值按照大小顺序排列,居于中间位置的那个数值按照大小顺序排列,居于中间位置的那个数值就是中位数。值就是中位数。值就是中位数。值就是中位数。它的含义是全部数据中有一半数值在它之上它的含义是全部数据中有一半数值在它之上它的含义是全部数据中有一半数值在它之上它的含义是全部数据中有一半数值在它之上,另另另另一半数值在它之下。一半数值在它之下。一半数值在它之下。一半数值在它之下。MMd d50%50%50%(2)集中趋势测量Md50%50%(2)集中趋势测量)集中趋势测量中位数中位数中位数中位数 计算方法计算方法计算方法计算方法由未分组资料确定中位数由未分组资料确定中位数由未分组资料确定中位数由未分组资料确定中位数 排序:确定中位数位置排序:确定中位数位置排序:确定中位数位置排序:确定中位数位置 奇数:中间位置的标志值为中位数。奇数:中间位置的标志值为中位数。奇数:中间位置的标志值为中位数。奇数:中间位置的标志值为中位数。偶数:中间位置相邻两个变量值的简单平均数偶数:中间位置相邻两个变量值的简单平均数偶数:中间位置相邻两个变量值的简单平均数偶数:中间位置相邻两个变量值的简单平均数是中位数。是中位数。是中位数。是中位数。(2)集中趋势测量原始数据原始数据:24 22 21 26 20排排 序序:20 21 22 24 26位位 置置:1 2 3 4 5位置位置位置位置=n+n+1 12 25+15+12 23 3中位数中位数中位数中位数2222原始数据:24 22 21 26原始数据原始数据:10 5 9 12 6 8排排 序序:5 6 8 9 10 12位位 置置:1 2 3 4 5 6位置位置位置位置 n+n+1 12 26+16+12 23.53.5中位数中位数中位数中位数 8+98+92 28.58.5原始数据:10 5 9 12(2)集中趋势测量)集中趋势测量中位数中位数中位数中位数由定序分组资料求中位数由定序分组资料求中位数由定序分组资料求中位数由定序分组资料求中位数中位数的位置为:中位数的位置为:中位数的位置为:中位数的位置为:(300+1)/2(300+1)/2(300+1)/2(300+1)/2150.5150.5150.5150.5从从从从累累累累计计计计频频频频数数数数看看看看,中中中中位位位位数数数数的的的的在在在在“一一一一般般般般”这这这这一一一一组组组组别别别别中。因此中。因此中。因此中。因此 MMd d一般一般一般一般某城市家庭对住房状况评价的频数分布某城市家庭对住房状况评价的频数分布某城市家庭对住房状况评价的频数分布某城市家庭对住房状况评价的频数分布回答类别回答类别回答类别回答类别甲城市甲城市甲城市甲城市户数户数户数户数 (户户户户)累计频数累计频数累计频数累计频数 非常不满意非常不满意非常不满意非常不满意 不满意不满意不满意不满意 一般一般一般一般 满意满意满意满意 非常满意非常满意非常满意非常满意24241081089393454530302424132132225225270270300300合计合计合计合计300300(2)集中趋势测量中位数的位置为:某城市家庭对住房状况评价的(2)集中趋势测量)集中趋势测量中位数中位数中位数中位数由单值分组资料求中位数由单值分组资料求中位数由单值分组资料求中位数由单值分组资料求中位数l先计算中间位置先计算中间位置:(n+1)2=(150+1)2=75.5l再找出其对应值再找出其对应值(2)集中趋势测量先计算中间位置:由组距分组资料求中位数由组距分组资料求中位数由组距分组资料求中位数由组距分组资料求中位数第一步:确定中位数所处位置,按第一步:确定中位数所处位置,按 确定(确定(f f为次数)。为次数)。第二步:采用公式计算第二步:采用公式计算n n上限法:用上限法:用“以上累计以上累计”法确定中位数。法确定中位数。n n下限法:用下限法:用“以下累计以下累计”法确定中位数。法确定中位数。n n其中:其中:U U是中位数所在组的上限,是中位数所在组的上限,L L是中位数所在组的下限,是中位数所在组的下限,f fmm是中位是中位数所在组的次数,数所在组的次数,S Sm+1m+1是中位数所在组后面各组累计数,是中位数所在组后面各组累计数,S Sm-1m-1是中位是中位数所在组前面各组累计数,数所在组前面各组累计数,i i是中位数所在组的组距。是中位数所在组的组距。由组距分组资料求中位数第一步:确定中位数所处位置,按 (2)集中趋势测量)集中趋势测量算术平均数(算术平均数(算术平均数(算术平均数(The Arithmetic MeanThe Arithmetic Mean)简称简称简称简称均数均数均数均数(MeanMean)或)或)或)或均值均值均值均值,定义为所有测量值,定义为所有测量值,定义为所有测量值,定义为所有测量值之和除以变量值个数(即,样本含量之和除以变量值个数(即,样本含量之和除以变量值个数(即,样本含量之和除以变量值个数(即,样本含量Sample Sample SizeSize)。反映一组呈对称分布的变量值在数量)。反映一组呈对称分布的变量值在数量)。反映一组呈对称分布的变量值在数量)。反映一组呈对称分布的变量值在数量上的平均水平。上的平均水平。上的平均水平。上的平均水平。(2)集中趋势测量(2)集中趋势测量)集中趋势测量算术平均数(算术平均数(算术平均数(算术平均数(The Arithmetic MeanThe Arithmetic Mean)直接计算法直接计算法直接计算法直接计算法计算公式计算公式 :例:试计算例:试计算1,3,7,9的均数?的均数?(2)集中趋势测量计算公式:例:试计算1,3,7,9的均数41(2)集中趋势测量)集中趋势测量算术平均数(算术平均数(算术平均数(算术平均数(The Arithmetic MeanThe Arithmetic Mean)加权算术平均法加权算术平均法加权算术平均法加权算术平均法当数据已分当数据已分当数据已分当数据已分组组,形成了,形成了,形成了,形成了变变量数列:量数列:量数列:量数列:成绩成绩成绩成绩 x x人数人数人数人数 f f 7070808085851 12 22 2合计合计合计合计5 5平均成绩(70+80+85)/3?平均成绩所有人的成绩总和/总人数 (70+80*2+85*2)/580(2)集中趋势测量当数据已分组,形成了变量数列:成绩人数 f(2)集中趋势测量)集中趋势测量算术平均数(算术平均数(算术平均数(算术平均数(The Arithmetic MeanThe Arithmetic Mean)加权算术平均法加权算术平均法加权算术平均法加权算术平均法 计算公式计算公式计算公式计算公式(2)集中趋势测量n例:由单值分组求算术平均值例:由单值分组求算术平均值工人日产量(件)工人日产量(件)工人日产量(件)工人日产量(件)工人人数(人)工人人数(人)工人人数(人)工人人数(人)工人人数比重(工人人数比重(工人人数比重(工人人数比重(%)10 10 11 11 12 12 13 13 14 14 70 70150150380380150150100100 8.75 8.75 12.50 12.50 47.50 47.50 18725 18725 12.50 12.50合合合合 计计计计800800100.00100.00例:由单值分组求算术平均值工人日产量(件)工人人数(人)工人n平均指标的种类平均指标的种类平平平平均均均均指指指指标标标标静态平均数静态平均数动态平均数动态平均数位置平均数位置平均数数值平均数数值平均数几何平均数几何平均数调和平均数调和平均数算术平均数算术平均数中位数中位数众数众数平均指标的种类平静态平均数动态平均数位置平均数数值平均数几何n集中趋势集中趋势(Central tendency)平均指标平均指标一组数据向其中心值靠拢的倾向和程度;一组数据向其中心值靠拢的倾向和程度;一组数据向其中心值靠拢的倾向和程度;一组数据向其中心值靠拢的倾向和程度;测度集中趋势就是寻找数据一般水平的代表值测度集中趋势就是寻找数据一般水平的代表值测度集中趋势就是寻找数据一般水平的代表值测度集中趋势就是寻找数据一般水平的代表值或中心值;或中心值;或中心值;或中心值;不同类型的数据用不同的集中趋势测度值;不同类型的数据用不同的集中趋势测度值;不同类型的数据用不同的集中趋势测度值;不同类型的数据用不同的集中趋势测度值;选用哪一个测度值来反映数据的集中趋势,要选用哪一个测度值来反映数据的集中趋势,要选用哪一个测度值来反映数据的集中趋势,要选用哪一个测度值来反映数据的集中趋势,要根据所掌握的数据的类型来确定。根据所掌握的数据的类型来确定。根据所掌握的数据的类型来确定。根据所掌握的数据的类型来确定。集中趋势(Central tendency)平均指标n众数、中位数、平均数的特点和应用众数、中位数、平均数的特点和应用 众数众数众数众数 不受极端值影响不受极端值影响不受极端值影响不受极端值影响 具有不惟一性具有不惟一性具有不惟一性具有不惟一性 数据分布偏斜程度较大时应用数据分布偏斜程度较大时应用数据分布偏斜程度较大时应用数据分布偏斜程度较大时应用 中位数中位数中位数中位数 不受极端值影响不受极端值影响不受极端值影响不受极端值影响 数据分布偏斜程度较大时应用数据分布偏斜程度较大时应用数据分布偏斜程度较大时应用数据分布偏斜程度较大时应用 平均数平均数平均数平均数 易受极端值影响易受极端值影响易受极端值影响易受极端值影响 数学性质优良数学性质优良数学性质优良数学性质优良 数据对称分布或接近对称分布时应用数据对称分布或接近对称分布时应用数据对称分布或接近对称分布时应用数据对称分布或接近对称分布时应用众数、中位数、平均数的特点和应用左偏分布左偏分布左偏分布左偏分布均值均值均值均值 中位数中位数中位数中位数 众数众数众数众数对称分布对称分布对称分布对称分布 均值均值均值均值=中位数中位数中位数中位数=众数众数众数众数右偏分布右偏分布右偏分布右偏分布众数众数众数众数 中位数中位数中位数中位数 均值均值均值均值众数、中位数和平均数的关系图示众数、中位数和平均数的关系图示众数、中位数和平均数的关系图示众数、中位数和平均数的关系图示中位数、众数和平均数之间的数量关系决定中位数、众数和平均数之间的数量关系决定中位数、众数和平均数之间的数量关系决定中位数、众数和平均数之间的数量关系决定于总体内次数分配的状况。于总体内次数分配的状况。于总体内次数分配的状况。于总体内次数分配的状况。左偏分布均值 中位数 众数对称分布 均值=中位数=众1.描述统计描述统计(1)描述统计的基本技术)描述统计的基本技术(2)集中趋势测量)集中趋势测量(3)离散趋势测量)离散趋势测量1.描述统计(3)离散趋势测量)离散趋势测量所谓所谓所谓所谓离散趋势(又称离中趋势)离散趋势(又称离中趋势)离散趋势(又称离中趋势)离散趋势(又称离中趋势),是指数列中,是指数列中,是指数列中,是指数列中各变量值之间的差距和离散程度。各变量值之间的差距和离散程度。各变量值之间的差距和离散程度。各变量值之间的差距和离散程度。离势小,平均数的代表性高;离势大,平均数离势小,平均数的代表性高;离势大,平均数离势小,平均数的代表性高;离势大,平均数离势小,平均数的代表性高;离势大,平均数代表性低。代表性低。代表性低。代表性低。离中趋势(差异程度)离中趋势(差异程度)离中趋势(差异程度)离中趋势(差异程度)变异指标变异指标变异指标变异指标变异指标变异指标变异指标变异指标用以反映总体各单位标志值的变动范用以反映总体各单位标志值的变动范用以反映总体各单位标志值的变动范用以反映总体各单位标志值的变动范围或参差程度,与平均指标相对应,从另一个围或参差程度,与平均指标相对应,从另一个围或参差程度,与平均指标相对应,从另一个围或参差程度,与平均指标相对应,从另一个侧面反映了总体的特征。侧面反映了总体的特征。侧面反映了总体的特征。侧面反映了总体的特征。(3)离散趋势测量(3)离散趋势测量)离散趋势测量全距全距全距全距(极差极差极差极差Range)Range)R=R=最大值最大值最大值最大值 最小值最小值最小值最小值(R=XR=Xmaxmax X Xminmin)优、缺点优、缺点优、缺点优、缺点 计算简便,意义清楚,但反映现象的差异程度计算简便,意义清楚,但反映现象的差异程度计算简便,意义清楚,但反映现象的差异程度计算简便,意义清楚,但反映现象的差异程度较粗略,实用价值甚小。较粗略,实用价值甚小。较粗略,实用价值甚小。较粗略,实用价值甚小。(3)离散趋势测量(3)离散趋势测量)离散趋势测量异众比率异众比率异众比率异众比率所谓异众比率,是指非众数的频数与总体单位数的比值,用所谓异众比率,是指非众数的频数与总体单位数的比值,用所谓异众比率,是指非众数的频数与总体单位数的比值,用所谓异众比率,是指非众数的频数与总体单位数的比值,用VRVR来表示来表示来表示来表示 其中:其中:其中:其中:f fmomo为众数的频数;为众数的频数;为众数的频数;为众数的频数;n n是总体单位数是总体单位数是总体单位数是总体单位数 异众比率能表明众数所不能代表的那一异众比率能表明众数所不能代表的那一异众比率能表明众数所不能代表的那一异众比率能表明众数所不能代表的那一部分变量值在总体中的比重。部分变量值在总体中的比重。部分变量值在总体中的比重。部分变量值在总体中的比重。(3)离散趋势测量 异众比率能表明众数所不能代表的那一例:根据下表中的数据,计算例:根据下表中的数据,计算异众比率。异众比率。某城市居民关注广告类型的频数分布解:根据公式,得广告类型广告类型广告类型广告类型人数人数人数人数(人)(人)(人)(人)频率频率频率频率(%)(%)商品广告商品广告商品广告商品广告 112 112 112 112 56.0 56.0 56.0 56.0 服务广告服务广告服务广告服务广告 51 51 51 51 25.5 25.5 25.5 25.5 金融广告金融广告金融广告金融广告 9 9 9 9 4.5 4.5 4.5 4.5 房地产广告房地产广告房地产广告房地产广告 16 16 16 16 8.0 8.0 8.0 8.0 招生招聘广告招生招聘广告招生招聘广告招生招聘广告 10 10 10 10 5.0 5.0 5.0 5.0 其他广告其他广告其他广告其他广告 2 2 2 2 1.0 1.0 1.0 1.0 合计合计合计合计 200 200 200 200 100.0 100.0 100.0 100.0 这说这说明在所明在所明在所明在所调查调查的的的的200 200 人人人人当中,关注非商品广告的当中,关注非商品广告的当中,关注非商品广告的当中,关注非商品广告的人数占人数占人数占人数占44%44%,即关注商品,即关注商品,即关注商品,即关注商品广告的人数占广告的人数占广告的人数占广告的人数占 56%56%。由于。由于。由于。由于异众比率异众比率异众比率异众比率值较值较大,从而用大,从而用大,从而用大,从而用“商品广告商品广告商品广告商品广告”来反映城市居民来反映城市居民来反映城市居民来反映城市居民对对广告关注的一般广告关注的一般广告关注的一般广告关注的一般趋势趋势,代表性代表性代表性代表性还还不是很好。不是很好。不是很好。不是很好。例:根据下表中的数据,计算异众比率。某城市居民关注广告类型(3)离散趋势测量)离散趋势测量异众比率异众比率异众比率异众比率 例:某项调查发现,现今三口之家的家庭最多例:某项调查发现,现今三口之家的家庭最多例:某项调查发现,现今三口之家的家庭最多例:某项调查发现,现今三口之家的家庭最多(32%32%),求异众比率。某开发商根据这一报导,将),求异众比率。某开发商根据这一报导,将),求异众比率。某开发商根据这一报导,将),求异众比率。某开发商根据这一报导,将房屋的户型大部分都设计为适合三口之家居住的样房屋的户型大部分都设计为适合三口之家居住的样房屋的户型大部分都设计为适合三口之家居住的样房屋的户型大部分都设计为适合三口之家居住的样式和面积,你认为如何呢?式和面积,你认为如何呢?式和面积,你认为如何呢?式和面积,你认为如何呢?(3)离散趋势测量(3)离散趋势测量)离散趋势测量四分位差四分位差四分位差四分位差(Quartile deviation)(Quartile deviation)四分位数(四分位数(四分位数(四分位数(QuartileQuartile)(三个四分位数)(三个四分位数)(三个四分位数)(三个四分位数)一组数据按从小到大排列时,处于一组数据按从小到大排列时,处于一组数据按从小到大排列时,处于一组数据按从小到大排列时,处于1/41/4位置上的位置上的位置上的位置上的变量值称为第一个四分位数(下四分位数),处变量值称为第一个四分位数(下四分位数),处变量值称为第一个四分位数(下四分位数),处变量值称为第一个四分位数(下四分位数),处于于于于3/43/4位置上的变量值称为第三个四分位数(上位置上的变量值称为第三个四分位数(上位置上的变量值称为第三个四分位数(上位置上的变量值称为第三个四分位数(上四分位数),而中位数就是第二个四分位数。四分位数),而中位数就是第二个四分位数。四分位数),而中位数就是第二个四分位数。四分位数),而中位数就是第二个四分位数。四分位数通常用符号四分位数通常用符号四分位数通常用符号四分位数通常用符号Q Q表示。表示。表示。表示。(3)离散趋势测量在未分在未分组时下四分位数(下四分位数(Q1)的位置)的位置上四分位数(上四分位数(Q3)的位置)的位置显然,中然,中间的四分位数(的四分位数(Q2)就等于)就等于Md。(3)离散)离散趋势测量量四分位差四分位差四分位差四分位差(Quartile deviation)(Quartile deviation)四分位数的确定四分位数的确定四分位数的确定四分位数的确定在未分组时(3)离散趋势测量例:根据下表中的数据,计算甲城市例:根据下表中的数据,计算甲城市例:根据下表中的数据,计算甲城市例:根据下表中的数据,计算甲城市家庭对住房满意状况评价的四分位数。家庭对住房满意状况评价的四分位数。家庭对住房满意状况评价的四分位数。家庭对住房满意状况评价的四分位数。甲城市家庭对住房状况的评价解:已知解:已知N=300,得,得下四分位数的位置下四分位数的位置上四分位数的位置上四分位数的位置则根据累根据累积频数数Q1=不不满意,意,Q3=满意意回答类别回答类别回答类别回答类别甲城市甲城市甲城市甲城市户数户数户数户数(户)(户)(户)(户)累积累积累积累积户数户数户数户数(户)(户)(户)(户)非常不满意非常不满意非常不满意非常不满意24242424不满意不满意不满意不满意108108132132一般一般一般一般9393225225满意满意满意满意4545270270非常满意非常满意非常满意非常满意3030300300合计合计合计合计300300例:根据下表中的数据,计算甲城市家庭对住房满意状况评价的四分(3)离散趋势测量)离散趋势测量四分位差四分位差四分位差四分位差 四分位差是第三四分位数(上四分位数)和第四分位差是第三四分位数(上四分位数)和第四分位差是第三四分位数(上四分位数)和第四分位差是第三四分位数(上四分位数)和第一四分位数(下四分位数)的半距。一四分位数(下四分位数)的半距。一四分位数(下四分位数)的半距。一四分位数(下四分位数)的半距。其作用是避免全距受极端值影响大的缺点。其作用是避免全距受极端值影响大的缺点。其作用是避免全距受极端值影响大的缺点。其作用是避免全距受极端值影响大的缺点。计算公式计算公式计算公式计算公式 在定距和定比变量中在定距和定比变量中在定距和定比变量中在定距和定比变量中 在定序变量中在定序变量中在定序变量中在定序变量中(3)离散趋势测量(3)离散趋势测量)离散趋势测量标准差(标准差(标准差(标准差(Standard deviation)Standard deviation)各变量值对其算术平均数的离差平方的算术平各变量值对其算术平均数的离差平方的算术平各变量值对其算术平均数的离差平方的算术平各变量值对其算术平均数的离差平方的算术平均数的平方根,又称均数的平方根,又称均数的平方根,又称均数的平方根,又称均方差均方差均方差均方差,用,用,用,用S S表示。表示。表示。表示。标准差是最常用的离散程度测度值。标准差是最常用的离散程度测度值。标准差是最常用的离散程度测度值。标准差是最常用的离散程度测度值。基本公式:基本公式:基本公式:基本公式:或或或或(3)离散趋势测量(3)离散趋势测量)离散趋势测量标准差标准差标准差标准差 未分组资料标准差的计算未分组资料标准差的计算未分组资料标准差的计算未分组资料标准差的计算 例:求例:求例:求例:求7272、8181、8686、6969、5757这这些数字的些数字的些数字的些数字的标标准差。准差。准差。准差。7272-1-11 181818 86464868613131691696969-4-416165757-16-162562563653650 0506506(3)离散趋势测量 例:求72、81、86、69、57这(3)离散趋势测量)离散趋势测量标准差标准差标准差标准差 分组资料标准差的计算分组资料标准差的计算分组资料标准差的计算分组资料标准差的计算 计算公式计算公式计算公式计算公式 式中式中式中式中f fi i为第为第为第为第i i组的次数组的次数组的次数组的次数(3)离散趋势测量n例:调查大一男生例:调查大一男生60人的身高情况如下表所人的身高情况如下表所示,求他们身高的标准差。示,求他们身高的标准差。计算计算左边数左边数列的标列的标准差准差组距组距组距组距f f1501541501541 11541581541582 21581621581627 71621661621661010166170166170161617017417017412121741781741787 71781821781825 5合计合计合计合计6060例:调查大一男生60人的身高情况如下表所示,求他们身高的标准组距组距组距组距f fx x1501541501541 1152152-16.5-16.5272272272.3272.31541581541582 2156156-12.5-12.5156156312.5312.51581621581627 7160160-8.5-8.572.372.3505.8505.81621661621661010164164-4.5-4.520.320.3202.5202.51661701661701616168168-0.5-0.50.250.254 417017417017412121721723.53.512.312.31471471741781741787 71761767.57.556.356.3393.8393.81781821781825 518018011.511.5132132661.3661.3合计合计合计合计6060-0 0-24992499组距fx1501541152-16.5272272.一、资料的整理和分析一、资料的整理和分析一、资料的整理和分析2.推论统计推论统计推论统计推论统计推论统计推论统计就是利用样本的统计值对总体的参数就是利用样本的统计值对总体的参数就是利用样本的统计值对总体的参数就是利用样本的统计值对总体的参数值进行估计的方法。值进行估计的方法。值进行估计的方法。值进行估计的方法。推论统计的内容主要包括两个方面:推论统计的内容主要包括两个方面:推论统计的内容主要包括两个方面:推论统计的内容主要包括两个方面:(1 1)区间估计)区间估计)区间估计)区间估计(2 2)假设检验)假设检验)假设检验)假设检验2.推论统计(1 1)区间估计)区间估计)区间估计)区间估计(Interval Estimation)(Interval Estimation)以样本统计量的抽样分布为理论依据,按一定以样本统计量的抽样分布为理论依据,按一定以样本统计量的抽样分布为理论依据,按一定以样本统计量的抽样分布为理论依据,按一定概率要求,由样本统计量的值来估计总体参数概率要求,由样本统计量的值来估计总体参数概率要求,由样本统计量的值来估计总体参数概率要求,由样本统计量的值来估计总体参数的值所在的范围,叫做的值所在的范围,叫做的值所在的范围,叫做的值所在的范围,叫做总体参数的区间估计总体参数的区间估计总体参数的区间估计总体参数的区间估计。区间估计的实质就是在一定的可信度(置信度)区间估计的实质就是在一定的可信度(置信度)区间估计的实质就是在一定的可信度(置信度)区间估计的实质就是在一定的可信度(置信度)下,用样本统计值的某个范围(置信区间)来下,用样本统计值的某个范围(置信区间)来下,用样本统计值的某个范围(置信区间)来下,用样本统计值的某个范围(置信区间)来估价总体的参数值。范围的大小反映的是这种估价总体的参数值。范围的大小反映的是这种估价总体的参数值。范围的大小反映的是这种估价总体的参数值。范围的大小反映的是这种估计的精确性问题,而可信度高低反映的则是估计的精确性问题,而可信度高低反映的则是估计的精确性问题,而可信度高低反映的则是估计的精确性问题,而可信度高低反映的则是这种估计的可靠性或把握性的问题。这种估计的可靠性或把握性的问题。这种估计的可靠性或把握性的问题。这种估计的可靠性或把握性的问题。(1)区间估计(Interval Estimation)(1 1)区间估计)区间估计)区间估计)区间估计区间估计的结果通常可以采取下述方式来表述区间估计的结果通常可以采取下述方式来表述区间估计的结果通常可以采取下述方式来表述区间估计的结果通常可以采取下述方式来表述:我们有我们有我们有我们有95%95%的把握认为,全市职工的月收入在的把握认为,全市职工的月收入在的把握认为,全市职工的月收入在的把握认为,全市职工的月收入在182182元元元元至至至至218218元之间元之间元之间元之间。全市人口中,女性占全市人口中,女性占全市人口中,女性占全市人口中,女性占50%50%至至至至52%52%的可能性为的可能性为的可能性为的可能性为99%99%。区间估计中的可靠性或把握性是指用某个区间区间估计中的可靠性或把握性是指用某个区间区间估计中的可靠性或把握性是指用某个区间区间估计中的可靠性或把握性是指用某个区间去估计总体参数值时,成功的可能性有多大。去估计总体参数值时,成功的可能性有多大。去估计总体参数值时,成功的可能性有多大。去估计总体参数值时,成功的可能性有多大。它可以这样来解释:如果从这个总体中重复抽它可以这样来解释:如果从这个总体中重复抽它可以这样来解释:如果从这个总体中重复抽它可以这样来解释:如果从这个总体中重复抽样样样样100100次,约有次,约有次,约有次,约有9595次所抽样本的统计值都落在次所抽样本的统计值都落在次所抽样本的统计值都落在次所抽样本的统计值都落在这个区间。说明这个区间估计的可靠性为这个区间。说明这个区间估计的可靠性为这个区间。说明这个区间估计的可靠性为这个区间。说明这个区间估计的可靠性为95%95%。(1)区间估计n对于同一总体和同一抽样规模来说对于同一总体和同一抽样规模来说对于同一总体和同一抽样规模来说对于同一总体和同一抽样规模来说所给区间的大小与做出这种估计所具有的把握性形成所给区间的大小与做出这种估计所具有的把握性形成所给区间的大小与做出这种估计所具有的把握性形成所给区间的大小与做出这种估计所具有的把握性形成正比;正比;正比;正比;区间大小所体现的是估计的精确性,区间越大,精确区间大小所体现的是估计的精确性,区间越大,精确区间大小所体现的是估计的精确性,区间越大,精确区间大小所体现的是估计的精确性,区间越大,精确性程度越低,区间越小精确性越高,二者成反比;性程度越低,区间越小精确性越高,二者成反比;性程度越低,区间越小精确性越高,二者成反比;性程度越低,区间越小精确性越高,二者成反比;从精确性出发,要求所估计的区间越小越好,从把握从精确性出发,要求所估计的区间越小越好,从把握从精确性出发,要求所估计的区间越小越好,从把握从精确性出发,要求所估计的区间越小越好,从把握性出发,要求所估计的区间越大越好,因此人们总是性出发,要求所估计的区间越大越好,因此人们总是性出发,要求所估计的区间越大越好,因此人们总是性出发,要求所估计的区间越大越好,因此人们总是需要在这二者之间进行平衡和选择。需要在这二者之间进行平衡和选择。需要在这二者之间进行平衡和选择。需要在这二者之间进行平衡和选择。n n在社会统计中,常用的置信度分别为在社会统计中,常用的置信度分别为在社会统计中,常用的置信度分别为在社会统计中,常用的置信度分别为90%90%,95%95%和和和和99%99%。与他们所对应的允许误差。与他们所对应的允许误差。与他们所对应的允许误差。与他们所对应的允许误差()()分别为分别为分别为分别为10%10%,5%5%和和和和1%1%。在计算中,置信度常用。在计算中,置信度常用。在计算中,置信度常用。在计算中,置信度常用1-1-来表示。来表示。来表示。来表示。对于同一总体和同一抽样规模来说(2 2)假设检验)假设检验)假设检验)假设检验利用样本信息,根据一定的概率,对总体参数利用样本信息,根据一定的概率,对总体参数利用样本信息,根据一定的概率,对总体参数利用样本信息,根据一定的概率,对总体参数或分布的某一假设作出拒绝或保留的决断,称或分布的某一假设作出拒绝或保留的决断,称或分布的某一假设作出拒绝或保留的决断,称或分布的某一假设作出拒绝或保留的决断,称为为为为假设检验假设检验假设检验假设检验。假设检验实际上就是
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!