统计学基础--统计和数据-课件

上传人:无*** 文档编号:241705460 上传时间:2024-07-17 格式:PPT 页数:43 大小:4.53MB
返回 下载 相关 举报
统计学基础--统计和数据-课件_第1页
第1页 / 共43页
统计学基础--统计和数据-课件_第2页
第2页 / 共43页
统计学基础--统计和数据-课件_第3页
第3页 / 共43页
点击查看更多>>
资源描述
统计学基础-统计和数据统计学2017年9月2第一章 统计和数据1.1 1.1 统计及其应用领域统计及其应用领域1.2 1.2 统计数据及其类型统计数据及其类型1.3 1.3 统计中的基本概念统计中的基本概念31.1统计及其及其应用用领域域什么是什么是统计n从不同的角度理解可以有三种含义:从不同的角度理解可以有三种含义:n1 1统计工作统计工作对社会经济现象的数量方面进行对社会经济现象的数量方面进行搜集、整理、分析研究所做的工作。搜集、整理、分析研究所做的工作。如:如:“你是你是不是搞统计的?不是搞统计的?”n2 2统计资料统计资料指反映社会经济现象的数量方面指反映社会经济现象的数量方面的数字及文字资料。的数字及文字资料。如:如:“据统计据统计”。n3 3统计学统计学系统论述统计工作原理和方法的科系统论述统计工作原理和方法的科学。学。如:如:“我正在学统计我正在学统计”。41.1统计及其及其应用用领域域一、什么是一、什么是统计学学n1.数据收集:取得数据数据收集:取得数据n2.数据处理:图表展示数数据处理:图表展示数据据n3.数据分析:分析数据数据分析:分析数据 n4.数据解释:结果的说明数据解释:结果的说明 统统计计学学是是收收集集、处处理理、分分析析、解解释释数数据据并从中得出结论的科学并从中得出结论的科学 5什么是统计学?n1.收集数据收集数据Collecting Datan 例:例:问问卷卷调查调查Surveyn2.表示数据表示数据Presenting Datan 例:例:图图表表Charts&Tables n3.描述数据描述数据Characterizing Datan 例:平均例:平均值值Average为什么?什么?数据分析数据分析Data Analysis做出决策做出决策Decision-Making?1984-1994 T/Maker Co.统计学分类78描述统计示例9描述统计描述统计示例示例我国高等学校历年毕业生人数(万人)我国高等学校历年毕业生人数(万人)1011推断统计示例n饲养场规定,肉鸡平均体重超过饲养场规定,肉鸡平均体重超过3 3千克时方可屠宰,千克时方可屠宰,现随机抽取现随机抽取2020只,测得平均体重为只,测得平均体重为2.952.95千克,方千克,方差为差为0.20.2千克,请问,该批鸡是否达到屠宰标准?千克,请问,该批鸡是否达到屠宰标准?12某产品广告投入和销售额数据某产品广告投入和销售额数据(单位:万元单位:万元)广告广告1.03.23.25.55.97.17.39.210.812.1销售额销售额9.431.833.252.453.556.056.959.260.163.51.这两个变量之间是否有关系这两个变量之间是否有关系?2.如果有关系如果有关系,它们的关系是否显著它们的关系是否显著?3.二者是什么关系二者是什么关系?是否可以用数学模型来描述是否可以用数学模型来描述?推断统计示例推断统计示例13二、二、统计学的学的应用用领域域统计学统计学经济学经济学经济学经济学管理学管理学管理学管理学医学医学医学医学工程学工程学工程学工程学社会学社会学社会学社会学食品科学食品科学食品科学食品科学14统计学的应用领域15文学也用到统计学n19811981年,首届国际年,首届国际红楼梦红楼梦研讨会在美国召开,研讨会在美国召开,威斯康星大学讲师陈炳藻独树一帜,宣读了题为威斯康星大学讲师陈炳藻独树一帜,宣读了题为从词汇上的统计论红楼梦作者的问题从词汇上的统计论红楼梦作者的问题的论文。的论文。他从字、词出现频率入手,通过计算机进行统计、他从字、词出现频率入手,通过计算机进行统计、处理、分析,对处理、分析,对红楼梦红楼梦后后4040回系高鹗所作这一回系高鹗所作这一流行看法提出异议,认为流行看法提出异议,认为120120回均系曹雪芹所作。回均系曹雪芹所作。16三、统计的误用与滥用n问:统计资料表明,大多数汽车事故发生在中等问:统计资料表明,大多数汽车事故发生在中等速度的行驶中,极少数的事故是发生在大于速度的行驶中,极少数的事故是发生在大于150150公里小时的行驶速度上。这是否就意味着高速公里小时的行驶速度上。这是否就意味着高速行驶比较安全?行驶比较安全?n答:绝不是这样。统计关系往往不能表明因果关答:绝不是这样。统计关系往往不能表明因果关系。由于多数人是以中等速度开车,所以多数事系。由于多数人是以中等速度开车,所以多数事故是发生在中等速度的行驶中故是发生在中等速度的行驶中17n问:统计数字还表明,在亚利桑那州死于肺结核问:统计数字还表明,在亚利桑那州死于肺结核的人比其他州死于肺结核的人多。这是否就意味的人比其他州死于肺结核的人多。这是否就意味着亚利桑那州的气候容易生肺病?着亚利桑那州的气候容易生肺病?n答:正好相反。亚利桑那的气候对生肺病的人有答:正好相反。亚利桑那的气候对生肺病的人有好处,所以肺病患者纷纷前来,自然就使这个州好处,所以肺病患者纷纷前来,自然就使这个州死于肺结核的平均数升高了。死于肺结核的平均数升高了。181.2 统计数据及其类型1920 产品质量分为一等品;二等品;三等品。评价分数为产品质量分为一等品;二等品;三等品。评价分数为优;良;差。劳动效率分为高;中;低。优;良;差。劳动效率分为高;中;低。1.2 数据的类型数据的类型分类数据分类数据(categorical data)人口按性别分为男;女。职业分为国家机关、党人口按性别分为男;女。职业分为国家机关、党群组织工作人员、企事业单位管理人员;各类专业、群组织工作人员、企事业单位管理人员;各类专业、技术人员;办事人员和有关人员;商业与服务业人员;技术人员;办事人员和有关人员;商业与服务业人员;农林牧渔业生产人员;生产人员,运输人员和有关人农林牧渔业生产人员;生产人员,运输人员和有关人员;军队;不便分类的其他劳动者员;军队;不便分类的其他劳动者8 8类。类。顺序数据顺序数据(rank data)人的身高分为人的身高分为168cm168cm;175cm175cm;183cm183cm。销售利润为。销售利润为3030万万元;元;5050万元;万元;8080万元。年薪为万元。年薪为2020万元;万元;3535万元;万元;5050万元。万元。数值型数据数值型数据(metric data)分类标准:计量尺度分类标准:计量尺度2122对课本第6页的解释23在实验中控制实验对象而收集到的数据。在实验中控制实验对象而收集到的数据。1.2 数据的类型数据的类型观测数据观测数据(observational data)在没有对事物人为控制的条件下而得到的数据。在没有对事物人为控制的条件下而得到的数据。实验数据实验数据(experimental data)分类标准:收集方法分类标准:收集方法24 第三产业对国民经济的拉动作用,第三产业对国民经济的拉动作用,19901990年为年为0.60.6,19951995年为年为2.92.9,20002000年为年为2.92.9,20052005年为年为4.24.2,20062006年为年为4.94.9,20072007年为年为5.15.1。1.2 数据的类型数据的类型截面数据截面数据(cross-sectional data)20092009年中国年中国GDPGDP达到达到33.5333.53万亿元,城镇居民万亿元,城镇居民人均可支配收入人均可支配收入1717517175元,农村居民人均纯收入元,农村居民人均纯收入51535153元元。时间序列数据时间序列数据(time series data)分类标准:时间状况分类标准:时间状况2526对课本第7页的解释27281.3 统计中的基本概念统计中的基本概念一、总体和样本一、总体和样本二、参数和统计量二、参数和统计量三、变量三、变量29一、总体和样本1.总体(population)总体是所研究的全部元素的集合,其中的每一个元素称为个体 分为有限总体和无限总体n有限总体的范围能够明确确定,且元素的数目是有限的n无限总体所包括的元素是无限的,不可数的30研究食品研究食品3 3学生的学习情况学生的学习情况总体总体全班所有的学生全班所有的学生个体个体每一个学生每一个学生广州市的工业生产情况广州市的工业生产情况所有的工业企业所有的工业企业每一个工业企业每一个工业企业广州的工业生产设备情况广州的工业生产设备情况每一台工业生产设备每一台工业生产设备所有的工业生产设备所有的工业生产设备总体总体总体总体个体个体个体个体312.2.2.2.样本样本样本样本 (sample)(sample)(sample)(sample)n n从总体中抽取的从总体中抽取的从总体中抽取的从总体中抽取的一部分一部分一部分一部分元素的集合元素的集合元素的集合元素的集合n n构成样本的元素的数目称为构成样本的元素的数目称为构成样本的元素的数目称为构成样本的元素的数目称为样本量样本量样本量样本量32总体总体个体个体样样本本个体个体 个体个体个体个体总体和样本总体和样本3334练习35练习363738二、参数和统计量1.参数(parameter)用来描述总体特征的概括性数字度量参数主要有总体均值()、标准差()、总体比例()等总体参数通常用希腊字母表示 2.统计量(statistic)用来描述样本特征的概括性数字度量 样本统计量有样本均值(x)、样本标准差(s)、样本比例(p)等样本统计量通常用小写英文字母来表示 3940总体参数一般是不知道的总体参数一般是不知道的统计学抽样研究的目的就是:统计学抽样研究的目的就是:样本统计量 总体参数41三、变量1.说明现象某种特征的概念如性别、民族、身高、体重、成绩、合格率等变量的具体表现称为变量值,女、苗族、1.68米、50公斤、优等即为变量值也称为数据2.变量可以分为分类变量:说明事物类别的一个名称顺序变量:说明事物有序类别的一个名称数值型变量:说明事物数字特征的一个名称 n离散变量:取有限个整数值 n连续变量:可以取无穷多个小数值 42离散型变量离散型变量 人数人数 2020人、人、5050人、人、8282人、人、123123人等人等连续型变量连续型变量身高身高1.601.60米、米、1.611.61米、米、1.621.62米等米等例如变量值变量值变量值变量值43
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!