生物统计学 第二章 数据的搜集与处理

上传人:努力****83 文档编号:60391029 上传时间:2022-03-07 格式:PPTX 页数:120 大小:5.18MB
返回 下载 相关 举报
生物统计学 第二章 数据的搜集与处理_第1页
第1页 / 共120页
生物统计学 第二章 数据的搜集与处理_第2页
第2页 / 共120页
生物统计学 第二章 数据的搜集与处理_第3页
第3页 / 共120页
点击查看更多>>
资源描述
生物统计学生物统计学 第二章 数据的搜集与处理2学习目标l 了解数据的计量尺度与数据的类型l 了解统计调查方式l 了解数据的获取方法l 了解数据误差及对数据质量的要求l 掌握样本数据基本特征值3第一节第一节 数据的计量与类型数据的计量与类型一 数据的计量尺度二 数据的类型和分析方法三 统计指标及其类型数据的四种计量尺度数据的计量尺度数据的计量尺度6(概念要点)1. 计量层次最低2. 对事物进行平行的分类3. 各类别可以指定数字代码表示4. 使用时必须符合类别穷尽和互斥的要求5. 数据表现为“类别”6. 具有=或 的数学特性7(概念要点)1. 对事物分类的同时给出各类别的顺序2. 比定类尺度精确3. 未测量出类别之间的准确差值4. 数据表现为“类别”,但有序5. 具有或的数学特性8(概念要点)1. 对事物的准确测度2. 比定序尺度精确3. 数据表现为“数值”4. 没有绝对零点5. 具有 + 或 - 的数学特性9(概念要点)1. 对事物的准确测度2. 与定距尺度处于同一层次3. 数据表现为“数值”4. 有绝对零点5. 具有 或 的数学特性10四种计量尺度的比较四种计量尺度的比较定序尺度定序尺度 分类(分类( =, ) 排序(排序( ) 间距(间距( + ,- -) 比值(比值( ,) 计量尺度计量尺度数学特性数学特性“”11数据类型与统计分析方法数据类型与统计分析方法定类数据定类数据定序数据定序数据定性数据定性数据非参数方法非参数方法13变变 量量定序变量定序变量定类变量定类变量数字变量数字变量14统计指标统计指标相对指标相对指标总量指标总量指标平均指标平均指标15第二节第二节 统计数据获取方法统计数据获取方法一 统计调查方式二 数据获取方法统计调查方式统计调查方式18(概念要点)1. 为特定目的专门组织的非经常性全面调查2. 通常是一次性或周期性的3. 一般需要规定统一的标准调查时间4. 数据的规范化程度较高5. 应用范围比较狭窄19(概念要点)1. 从总体中随机抽取一部分单位(样本)进行调查4. 具有经济性、时 效性强、适应面 广、准确性高等 特点2. 目的是推断总体的未知数字特征3. 最常用的调查方式20(概念要点)1. 统计调查方式之一2. 过去曾经是我国主要的数据收集方式3. 按照国家有关法规的规定、自上而下地统一布置、自下而上地逐级提供基本统计数据4. 有各种各样的类型21(概念要点)2. 典型调查典型调查从调查对象的全部单位中选择少数典型单位进行调查目的是描述和揭示事物的本质特征和规律调查结果不能用于推断总体从调查对象的全部单位中选择少数重点单位进行调查调查结果不能用于推断总体22数据获取方法24(概念要点)1. 调查者与被调查者通过面对面地交谈而获得资料2. 有标准式访问和非标准式访问 标准式访问通常按事先设计好的问卷进行 非标准式访问事先一般不制作问卷25(概念要点)1. 也称邮寄问卷调查2. 是一种标准化调查3. 调查者与被调查者没有直接的语言交流,信息的传递依赖于问卷4. 通过某种方式将调查表或问卷送至某调查者手中,由被调查者填写,然后,将问卷寄回到指定的收集点5. 问卷或表格的发放方式有邮寄、宣传媒介传送、专门场所分发三种26(概念要点)1. 调查者利用电话与被调查者进行语言交流以获得信息2. 时效快、成本低3. 问题的数量不宜过多 27电脑辅助调查与网络调查电脑辅助调查与网络调查1. 一种为电脑辅助电话调查2. 电脑与电话相结合完成调查的全过程3. 或者借助于网络平台设计专门的软件进行4. 硬件设备要求较高28座谈会座谈会(概念要点)1. 也称集体访谈2. 将一组被调查者集中在调查现场,让他们对调查的主题发表意见以获得资料3. 参加座谈会的人数不宜过多,一般限定在610人左右4. 侧重于定性研究29个别深度访问个别深度访问(概念要点)1. 一次只有一名受访者参加、针对特殊问题的调查2. 适合于较隐秘的问题,如个人心理、隐私问题;或较敏感的问题,如性、政治方面的问题3. 侧重于定性研究我明天能找到阿里巴巴的宝藏吗?30观察法观察法(概念要点)1. 就调查对象的行动和意识,调查人员边观察边记录以收集所需信息2. 调查人员不是强行介入3. 能够在被调查者不察觉的情况下获得资料31实验法实验法(概念要点)1. 在设定的特殊实验场所、特殊状态下,对调查对象进行实验以获得所需资料2. 有室内实验法和野外实验法32生态学个体调查方法1. 直接法2. 间接法鄙视你鄙视你! !1 直接法l直接观察l逐株调查l利用框法观察l鸣叫声、双目望远镜、飞机l摄影l镜检土壤微生物稻田环境取样稻田环境取样稻田环境取样稻田环境取样稻田环境取样2 间接法l机械法:采泥机、捕虫网、浮游生物网、渔网l生物取样法l生活反应的利用l标记法或释放重捕法2.2 生物取样法l 利用动物的趋性反应l 诱测灯、食饵盆、钓具、性外激素、陷阱等等2.3 生活反应的利用l 例如,粪便的利用,食叶性昆虫、哺乳动物等l 足迹的利用,哺乳动物、鸟类等l 蚜虫和叶蝉类的排泄物甘露等l 利用细菌繁殖状态估计原生动物数l 植物上的食痕2.4 标记法或释放重捕法l 捕获个体l 用清漆或足环标记后释放,经过一定时间后采集l 根据采集物中的标记个体回收率估算全部个体的数量调查鱼类所用的主要方法(1) 生境生境取样设备取样设备结果和用途结果和用途湖区中层拖网提供样本; 可用于定量分析并提供有关垂直分布情况的资料围网提供样本; 可用于定量评估并提供有关垂直分布情况的资料刺网提供样本; 可提供有关垂直分布情况的资料液压声频仪可用于定量评估并可提供有关垂直分布情况的资料水下摄象动态和有关生境使用情况的资料近岸区刺网提供样本电击设备提供样本张网提供样本地曳网提供样本; 可用来进行定量评估毒物(鱼藤酮)提供样本; 可用来进行定量评估水下摄象可用来进行定量评估并可提供有关垂直分布情况和动态的资料斯库巴可用来进行定量评估并提供有关垂直分布情况和动态的资料调查鱼类所用的主要方法(2)深水区底层拖网提供样本; 可用来进行定量评估并提供有关垂直分布情况的资料刺网提供样本; 可提供有关垂直分布情况的资料张网提供样本; 可提供有关垂直分布情况的资料水下摄象提供样本; 可用来进行定量评估并提供有关垂直分布情况的资料斯库巴提供样本; 可用来在某种程度上 进行定量评估并提供有关垂直分布情况的资料激流体系电击设备提供样本; 可在某种程度上说明丰度情况毒物提供样本; 可在某种程度上说明丰度情况刺网提供样本袋张网/环袋网提供样本; 可用来进行定量评估斯库巴/使用水下呼吸管潜游提供样本; 可用来进行某种程度的定量评估并提供有关垂直分布情况的资料液压声频仪可用来进行定量评估并提供有关垂直分布情况的资料统计数据的间接来源 公开出版物:公开出版物:中国统计年鉴、 中国统计摘要中国社会统计年鉴、中国农村统计年鉴 中国市场统计年鉴、中国工业经济统计年鉴中国人口统计年鉴、世界经济年鉴国外经济统计资料、世界发展报告 中国统计出版社专业数据库l粮农组织实质统计共用数据库粮农组织实质统计共用数据库 FAOSTAT多国文字网上数据库拥有超过100万个时间系列记录涵盖各种国际统计数字主要包括:生产、贸易、粮食平衡表、粮食援助的运输记录、化肥与农药、土地利用与灌溉、森林产品、渔业产品、人口、农业机械 数据库总汇l生物类综合数据库http:/ 统计数据的质量统计数据的质量一 统计数据的误差二 统计数据的质量要求误差来源登记性误差登记性误差数据误差的来源代表性误差代表性误差58统计数据的误差1. 统计数据与客观现实之间的差距2. 有登记性误差和代表性误差两类由于调查者或被调查者的人为因素所造成的误差,理论上讲可以消除。用样本数据进行推断时所产生的误差。通常无法消除,但事先可以进行控制和计算。59统计数据的质量要求标准最低的抽样误差或随机误差最小的非抽样误差或偏差满足用户决策、管理和研究的需要在最短的时间里取得并公布数据保持时间序列的可比性以最经济的方式取得数据60第四节第四节 统计数据的初步处理统计数据的初步处理一 频数表和频数图二 整理和展示数据三 频数分布的意义四 频数分布的不确定性频数表和频数图62高粱株高测量结果高粱株高测量结果63高粱株高频数表高粱株高频数表64定类数据的整理(基本过程)1. 列出列出各类别各类别2. 计算各类别的频数3. 制作频数分布表4. 用图形显示数据定类数据的条形图展示(由 Excel 绘制的条形图)人数(人)人数(人)5191610211204080120高血压慢性支气管炎恶性肿瘤心脏病糖尿病传染病疾疾病病类类型型 定类数据的饼图展示(由 Excel 绘制的圆形图)传染病1.0%心脏病8.0%高血压56.0%恶性肿瘤4.5%慢性支气管炎25.5%糖尿病5.8%定序数据的整理(可计算的指标)1. 累计频数:累计频数:将各类别的频数逐级累加2. 累计频率:累计频率:将各类别的频率(百分比)逐级累加定序数据的累计频数分布图展示(由 Excel 绘制的累计频数分布图)243001322252700100200300400非常不满意不满意一般满意非常满意累积人数(人)(a)向下累积向下累积27616830300750100200300400非常不满意不满意一般满意非常满意累积人数(人)(b)向上累积向上累积品质数据的环形图展示(由 Excel 绘制的环形图)8%36%31%15%7%33%26%21%13%10%非常不满意不满意一般满意非常满意 数值型数据数值型数据的整理的整理与展示与展示频数分布表的编制(实例)l 117 122 124 129 139 107 117 130 122 125l 108 131 125 117 122 133 126 122 118 108l 110 118 123 126 133 134 127 123 118 112l 112 134 127 123 119 113 120 123 127 135l 137 114 120 128 124 115 139 128 124 121某机构开展健某机构开展健康研究,调查康研究,调查了某地人群血了某地人群血压压( (收缩压收缩压) )数数值(值(mmHg)共调查了共调查了5050人人试采试采用单变量用单变量值对数据进行值对数据进行分组分组。编制频数分布表的步骤确确定定组组数数确确定定组组距距计计算算频频数数编编制制表表格格组距分组(几个概念)1. 下下 限:限:一个组的最小值2. 上上 限:限:一个组的最大值3. 组组 距:距:上限与下限之差4. 组中值:组中值:下限与上限之间的中点值分组方法分组方法等距分组等距分组异距分组异距分组单变量值分组单变量值分组组距分组组距分组单变量值分组单变量值分组表表(实例)实例)某地某地5050人的血压人的血压( (收缩压收缩压) )调查数值(调查数值(mmHg)收缩压收缩压频数频数( (人人) )收缩压收缩压频数频数( (人人) )收缩压收缩压频数频数( (人人) )107108110112113114115117118121211133119120121122123124125126127121443223128129130131133134135137139211122112等距分组表(上下组限重叠重叠)某地某地5050人的血压人的血压( (收缩压收缩压) )调查数值分组调查数值分组对收缩压范围分组对收缩压范围分组频数(人)频数(人)频率(频率(%)105110110115115120120125125130130135135140358141064610162820128合计合计50100等距分组表(上下组限间断间断)某地某地5050人的血压人的血压( (收缩压收缩压) )调查数值分组调查数值分组对收缩压范围分组对收缩压范围分组频数(人)频数(人)频率(频率(%)105109110114115119120124125129130134135139358141064610162820128合计合计50100等距分组表(使用开口组)某地某地5050人的血压人的血压( (收缩压收缩压) )调查数值分组调查数值分组对收缩压范围分组对收缩压范围分组频数(人)频数(人)频率(频率(%)110以下以下110114115119120124125129130134135以上以上358141064610162820128合计合计50100分组数据直方图展示(直方图的绘制)频频数数收缩压收缩压( (mmHg)分组数据折线图展示(折线图的绘制)收缩压收缩压( (mmHg)未分组数据的茎叶图展示(茎叶图的制作)未分组数据多批数据箱线图(实例)英语英语高等数学高等数学生物化学生物化学微生物实验微生物实验微生物学微生物学生态学生态学生物统计学生物统计学计算机应用基础计算机应用基础76659374687055859095818775739178975176857092688171748869846573957078669073788470936379806087816786918377769070828382928481706972787578918866948085718674687962818155787075687177未分组数据的多批数据箱线图展示(由STATIATICA绘制的多批数据箱线图)高等数学英语生物化学微生物实验微生物学生态学生物统计学计算机基础时间序列数据的线图展示(由 Excel 绘制的线图)020004000600019911992199319941995199619971998城镇居民农村居民医疗医疗支出支出(元)(元) 0500100015002000 食品食品 衣着衣着 家庭设备用家庭设备用 品及服务品及服务 医疗保健医疗保健 交通通讯交通通讯 娱乐教育娱乐教育 文化服务文化服务 居住居住 杂项商品杂项商品 与服务与服务城镇居民农村居民 (元)(元)多变量数据的雷达图展示(由 Excel 绘制的雷达图)88雷达图雷达图89ChinaJapanUSA数据类型及图示(小结)数据类型与显示数据类型与显示数值型数据数值型数据品质数据品质数据分组数据分组数据总计表总计表茎茎叶叶图图条条形形图图圆圆形形图图环环形形图图直直方方图图箱箱线线图图折折线线图图原始数据原始数据时序数据时序数据线线图图雷雷达达图图多元数据多元数据频数分布的类型频数分布的意义l 依据频数的分布,可以知道数据的聚集程度。参数为平均值:算术平均数、中位数和众数。l 直观了解数据的变异情况。l 获得数据的图形分布。92频数分布的不确定性93第五节第五节 样本数据的基本特征值样本数据的基本特征值一 平均数与计算二 标准差与计算三 偏斜度和峭度四 变异系数数据分布的特征和测度数据的特征和测度数据的特征和测度分布的形状分布的形状集中趋势集中趋势离散程度离散程度 平均值定义l 算术平均数:样本中n个数的和除以n。l 中位数:将样本中的n个数按照大小顺序排列,中间的数为中位数( n为偶数时将中间的两个数求算术平均数)。l 众数:样本中n个数分组后,频数最高的组值(连续型数据为该组的中值)。可以有多个众数。96均值(概念要点)1. 集中趋势的测度值之一2. 最常用的测度值3. 一组数据的均衡点所在4. 易受极端值的影响5. 用于数值型数据,不用于定类和定序数据均值(计算公式)设一组数据为:设一组数据为:X1 ,X2 , ,XN 简单均值的计算公式为简单均值的计算公式为简单均值(算例) 原始数据:10,5,9,13,6,8中位数(概念要点)中位数(位置的确定)众数(概念要点)1. 集中趋势的测度值之一2. 出现次数最多的变量值3. 不受极端值的影响4. 可能没有众数或有几个众数5. 主要用于定类数据,也可用于定序数据和数值型数据众数(众数的不唯一性)无众数无众数原始数据: 10 5 9 12 6 8众数、中位数和均值的关系定距和定比数据:方差和标准差极差(概念要点及计算公式)1. 一组数据的最大值与最小值之差2. 离散程度的最简单测度值3. 易受极端值影响4. 未考虑数据的分布方差和标准差(概念要点)1.离散程度的测度值之一2.最常用的测度值3.反映了数据的分布4.反映了各变量值与均值的平均差异5.依据总体数据计算,称为总体方差或标准差; 依据样本数据计算,称为样本方差或标准差总体方差和标准差(计算公式)样本方差和标准差(计算公式)样本方差自由度(degree of freedom)1.一组数据中可以自由取值的数据的个数2.当样本数据的个数为n 时,若样本均值x 确定后,只有n-1个数据可以自由取值,其中,必有一个数据则不能自由取值3.例如,假设样本有3个数值,即x1=2,x2=4,x3=9,则x = 5。当x = 5确定后,x1,x2和x3有两个数据可以自由取值,另一个不能自由取值,比如x1=6,x2=7,那么x3则必然取2,而不能取其他值4.样本方差用自由度去除,其原因可多方面来解释,从实际应用角度看,在抽样估计中,当用样本方差去估计总体方差2时,它是2的无偏估计量样本方差(算例) 原始数据: 10 5 9 13 6 8样本标准差(算例)样本标准差样本标准差偏斜度和峭度偏斜度和峭度113正偏正偏负偏负偏中心矩与原点矩概念中心矩与原点矩概念二阶中心矩二阶原点矩114nxxmmmmmnxnxxnxnxxmmmnxnxnxxmnxxm44312133322333212222221)()( 23)( 2)( 3)()()()(0)(偏斜度和峭度的计算公式偏斜度和峭度的计算公式 偏斜度偏斜度(Skewness)的计算公式 偏斜度 是标准化的三阶中心矩,是一个纯数,无单位。其大小说明曲线偏斜程度。当 时,偏斜就很大了。 峭度峭度(Kurtosis)的计算公式2/3231mmg 32242mmg1g21g115变异系数变异系数l例子:玉米A、B品种产量 A=200032;B=1200 20l C.VA=0.016;C.VB=0.017A116xSVC.B本章小结本章小结1. 数据的计量尺度与数据的类型2. 统计调查方式3. 数据的获取方法4. 调查方案的设计5. 数据误差及对数据的质量要求6. 样本数据基本特征值117课堂作业课堂作业l常见展示统计数据的图形有哪些?l什么是总体方差?l什么是样本方差?118作业作业4l思考:如何合理使用平均数。l设计一个野外动物调查方案。l作业3周后提交。119120
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!