资源描述
单击此处编辑母版标题样式,Today:,2024/11/26,名人名言,生活中最重要的问题,其中占大多数实际上只是概率的问题。,拉普拉斯,在终极的分析中,一切知识都是历史。在抽象的意义下,一切科学都是数学。在理性的世界里,所有的判断都是统计学。,C.R,劳,若想了解上帝在想什么,我们就必须学统计,因为统计学就是在量测他的旨意。,南丁格尔,世界上有三种,谎言,:谎言、该死的谎言和,统计,There are three kinds of lies: lies, damned lies and statistics.,马克,吐温,自传引述十九世纪英国首相狄斯雷利的名句,国家统计局相关官员表示,我国居民消费增长较慢,居民消费支出在,GDP,中的比重较低。据悉,,2008,年中国居民消费率,(,居民消费占,GDP,的比重,),为,35.3%,,美国为,70.1%,,印度为,54.7%,。(,09,年,12,月,3,日新华网),“前三季度中国国内生产总值(,GDP,)同比增长,7.7,,其中第三季度增长,8.9,”、“中国城市化率已达,45.68%”,、“,97%,外出农民工已就业”,央视网消息,,CTR,市场研究公司通过随机抽样,电话调查了,2290,个收看家庭,结果显示,,96.1%,的用户收看了今年春晚,其中,81.6%,认为今年春晚办得好。,而,15,日的,广州日报,报道,在某门户网站对今年春晚的满意度调查上,截至今日零时记者截稿前,认为“好”的只占,15.2%,,不到两成,,46.5%,的人认为不好。,春晚的满意度每年都有两个版本,央视永远志得意满,神采飞扬,民间许多人并不买账,骂声不绝。,京华时报,15,日报道,央视市场研究公司公布历年的调查结果,近,5,年来,央视春晚的叫好率逐年走低。其中,,2006,年叫好率为,85.5%,,,2007,年为,83.6%,,,2008,年为,81.1%,,,2009,年为,81.1%,。,绪 论,第一节 生物统计的地位意义,第二节 生物统计学发展简史,第三节 生物统计的主要内容,第四节 生物统计的常用术语,第五节 生物统计学教学要求,第一节 生物统计的地位意义,一、生物统计的概念,生物统计学:,把概率论和数理统计的科学原理和方法应用于生物科学研究中的数量资料的搜集、整理和分析的科学,,是一门应用数学,是现代生物学研究中不可缺少的工具。,数理统计:,是以随机现象的数量特征和分布规律为研究对象的一种数学方法。,重要任务就是,对客观事物得出,本质的和规律性的认识,,使人们对所研究的资料作出,正确的结论,。,第一节 生物统计的地位意义,二、生物统计的地位,生物数学,(Biomathematics):,以数学方法研究和解决生物学问题,并对生物学有关的数学方法进行理论研究,介于生物学和数学之间的边缘学科。从研究使用的数学方法划分,生物数学可分为生物统计学、生物信息学、生物系统论、生物控制论和生物方程等分支。,第一节 生物统计的地位意义,三、生物统计的作用,1,、,为科学地整理分析数据提供方法,2,、,判断试验结果的可靠性,由于存在试验误差,从试验所得的数据资料必须借助于统计分析方法才能获得可靠的结论。,3,、确定事物之间的相互关系,科学试验的目的,不仅是研究事物的特征、特性,同时还要研究事物间的相互关系的联系形式。,4,、提供试验设计的原则和方法,5,、,为学习其他课程提供基础,第一节 生物统计的地位意义,四、生物统计的意义,W.Gosset,于,1908,年以,“,Student,”,笔名将,“,t-,检验,”,发表于,Biometrika,上,文章说:,“,任何实验可以作为是许多可能在相同条件下作出的实验的总体中的一个个体,一系列的实验则是从这个总体所抽得的一个样品。,”,第一节 生物统计的地位意义,21,世纪是生命科学的世纪,无疑也为生物统计学的发展与应用拓展了广阔的空间。生物医学期刊杂志社聘请统计学专家为期刊论文把握统计处理的质量,,新英格兰医学杂志,、,柳叶刀,等著名的医学期刊还增设了负责处理统计学问题常务编委。,第一节 生物统计的地位意义,生物统计分析软件包的普及将生物统计学从统计学家的书本里解放出来,成为生物学研究者的常用工具。但它也带来了一个严重的弊端,对生物统计方法的误用与滥用,。如果把整个统计分析过程变成一个黑箱, 那就有可能垃圾进,垃圾出,(garbage in, garbage out),。,第一节 生物统计的地位意义,五、生物统计学的特点,Characteristics,1,、 根据有限数量的样本观察数据来推断和估计事物的总体,是生物统计的基本特点。,2,、 用样本来推断总体,要求样本具有一定的含量和代表性。,3,、推断有很大的可靠性,但有一定的错误率(,如假阳性,)。,4,、实验设计应该先于生物统计分析的思考,!,第一节 生物统计的地位意义,第二节 生物统计学发展简史,最早建立生物统计思想的是,A.Quetelet,(1796-1874),把统计学应用于解决生物学、医学和社会学中的问题,第一个认识到大量变异数据中蕴涵规律性(近代统计学的重要思想),最早应用生物统计学的是,C.Darwin,(,1809-1882,),,进化论的本质是生物统计,遗传学奠基人,G.Mendel,的豌豆杂交实验结果也证实了生物统计的规律,第二节 生物统计学发展简史,统计学用于生物学的研究,开始于,19,世纪末,,1870,年,英国遗传学家,,Galton (1822-1911),提出了,相关与回归,的概念,被公认为生物统计学的创始人。,Galton,和他的继承人,K.Plarson (1857-1936),于,1895,年成立了伦敦大学生物统计实验室,提出了,检验方法。,K.Plarson,的学生,Gosset (1876-1937),在,1908,年以,“,student,”,笔名发表了,“,t,分布和,t,检验法,”,创立了小样本检验代替大样本检验的理论和方法。,Fisher,于,1923,年发展了显著性检验及估计理论,提出了,F,分布和,F,检验,,创立了正交试验设计和方差分析。,1901,年英国著名统计学家,Pearson,创办了,生物统计学杂志,(,Biometrika),,标志着生物数学发展的起点。,第二节 生物统计学发展简史,Neyman (1894-1981),和,S.Pearson,进行了统计理论的研究工作,提出统计假设检验系统,标志着统计学真正形成。,There are five components to an experiment,:,Hypothesis,(假设),Experimental design,(实验设计),Experimental execution,(实验实施),Statistical analysis,(数据分析),Interpretation,(描述),第二节 生物统计学发展简史,第三节 生物统计的主要内容,统计研究设计,统计描述 统计分析,第三节 生物统计的主要内容,调查设计,指调查研究工作全过程的计划。,试验设计,是指试验研究工作进行前应用数理统计原理,制定试验方案,选择试验材料,,对实验因素作合理、有效的安排,最大限度地减少 试验误差,使之达到高效,快速、准确、可靠和经济的目的。,两者的区别,前者,:,是被动地进行观察,希望干扰因素的影响尽可能减少;,后者,:,研究者能较主动地安排试验因素,控制实验条件,尽可能排除或抵消非试验因素的干扰和影响。,统计研究设计,统计描述,统计分析,第三节 生物统计的主要内容,统计表和统计图,定量资料集中趋势的度量,算术均数、几何均数、调和均数、中位数、分位数和众数,定量资料离散趋势的度量,标准差、标准误差、变异系数、极差和四分位数间距,随机变量及其概率分布,离散型:二项分布、波松分布,连续型:正态分布、,t,分布、,2,分布、,F,分布,统计研究设计 统计描述,统计分析,第三节 生物统计的主要内容,a.,假设检验,b.,统计推断,estimative statistics,c.,研究变量之间的关系,无自变量与因变量之分:,直线相关分析、典型相关分析,研究多变量内部的从属关系:主成分分析、因子分析等。,多变量之间亲疏关系:聚类分析,有自变量与因变量之分:,直线回归分析、曲线回归分析、多项式回归分析、,Logistic,概率模型回归分析等,d.,判别分析,根据一些明确分类的总体所提供的信息,对未知个体的归属进行分类的判别分析。,第四节 生物统计的常见术语,第四节 生物统计的常见术语,1,、总体与样本,Population and sample,1),总体,根据研究目的确定的研究对象的全体称为,总体,。构成总体的每个成员称为个体,(individual),。含有有限个个体的总体称为,有限总体,(finite population),。包含有无限多个个体的总体叫,无限总体,(infinite population),。,2),样本,总体的一部分称为,样本,。,样本中所包含的个体数目叫,样本容量或大小,(sample size),。样本容量常记为,n,。通常,n30,的样本叫,小样本,,,n,30,的样本叫,大样本,。,3,)抽样,sampling,从总体中获得样本的过程。可分为放回式抽样,(sampling with replacement),和非放回式抽样,(without replacement),。随机抽样,(random sampling),是确定样本代表性的有效方法。,第四节 生物统计的常见术语,2,、特征数,表示总体和样本的数量特征的量称为特征数。,1),参数,Parameter,:由总体计算得来的特征数,,常用,希腊字母,表示。用,表示总体平均数,用,表示总体标准差。,2),统计量,statistics,:由样本计算得来的特征数,, 常用,拉丁字母,表示统计量。用 表示样本平均数,用,S,表示样本标准差。,3),总体参数由相应的统计量来估计,,例如用 估计,,用,S,估计,等。,总 体,样 本,抽 样,描 述,计算统计量,推 断,统计量,第四节 生物统计的常见术语,3,、平均数,mean,算术平均数,:,几何平均数,:,加权平均数:,第四节 生物统计的常见术语,4,、方差、标准差和变异系数,variance, standard deviation and variation coefficient,1),极差,又称范围,range:,它是样本变量中最大值和最小值之差, 一般用,R,表示。,2),方差,样本方差:,总体方差:,第四节 生物统计的常见术语,4,、方差、标准差和变异系数,variance, standard deviation and variation coefficient,3,)标准差,样本标准差,:,总体标准差,:,4,)变异系数,:,是样本变量的相对变异量, 是不带单位的纯数。用变异系数可以比较不同样本相对变异程度的大小。,第四节 生物统计的常见术语,5,、数据类型与频数(率)分布,1,)连续型数据和离散型数据,与某种标准做比较所得到的数据称为连续型数据,(continuous data),,又称度量数据,(measurement data);,例如,长度、时间、重量等。对连续型数据进行分析的方法,通常称为变量的方法,(method of variable),。,由记录不同类别个体的数目所得到的数据,称为离散型数据,(discrete data),,又称为计数数据,(count data),;例如种子数、株数、人头等。对离散型数据进行分析的方法,通常称为属性的方法,(method of attribute),。,2,)频数(率)表,frequency table,用频数分布或频率分布清楚地描述数据变化规律的表格。,3,)频数(率)图,frequency graph,用频数分布或频率分布清楚地描述数据变化规律的图形。,3,种最常用的频数图为直方图、多边形图和累积频数图。,第四节 生物统计的常见术语,第四节 生物统计的常见术语,6,、中位数和众数,median and mode,中位数:在累积频数图中,1/2,总频数位置上的数值。,众数:离散型数据的众数是频数图中频数最高的组值;连续型数据的众数是频数图中频数最高的中值。,第四节 生物统计的常见术语,7,、中心矩、原点矩、偏斜度和峭度,central monent, moment about the origin, skewness and kurtosis,中心矩:原点矩:,偏斜度:度量数据围绕众数呈不对称的程度。,计算公式:,其中:,m,3,为三阶中心矩;,m,2,为二阶中心矩。,峭度:度量曲线形状的量。,计算公式:,其中:,m,4,为四阶中心矩。,第四节 生物统计的常见术语,8,、随机误差与系统误差,1),随机误差,random error,也叫,抽样误差,(sampling error),,是由于许多无法控制的内在和外在的偶然因素所造成。,统计学上的试验误差指随机误差。,2),系统误差,systematic error,也叫片面误差,(lopsided error),。是由试验对象的差异、仪器的灵敏度、药品的用量或种类不符合试验要求以及观测、记录、计算中的错误引起的。,第五节 生物统计学教学要求,第五节 生物统计学教学要求,一、生物统计学的课程特点,概念多、公式多、表格多、作业多、问题多。,学生头痛的课程?,老师糊涂的课程?,学院怀疑的课程?,对于我来说:教学压力很大而感兴趣的一门课程!,第五节 生物统计学教学要求,二、基本要求,1,掌握正确收集试验数据的方法以及数据资料的整理方法。,2.,掌握数据资料的基本统计分析方法。,3.,掌握显著性检验的基本原理与常用方法,能对不同的试验资料应用显著性检验方法进行统计分析与处理。,4.,掌握相关分析与回归分析的常用统计分析方法。,5.,掌握常用抽样调查技术和方法。,6.,具备一定的科学试验设计能力。,第五节 生物统计学教学要求,三、学习方法,1.,弄懂基本原理和公式、理解公式的含义和应用条件,不必深究推导;,2.,认真做作业,加深对公式及统计步骤的了解;,3.,培养科学的统计思维方法。生物统计中新的思考方法,从不肯定性或概率的角度,来思考问题和分析科学试验的结果;,4.,联系实际,结合专业,了解统计方法的实际应用;,5.,从实验设计方法及其原理的角度来贯穿整个生物统计学的学习过程。,第五节 生物统计学教学要求,四、教学安排,第一章 绪论(,2,学时),第二章 概率与概率分布,(,4,学时),第三章 常见概率分布,(,4,学时),第四章统计学的常用术语,(,4,学时),第五章 统计推断,(,4,学时),第六章 方差分析(单,多因素方差分析),(,4,学时),第七章直线回归与相关(一元,多元线性),(,4,学时),第八章实验设计,(,4,学时),复习,2,学时,国内有关经典著作,1.,概率论基础及其应用,王梓坤著,科学出版社,1976,年版,2.,数理统计引论,陈希儒著,科学出版社,1981,年版,国外有关经典著作,1.,概率论的分析理论,P.- S.,拉普拉斯,著,1812,年,版,2. ,统计学数学方法,H.,克拉默著,1946,年版,概率论的最早著作,数理统计最早著作,概率统计专业,首位中科院院士,教材,主要参考书,主要网站,http:/bio- you attention!,
展开阅读全文