小样本资料的

上传人:cel****460 文档编号:243684703 上传时间:2024-09-28 格式:PPTX 页数:60 大小:649.56KB
返回 下载 相关 举报
小样本资料的_第1页
第1页 / 共60页
小样本资料的_第2页
第2页 / 共60页
小样本资料的_第3页
第3页 / 共60页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,*,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,小样本资料的,本章主要介绍小样本时单个均数、两个均数的假设检验,单个率、两个率间的假设检验。应重点掌握各种情况下的t检验方法,正确区分成组资料和配对资料,在上一章中,我们系统介绍了抽样分布和统计推断的根本原理和根本方法,即通过随机抽样的方法获得某一特定总体的随机样本,用这一样本进展试验,并对试验后所得资料进展分析,通过统计推断来定性或定量地分析研究总体的特征,本章主要介绍总体方差未知、且样本较小时不同资料类型的统计推断差异显著性检验假设检验的具体方法,第一节 单个平均数的假设检验,单个平均数的假设检验是检验一个样本所属的总体平均数 与一个特定总体平均数 间是否存在显著差异的一种统计方法,也可理解为检验一个样本是否来自某一特定总体的统计分析方法,根据统计假设检验的根本原理可知,假设检验的关键是根据统计量的分布计算实得差异即外表效应由抽样误差造成的概率,测验的统计量分布服从 u- 分布或 t- 分布,所以单个平均数的假设检验可分为 u-test 和 t-test 两种,一、总体方差时单个平均数的假设检验,当总体方差 ,不管样本多大,均可用 u-分布计算实得差异由抽样误差造成的概率,所以称 u-test,u- 检验u-test的方法和步骤见前一章内容,请逐一回忆一下检验公式和检验步骤,二、总体方差未知时单个样本平均数的假设检验,一当总体方差未知、而样本较大时,可以使用u-分布计算实得差异由抽样误差造成的概率,因此,其检验还是 u-test,请回忆一下以上两种 u-test 的共同点和不同点:公式的不同,哪里不同?,二总体方差未知,且样本较小时的单个样本平均数的假设检验,实际上,在很多情况下,总体方差往往是未知的,而由于各种条件的限制,试验的样本又不可能很大,即只能用小样本来作试验,或调查时抽取的样本较小,因此,总体方差未知、样本较小是试验中最常见的一种情况,在第四章讨论 t- 分布时,我们已经知道,总体方差未知、且样本较小时,可以用 代替 ,其统计量 就不再服从标准正态分布,而是服从 t-分布:,请回忆一下 t- 分布曲线及其特点,t- 分布曲线受自由度制约,不同自由度下的 t- 分布曲线其形状是不同的,因此不同自由度下算得的 t- 值落在某一范围内的概率值也随自由度的不同而不同,下面我们用例子来说明这一类型的 t-test,例:某一地区根据多年资料,得出初生仔猪的平均体重为 ,今在该地随机抽样调查一批初生仔猪n=12,得体重为:,1.05,1.00,1.15,1.10,0.95,0.90,1.05,0.90,1.15,0.95,1.10,1.00 kg,问:该批仔猪在体重方面是否符合该地区初生仔猪的特征即,该场的饲养管理水平是否正常?,该例样本量不大n =12 30,因此符合总体方差未知、且是小样本的情况,应使用 t-test 来进展检验,: ,样本 = , = 0.089 kg,检验步骤如下:,设 kg kg,计算 和 t 值:,查附表4t分布表,得知自由度为 df = 12-1 =11时的,本例中所得,所得 t 值的概率 因此,应承受无效假设这里就自然摒弃了备择假设,但不需写出来,即:该批仔猪的初生体重符合该品种初生仔猪的体重特征,这也在一定程度上说明该猪场对母猪的饲养管理是正常的,再举一例:,药典规定,每 100g 某药物中应含有 50mg 的维生素C,现对某厂生产的一个批次的这种营养品进展检测,得如下 VC 含量,试问该批次药物中的 VC 含量合格吗?,47.3 48.2 47.6 49.8 50.3 48.5 49.1 48.0 52.0 47.9 n = 10,下面我们作统计分析,由于是小样本,且总体方差为未知,因此应使用 t-test 进展分析,请同学们先自行立题、计算,首先我们计算该样品的平均数和标准差,得:,第一步,设立无效假设,设:,第二步,计算 t 值:,查 t 值表,得:,即,第三步,结论:否认无效假设,即该批次药物的 VC含量显著低于药典规定,试想一下,该题是否可以用一尾检验?,上例也可以设立一个正常范围,检查样本的平均值是否在这一范围内,现在我们有三个公式用于单个样本的统计假设检验:,请说出这三个公式各自的使用场合和它们之间的区别,第二节 两个样本平均值相比较的统计假设检验,很多情况下,我们不只是将样本平均数与总体平均数相比较,而是做一个试验,这个试验中设置两个组,一个组作试验,施加某种试验条件即处理,另一个组作对照,试验完了将这两个组的试验数据进展比较,这种试验可以采用两种方法进展:,一种方法是这两个组是相互独立的:一组作处理,一组作对照,另一种方法是配对试验,下面我们先讨论两个组是相互独立的情况,这种统计假设检验的方法称为成组数据的比较,一、成组数据的平均值比较,方法介绍:,在一个总体中,随机地抽取两个独立样本,在这两个样本中,被抽取的个体是相互独立的,且根本条件如品种、日龄、性别、体况等都应一致、均匀,必要时须作适当的调整,尽可能使两个组在样本量上一致,各组的根本情况一致,随机地指定一组作处理,另一组作对照,一定要注意其中的任意一组作处理,一组作对照,而不能事先规定哪一组做处理,哪一组作对照,试验过程中注意记录资料,完毕以后整理资料并进展统计分析,这样得到的资料称为成组数据,这样的数据在组间、组内都是独立的,成组数据的 t-test 其公式是:,其中:,或:,也可以这样写:,其中:,当两样本量相等时:,那么:,在小样本时,两样本平均数差的标准化,是服从 t 分布的,因此:,由于我们在之前的无效假设是:,备择假设是: ,因此这一式子可以简化为:,得到成组数据所进展的试验称为完全随机设计法仅两个组,两个组的样本量可以相等,也可以不等,但应尽量接近,这种两个组是完全独立的试验,如:,一组添加某营养物,另一组不添加该营养物,一组用试验药物,另一组用常规药物,一组用试验剂量,另一组用常规剂量,一组是引进品种品系,另一组是本地品种,等等,这样的分组就称为完全随机设计试验,这里,前面的一组称为处理,后一组称为对照,下面我们以实例来说明成组数据的比较,A、B 两厂生产某同类添加剂,现作 24 小时兔体内残留量检测,得如下数据,试分析哪一厂家的该类添加剂的残留量大,A厂:,B厂:,显然,这两个厂家的药物是相互独立的,试验所用动物也是独立的;样本较小,因此应使用成组数据的 t-test 进展分析,同学们先行分析,先做预备计算,将两个样本的平均值、方差等计算出来:,设立无效假设:,计算 t 值,并作比较:,所得 t 值出现的概率,因此,否认无效假设,承受备择假设,即:A、B两厂生产的该类药物的 24h 血液残留量差异显著在论文或报告中应针对这一结果作出专业解释,在这种检验中,我们求 t 值时用的是合并均方,合并均方只有在两总体方差我们一般用样本均方估计总体方差一样,即两方差差异不显著的情况下才能得到,这里我们总假定两个均方差异不显著,但如果两方差差异显著,就不能合并,两均方是否相等,必须用下一章的 F-test 进展检验才能知道,当两均方不等称为方差不齐时,用以下方法计算 和 t 值:,当 用 的 作判断的临界值,当 时须用 Cochran-cox 法:,首先计算在水平上显著的临界值,式中: ,,假设 就否认 ,否那么,就承受,由于 处于 之间,因此,只有在实际计算得到的 在 之间时,才需要计算,附:,两均方是否齐性的判别方法:,如果 表示两均方齐性,否那么就是不齐,二、配对数据的平均值比较,方法介绍:,配对数据来自于配对试验,配对试验根据具体试验情况可以有好多种方法:,1、将两个品种、性别、日龄、体况等一致的动物最好是有血缘关系的同胞或半同胞配成一对,任意一只进入试验组,另一只进入对照组,配成假设干对,试验中做好记录,这种记录到的数据就是配对数据,注意:对子内的两个个体应尽可能一样,但对子之间应有较大的差异,2、选取假设干个动物,每一个动物在试验前测定一次,试验后测定一次,这样的两次记录就是配对数据,如:一个人吃早饭前后各测一次血糖值,这同一个人的两次血糖值就是一对数据,假设干个人就有假设干个数据对,3、同一个体的不同部位可以配成一对,如一只兔子的左右体侧,就可以配成一对,假设干只兔子的不同体表就是假设干对,4、同一个动物的不同试验时期所施加的不同处理形成一个对子,如一只猪在第一试验期施加 A 处理,在第二试验期施加 B 处理;或第一试验期施加处理,第二试验期作对照,凡此种种,都是配对试验,因此配对试验既有空间上的配对,亦有时间上的配对,配对试验所得到的数据,就称为配对数据,配对数据的比较方法不同于成组数据的比较方法,其 t-test 的公式为:,其中:,是对子数,这里的样本量不是 2n,而是 n,因此自由度不是 2(n-1),而是 n-1,在对配对资料进展统计分析时,首先要计算每一对对子内两数据之差,即 d值,然后对d值进展分析,下面我们以实际例子来说明配对数据的差异性检验,研究 和 的关系,挑选体况根本相似的一对全同胞小鼠,其中任意一只放入组,另一只放入组,共挑选了8对,分成了两组。一组饲喂正常饲料,另一组饲喂缺乏 的饲料。试验完毕后检测小鼠肝脏中 的含量,得如下数据:,对子号,1 2 3 4 5 6 7 8,正常,3550 2000 3000 3950 3800 3750 3450 3050,缺,2450 2400 1800 3200 3250 2700 2500 1750,差,1100 -400 1200 750 550 1050 950 1300,计算各组数据的差,然后作进一步的计算,得,设立无效假设,即饲料中缺乏,V,E,不影响肝脏中,V,A,的储存量,对:饲料中缺乏,V,E,会严重影响肝脏中,V,A,的储存量,简写为:设,计算 t 值,得:,即 t 值出现的概率,否认无效假设,承受备择假设,即饲料中缺乏VE 会严重影响小鼠肝脏对VA 的储存量,或:正常饲料与缺乏VE 的饲料两者对肝脏VA 的储存量差异极显著,随机抽取10名安康青年男子,测量一日中不同时间的血压舒张压变化,得如下数据,试分析不同时间血压的差异性,序号 1 2 3 4 5 6 7 8 9 10,6时 80 83 75 78 71 89 77 81 72 75,9时 85 93 89 83 80 86 85 79 78 81,差: 5 10 14 5 9 -3 8 -2 6 6,上一例是两个试验动物配成一对,这一例是同一个试验材料不同的时间内测定的数据配成一对,这是在动物科学试验中经常使用的比照方法,下面是统计分析结果同学们可先行分析,设立无效假设:,计算 t 值:先计算每一个人的差值,写于表格的最下面一行,再计算差的平均值和标准误:,计算 t 值:,即出现 t 值的概率,因此,否认无效假设,承受备择假设:上午 9 时血压舒张压极显著高于上午 6 时,或:上午 6 时和9 时的血压舒张压有极显著的差异,差异不显著、显著、极显著也可以这样表示:,不显著:,n.s.,显著:* 极显著:* 如:,成组数据差异显著性检验和配对数据差异显著性检验的区别在于以下两点:,1、在作试验设计和实施试验时,两者的差异就已经确定了,试验设计是配对的,就不能用成组比较法来分析所得资料;反之,试验设计是成组的,就不能用配比照较法来分析所得资料,2、如果是分析别人的资料如我们在统计学习中碰到的例题等,一定要根据例题或习题的内容来加以判断:独立抽取两个样本、将所抽得的样本随机分为两组;抽取一对相似的试验动物、一个个体在某一时间段作什么,另一时间段作什么、某一试验前测定一次,试验后测定一次;等,两者的区别千万不能搞错:,配对试验如使用成组比较法,易发生型错误,即不能鉴别应属显著的差异,这是人为地扩大了标准误存伪,成组试验的资料如果乱配成对子后用配比照较法,易使不显著的差异检验成显著的差异弃真,成组试验应采用供试单位根本一致的材料,彼此独立,随机抽样、随机分组、随机供试,两组样本尽可能一致,配对试验对子内应尽可能一致,对子间应适当扩大距离,以使试验有更大的适应性,第三节 百分资料的,u,-test,在动物科学研究中,有很多资料是属于二项分布的,这样的资料一般可用率来表示,如受精率、出苗率、孵化率、死亡率、存活率、治愈率、淘汰率、有效率,等,计算这一类率时所用的样本一般很大,样本量较小时,所得到的率其实用意义不大,当 p 或 1-p 不太小、而 np 和 n(1-p) 不小于 5 时,率的分布也服从正态分布,因此,率的检验可采用 u-test,率的检验有单个样本率和两个率的比较两种,一、单个样本率的假设检验,这是检验某一个率所属总体与理论率或期望率是否一致的假设检验,即某一个样本率 是否符合一预设的总体率 :,其中:,由于一般计算率的样本都比较大,因此可使用u-test进展检验,与之相比较的两个临界值就是 时取 , 时取,即当 时, 差异不显著; 时, 差异显著; 时, 差异极显著,例:正常情况下,鹅蛋的受精率为 65%,今一鹅场改进了饲养管理条件及公母鹅配比,结果 1000 枚鹅蛋有 681 枚受精,试问本次条件改善是否取得成效?,设立无效假设:,否认无效假设,即该鹅场的饲养管理条件的改善确实取得了显著效果,又例:孟德尔的豌豆花试验中,孟德尔曾假设其红花和白花的比例是3:1,今一个试验中,得红花447 朵,白花 165 朵,问:这次试验的结果符合这一假设吗?,作无效假设:,这一次试验在 95% 的水平上可被承受,即本次试验的结果是符合孟德尔假设的,二、两个样本率差异的显著性检验,这一类型的假设检验往往是检验两个样本率 和 所属总体率 和 是否一致,或者说两个样本率是否来自一个总体,设两个样本容量分别是 和 ,两样本中发生某一阳性事件的次数分别是 和 ,那么两样本率分别是 和,这两个样本率所属总体的率分别是 和,我们通过两样本率的差 来推断 和 是否相等 这一类型的无效假设是,其备择假设是,用以检验的公式为:,其中:,由于一般样本很大,因此可用,u,-test,得到的,u,值与,1.96,和,2.58,相比,时, ,差异不显著,时, ,差异显著,时, ,差异极显著,例:试验某种新药对杀灭猪体外某种寄生虫的效果,用常规药物作比照试验,常规药物施于 860 头虫体,死亡 585 头,该新药施于 920 虫体,死亡672 头,新药的疗效如何?,新药的杀灭率为,常规药物的杀灭率为,设立无效假设:设,否认无效假设,即新药的除虫效果显著好于常规药物,又例:试验用 EM 制剂处理鸡苗可否提高鸡苗的成活率:处理组施用 EM382 羽鸡苗成活 309羽,对照组未施用任何药剂278 羽成活 204羽,EM 有效果吗?,处理组成活率:,对照组成活率:,设,否认无效假设,承受备择假设,即EM可以显著提高鸡苗的成活率,三、小样本率假设检验的校正,质量性状的率的计算,一般应使用大样本,但有些特殊情况下,样本不够大,只能得到一个小样本的率,如 n25、且 np5 时,资料服从二项分布,不能再使用常规的 u-test,这时应进展校正,近似地进展 u-test,a单个小样本率的校正性检验,其公式是:,b两个小样本率的校正性比较,其公式是:,其中, 是较大的样本率, 是较小的样本率,第四节 总体平均值的,小样本资料区间估计,复习:标准误的作用,复习:置信区间、置信度、置信半径、置信上限、置信下限,当总体方差为时:,或写成:,当总体方差未知,但样本较大时:,或写成:,当总体方差未知,且样本较小时,总体平均值的置信区间估计应当用以下公式进展:,或写成:,第五节 百分率的置信区间估计,一般情况下,率的估计都是大样本,因此,不管总体方差是否,我们都可以用下式来估计总体率的置信区间:,或写成:,从以上置信区间的设置,我们可以看出,置信区间的宽窄与置信度、样本容量、标准误等有关,因此,为了得到一个较好的置信区间用以估计总体平均值或总体率,应中选择一个合理的置信度,应当扩大样本容量,应当提高试验的技术和准确度以降低试验误差,(*),END,谢谢大家!,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 压缩资料 > 药学课件


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!