大学试验统计复习题.doc

资源描述

第一章复习1.解释以下概念：总体、个体、样本、样本容量、变量、参数？1. 总体是具有相同性质的个体所组成的集合，是指研究对象的全体。2. 个体是组成总体的基本单元。3. 样本是从总体中抽出的若干个个体所构成的集合。4. 样本容量是指样本个体的数目。5. 变量是相同性质的事物间表现差异性的某种特征。6. 参数是描述总体特征的数量。7. 统计数是描述样本特征的数量。8. 因素是指试验中所研究的影响试验指标的原因或原因组合。2.统计数、因素、水平、处理、重复、效应、互作、试验误差？1. 水平是指每个试验因素的不同状态(处理的某种特定状态或数量上的差别)。2. 处理是指对受试对象给予的某种外部干预(或措施)。3. 重复是指在试验中，将一个处理实施在两个或两个以上的试验单位上。4. 效应是由处理因素作用于受试对象而引起试验差异的作用。5. 互作是指两个或两个以上处理因素间的相互作用产生的效应。6. 试验误差是指试验中不可控因素所引起的观测值偏离真值的差异，可以分为随机误差和系统误差。3.随机误差与系统误差有何区别? 随机误差也称为抽样误差或偶然误差，它是由于试验中许多无法控制的偶然因素所造成的试验结果与真实结果之间的差异，是不可避免的。随机误差可以通过试验设计和精心管理设法减小，但不能完全消除。系统误差也称为片面误差，是由于试验处理以外的其他条件明显不一致所产生的带有倾向性的或定向性的偏差。系统误差主要由一些相对固定的因素引起，在某种程度上是可控制的，在试验过程中是可以避免的。4.准确性与精确性有何区别? 准确性也称为准确度，是指在调查或试验中某一试验指标或性状的观测值与真值接近的程度。精确性也称为精确度，是指调查或试验中同一试验指标或性状的重复观测值彼此的接近程度的大小。准确性是说明测定值对真值符合程度的大小，用统计数接近参数真值的程度来衡量。精确性是反映多次测定值的变异程度，用样本中的各个变量问的变异程度的大小来衡量。填空1. 变量按其性质可以分为（连续）变量和（非连续(离散型)）变量。 2. 样本统计数是总体（参数）的估计值。 3. 试验统计学是研究生命过程中以样本来推断（总体）的一门学科。 4. 实验统计学的基本内容包括（试验设计）、（统计分析）两大部分。 5. 统计学的发展过程经历了（古典记录统计学）、（近代描述统计学）、（现代推断统计学）3个阶段。6. 生物学研究中，一般将样本容量（30）称为大样本。 7. 试验误差可以分为（随机误差）、（系统误差）两类，通过矫正或实施控制可予以消除的一类误差是（系统误差），而通过合理的试验设计和精心管理可以减小，但无法完全消除的一类误差是（随机误差）。判断1对于有限总体不必用统计推断方法。 2资料的精确性高，其准确性也一定高。 3在试验设计中，随机误差只能减小，而不可能完全消除。 4统计学上的试验误差，通常是指随机误差。名词解释连续变量非连续变量定量变量定性变量因素试验单位第二章复习填空1. 资料按生物的性状特性可分为（数量性状资料）和（质量性状资料）。2. 只要使用非全面调查的方法，即使遵守随机原则，（抽样误差）也不可避免会产生。 3. 常用的抽样方法有（随机抽样）、（顺序抽样）和（典型抽样）。4. 在抽样调查时，抽样误差越小，用样本估计总体的可靠性就越（大）。5. 在其他条件一定时，样本容量越大，抽样误差越（小）。6. 按照抽样方法的不同，随机抽样又可分为（简单随机抽样）、（分层随机抽样）、（整体抽样）和（双重抽样）。7. 直方图适合于表示（计量(连续变量)）资料的次数分布。8. 变量的分布具有两个明显基本特征，即（集中性）和（离散性）。9. 反映变量集中性的特征数是（平均数），反映变量离散性的特征数是（变异数）。10. 样本标准差的计算公式s=判断1计数资料也称为连续性变量资料，计量资料也称为非连续性变量资料。2抽样误差是抽样调查中无法避免的误差。3抽样误差的产生是由于破坏了随机原则所造成的。4在进行抽样调查时，样本容量越大，其抽样误差也越大。5顺序抽样可以计算其抽样误差。6简单随机抽样适用于个体间差异较小、所需抽取的样本单位数较小的情况。7分层随机抽样通常比简单随机抽样得到结果更准确。8抽样调查方法的正确与否直接关系到由样本所得估计值的准确性。9条形图和折线图均适合于表示计数资料的次数分布。10离均差平方和为最小。11资料中出现最多的那个观测值或最多一组的中点值称为众数。12变异系数是样本变量的绝对变异量。名词解释数量性状资料/质量性状资料/计数资料/计量资料抽样调查/全距(极差) 组中值算术平均数中位数众数几何平均数方差标准差/变异系数单项选择（凡选项加粗处为正确答案，以后不做说明）1下面变量中属于非连续性变量的是（）。A身高 B体重 C血型 D血压2.事先将全部总体各单位按某一标志排列，然后依固定顺序和间隔来抽选调查单位的抽样方式为（）。A分层随机抽样B简单随机抽样C整群抽样 D顺序抽样3.整群抽样是对被抽中的群体作全面调查，所以整群抽样是（）。A全面调查 B非全面调查 c一次性调查D经常性调查4.事先确定总体范围，并对总体的每个单位编号，然后根据随机数码表或抽签的方式来抽取调查单位数的抽样组织形式被称为（）。 A简单随机抽样 B机械抽样 C分层抽样 D整群抽样5先将总体各单位按主要标志分组，再从各组中随机抽取一定单位组成样本，这种抽样调查组织方式被称为（）。A简单随机抽样 B机械抽样 C分层随机抽样D整群抽样6.对某鱼塘不同年龄鱼的尾数进行统计分析时，可作成（）图来表示。A条形图 B直方图 C多边形图 D折线图7.关于平均数，下列说法正确的是（）。 A正态分布的算术平均数与几何平均数相等 B正态分布的算术平均数与中位数相等 C正态分布的中位数与几何平均数相等 D正态分布的算术平均数、中位数、几何平均数均相等8.如果对各观测值加上一个常数c，其标准差（）。 A扩大以 B扩大c倍 C扩大倍 D不变9比较大学生和幼儿园孩子身高的变异度，应采用的指标是（）。A标准差 B方差 C变异系数 D平均数10测定一个苹果品种的单果重量，得到具有15个观察值的一个样本资料，计算标准差时其自由度为（）。A1 B15 C14 D1611比较一个苹果品种重量(g)和体积(cm2)大小的变异程度，适宜的统计数是（）。A极差 B方差 c标准差 D变异系数计算题测定一小麦的穗长。结果为：8.9、6.3、8.7、8.8、9.1、6.2、8.6、7.8、9.2、8.9（cm），试求其平均数、极差、标准差和变异系数。注：此处由于版本不兼容公式出错，看不清可以查一下书上的公式解本题为10个数据特征数求解问题，带入平均数、极差、标准差和变异系数的计算公式即。第三章习题1.试解释必然事件、不可能事件和随机事件，并分别举例。在一定条件下必然出现的现象称为必然事件；相反，在一定条件下必然不出现的事件称为不可能事件；而在某些确定条件下可能出现，也可能不出现的事件，称为随机事件。例如，人相当一段时间不呼吸氧气就会死亡，这是必然事件；太阳从西边出来，这是不可能事件；给患者做血样化验，结果可能为阳性，也可能为阴性，这是随机事件。2.什么是互斥事件？什么是对立事件？什么是独立事件？试举例说明事件A和事件B不能同时发生，那么称事件A和事件B为互斥事件，如人的ABO血型中，某个人血型可能是A型、B型、AB型、O型4种血型之一，但不可能既是A型又是B型。事件A和事件B必有一个发生，但二者不能同时发生，则称事件A与事件B互为对立事件。例如，抛一枚均匀的硬币时，向上的那面不是正面就是反面；发芽试验中种子要么发芽要么不发芽。事件A的发生与事件B的发生毫无关系，反之，事件B的发生也与事件A的发生毫无关系，则称事件A与事件B为独立事件，如第二胎生男生女与第一胎生男生女毫无关系。3.什么是频率？什么是概率？频率如何转化为概率？事件A在n次重复试验中发生了m次，则比值m/n称为事件A发生的频率；事件A在n次重复试验中发生了m次，当试验次数n不断增大时，事件A发生的频率就越来越接近某一确定值p，则p即为事件A发生的概率。二者的关系是：当试验次数n充分大时，频率转化为概率。4什么是正态分布？什么是标准正态分布？正态分布曲线有什么特点？和对正态分布曲线有何影响？.水稻糯和非糯为一对等位基因控制，糯稻纯合体为ww，非糯稻纯合体为WW，两个纯合亲本杂交后，其F1代为非糯稻杂合体Ww。（1）现以F1代回交于糯稻亲本，在后代200株中预期有多少株为糯稻，多少株为非糯稻？试列出糯稻和非糯稻的概率；（2）当F1代自交，F2代性状分离，其中34为非糯稻，14为糯稻。假定F2代播种了2000株，试问糯稻和非糯稻各有多少株？（1）F1代非糯稻杂合体Ww与糯稻亲本ww回交，后代非糯稻杂合体Ww与糯稻纯合体ww各占一半，即概率均为0.5，故在后代N=200株中预期糯稻和非糯稻均为：0.5 x 200=100(株)。（2）F 1代非糯稻杂合体Ww自交，后代非糯稻纯合体WW；非糯稻杂合体Ww ；糯稻纯合体ww=1：2：1，但表型非糯稻：糯稻=3：1，即非糯稻和糯稻的概率分别为0.75和0.25，故在后代N=2000株中，糯稻应为0.252000=500（株），非糯稻应为：0.752000=1500（株）。填空判断1.事件A的发生与事件B的发生毫无关系，则事件A和事件B为互斥事件。.2.二项分布函数恰好是二项式(p+q)n展开式的第x项，故称二项分布。.3.样本标准差s是总体标准差的无偏估计值。.4.正态分布曲线形状与样本容量n值无关。5.卡方分布是随自由度变化的一组曲线。名词解释概率和事件积事件互斥事件对立事件独立事件完全事件系/概率加法定理概率乘法定理无偏估计值/中心极限定理单项选择1一批种蛋的孵化率为80，同时用两枚种蛋进行孵化，则至少有一枚能孵化出小鸡的概率为（）A096 B064 C080 D0902关于泊松分布参数错误的说法是（）。A= B2= C = D=np3设z服从N(225，25)，现以n=100抽样，其平均数标准误为（）。 A1.5 B0.5 C0.25 D2.254正态分布曲线由参数和决定，值相同时，取（）时正态曲线展开程度最大，曲线最矮宽。 A05 B1 C2 D3第四章复习习题1 什么是统计推断?统计推断有哪两种?其含义各是什么?统计推断就是根据理论分布由一个样本或一系列样本所得的结果来推断总体特征的过程。统计推断主要包括假设检验和参数估计两个方面。假设检验是根据总体的理论分布和小概率原理，对未知或不完全知道的总体提出两种彼此对立的假设，然后由样本的实际结果，经过一定的计算，作出在一定概率水平(或显著水平)上应该接受或否定的那种假设的推断。参数估计则是由样本结果对总体参数在一定概率水平下所作出的估计。参数估计包括点估计和区间估计。习题2 什么是小概率原理?它在假设检验中有何作用?小概率原理是指概率很小的事件在一次试验中被认为是几乎不可能发生的，一般统计学中常把概率小于0.05或0.01的事件作为小概率事件。它是假设检验的依据，如果在无效假设H0成立的条件下，某事件的概率大于0.05或0.01，说明无效假设成立，则接受H0，否定H1；如果某事件的概率小于0.05或0.01，说明无效假设不成立，则否定H0，接受H1。习题3 假设检验中的两类错误是什么?如何才能少犯两类错误?在假设检验中，如果H0是真实的，检验后却否定了它，就犯了第一类错误，即错误或弃真错误；如果H0不是真实的，检验后却接受了它，就犯了第二类错误，即错误或纳伪错误。为了减少犯两类错误的概率，要做到以下两点：一是显著水平的取值不可太高也不可太低，一般取0.05作为小概率比较合适，这样可使犯两类错误的概率都比较小；二是尽量增加样本容量，并选择合理的试验设计和正确的试验技术，以减小标准误，减少两类错误习题4 什么叫区间估计?什么叫点估计?置信度与区间估计有什么关系?在用样本对总体作出估计时，如果对总体的参数给出一个区间，并给出该参数在这一区间内的概率的过程就称为区间估计；如果给出该参数可能性最大的取值，并给出该取值的概率的过程就称为点估计。对于同一总体，置信度越大，置信区间就越小；置信度越小，置信区间就越大填空1统计推断主要包括（假设检验）和（参数估计）两个方面。2参数估计包括（点）估计和（区间）估计。3假设检验首先要对总体提出假设，一般应作两个假设，一个是（无效假设零假设H0），另一个是（备择假设H1）。4对一个大样本的平均数来说，一般将接受区和否定区的两个临界值写成（）。5在频率的假设检验中，当np或nq（，应接受H0，否定H1。2作单尾检验时，查或t分布表(双尾)时，需将双尾概率乘以2再查表。3第一类错误和第二类错误的区别是：第一类错误只有在接受H0时才会发生；第二类错误只有在否定H0时才会发生。4当总体方差未知时需要用t检验法进行假设检验。5在假设检验中，对大样本(n30)用检验法，对小样本(n30)用t检验。6成对数据显著性检验的自由度等于2(n一1)。7在进行区间估计时，越小，则相应的置信区间越大。8方差的同质性是指所有样本的方差都是相等的。9在小样本资料中，成组数据和成对数据的假设检验都是采用t检验的方法。10在同一显著水平下，双尾检验的临界正态离差大于单尾检验。名词解释统计推断假设检验参数估计小概率原理显著水平方差同质性第一类错误第二类错误单项选择1两样本平均数进行比较时，分别取以下检验水平，以（）所对应的犯第二类错误的概率最小。 A=0.20 B =0.10 C =0.05 D=0.01 2当样本容量n30且总体方差2未知时，平均数的检验方法是（）。 At检验 B检验 CF检验 D2检验3两样本方差的同质性检验用（）A检验 BF检验 Ct检验 D2检验4进行平均数的区间估计时，（） A n越大，区间越大，估计的精确性越小Bn越大，区间越小，估计的精确性越大C越大，区间越大，估计的精确性越大D越大，区间越小，估计的精确性越大5已知某批25个小麦样本的平均蛋白质含量和，则其在95置信度下的蛋白质含量的区间估计L（）。A B C D 计算题1.树枝条的常规含氮量为2.40，对一桃树新品种枝条的含氮量进行了10次测定，其结果为：2.38，2.38，2.41，2.50，2.47，2.41，2.38，2.26，2.32，2.41()。试问该测定结果与桃树枝条常规含氮量有无差别？（已知t0.05（9）=2.262）解根据题目所给数据可算出 =2.39，s=0.0681。(1)假设H0：=0，即该测定结果与枝条常规含氮量没有显著差别；H1： 0 ，即该测定结果与枝条常规含氮量有显著差别。(2)确定显著性水平=0.05。 (3)计算统计数：(4)作出推断：因为l t l 0.01=2.58 ，故否定H0，接受H1。又因 X1 X2 ，认为三化螟第一代每卵块的卵数极显著低于第二代。3.用两种不同的饵料喂养同一品种鱼，一段时间后，测得每小池鱼的体重增加量如下：A饵料：130.5，128.9，133.8(g)，B饵料：147.2，149.3，150.2，151.4(g)。试检验A、B两种饵料间方差的同质性？（已知F0.05（2,3）=9.55）答由已知条件可计算得到：S1 2=6.2433，n1=3； S22 =3.1425，n2=4。(1)假设H0：，即两种饵料的方差相同； H1：，即两种饵料的方差不同(2)确定显著性水平=0.05。(3)计算统计数：(4)作出推断：查F值表，因为F 时，否定H0，接受H1，说明差异达显著水平。5.比较观测值与理论值是否符合的假设检验称为独立性检验。名词解释适合性检验独立性检验单项选择1. 2检验中，统计量2值的计算公式为（A）。 2. 2检验时，如果实得，即表明( )。 AP ，应接受H0 ，否定H1 CP ，应否定H0 ，接受H13遗传学上常用( )来检验所得的结果是否符合性状分离规律。 A独立性检验 B适合性检验 c方差分析 D同质性检验4对于总合计数n为500的5个样本资料作2检验，其自由度为( )。 A499 B496 C1 D45rc列联表的2检验的自由度为( )。 A(r-1)+(c-1) B(r-1)(c-1) Crc-1 Drc-22检验主要有几种用途?各自用于什么情况下的假设检验?答 2检验主要有3种用途：样本方差的同质性检验、适合性检验和独立性检验。样本方差的同质性检验用于检验一个样本所属总体方差和给定总体方差是否差异显著；适合性检验是比较观测值与理论值是否符合的假设检验；独立性检验是判断两个或两个以上因素间是否具有关联关系的假设检验。2检验的主要步骤有哪些?什么情况下2值需要进行连续性矫正?答 2检验的步骤为： (1)提出无效假设H0：观测值与理论值的差异由抽样误差引起，即观测值=理论值；备择假设H1：观测值与理论值的差值不等于0，即观测值理论值。 (2)确定显著水平。一般可确定为0.05或0.01。 (3)计算样本的2,求得各个理论次数E。并根据各实际次数Oi，代人2值公式，计算样本的2值。适合性检验时，自由度df=k-1 (k为分组数)；独立性检验时，自由度为df=(r-1)(c-1)(r为列联表的行数，c为列联表的列数)。当自由度df=1时，2值需进行连续性矫正：当自由度df1时， (4)进行统计推断。如果实得，应接受H0，否定H1，说明在显著水平下观测值与理论值差异不显著，二者间的差异由抽样误差造成；如果实得，应否定H0，接受H1，说明在显著水平下观测值与理论值差异显著，二者间的差异是真实存在的。计算题某林场狩猎得到143只野兔，其中雄性57只，雌性86只。试检验该野兔的性别比是否符合1：1？（已知解 (1)H0：野兔性别比符合1：1； H1：野兔性别比不符合1：1。(2)选取显著水平为=0.05。（3)计算统计数2 ：根据理论性别比为1：1，可知143只野兔中雄性与雌性理论值均应为由于df=k-1=2-1=1，故计算2时需进行连续性矫正，于是有(4)查2值表，df=1时，，，所以，否定H0，接受H1，认为野兔性别比不符合1：1有一大麦杂交组合，F2代的芒性状表型有钩芒、长芒和短芒3种，观察计得其株数依次为348，115，157(株)。试检验其比率是否符合9：3：4的理论比率。(已知 )解 (1)H0：大麦F2代芒性状表型的比率符合9：3：4的理论比率； H1：其比率不符合9：3：4的理论比率。 (2)选取显著水平为=0.05。 (4)查2值表，df=2时，，，所以，接受H0，认为大麦F2代芒性状表型比率符合9：3：4的理论比例。(3)计算统计数2 ：采用2值计算简式可得第六章复习一、填空1根据对处理效应的不同假定，方差分析中的数学模型可以分为（固定模型）、（随机模型）、（混合模型）3类。2在进行两因素或多因素试验时，通常应该设置（重复），以正确估计试验误差，研究因素间的交互作用。3在方差分析中，对缺失数据进行弥补时，应使补上来数据后，（误差平方和）最小。4方差分析必须满足（正态性）、（可加性）、（方差同质性）3个基本假定。5如果样本资料不符合方差分析的基本假定，则需要对其进行数据转换，常用的数据转换方法有（平方根转换）、（对数转换）、（反正弦转换）等。判断1LSD检验方法实质上就是t检验。2两因素有重复观测值的数据资料可以分析两个因素间的互作效应。3方差分析中的随机模型，在对某因素的主效进行检验时，其F值是以误差项方差为分母的。X4在方差分析中，如果没有区分因素的类型，可能会导致错误的结论。5在方差分析中，对缺失数据进行弥补，所弥补的数据可以提供新的信息。X6对转换后的数据进行方差分析，若经检验差异显著，在进行平均数的多重比较时需要用转换后的数据进行计算。名词解释因素水平试验单位重复多重比较交互作用数据转换单项选择1 C； 2A； 3A简答题什么是方差分析?方差分析的基本思想是什么?进行方差分析一般有哪些步骤?答方差分析是对两个或多个样本平均数差异显著性检验的方法。方差分析的基本思想：将测量数据的总变异按照变异来源分解为处理效应和误差效应，在一定显著水平下进行F检验和多重比较，从而检验处理效应是否显著。方差分析的基本步骤：将样本数据的总平方和与总自由度分解为各变异因素的平方和与自由度；列方差分析表进行F检验，分析各变异因素在总变异中的重要程度；若F检验显著，对各处理平均数进行多重比较。什么是多重比较?多重比较有哪些方法?多重比较的结果如何表示?答多个平均数两两间的相互比较称为多重比较。多重比较常用的方法有最小显著差数法(LSD法)和最小显著极差法(LSR法)，其中LSR法又有新复极差法(SSR法)和q法。多重比较常以标记字母法和梯形法表示。标记字母法是将全部平均数从大到小依次排列，然后在最大的平均数上标字母a，将该平均数与以下各平均数相比，凡相差不显著的都标上字母a，直至某个与之相差显著的则标以字母b。再以该标有b的平均数为标准，与各个比它大的平均数比较，凡差数不显著的在字母a的右边加标字母b。然后再以标b的最大平均数为标准与以下未曾标有字母的平均数比较，凡差数不显著的继续标以字母b，直至差异显著的平均数标以字母c，再与上面的平均数比较。如此重复进行，直至最小的平均数有了标记字母，并与上面的平均数比较后为止。这样各平均数间，凡有相同标记字母的即为差异不显著，凡有不同标记字母的即为差异显著。差异极显著标记方法同上，用大写字母标记。梯形法是将各处理的平均数差数按梯形列于表中，并将这些差数进行比较。差数LSD(LSR)0.05。说明处理平均数间的差异达到显著水平，在差数的右上角标“*”号；差数LSD(LSR)0.01，说明处理平均数间差异达到极显著水平，在差数的右上角标“*”号。差数LSD(LSR)0.05，说明差异不显著。方差分析有哪些基本假定?为什么有些数据需经过转换后才能进行方差分析?答方差分析有3个基本假定：正态性(试验误差服从正态分布)、可加性(处理效应与误差效应线性可加)、方差同质性(误差方差具有同质性)。方差分析的有效性是建立在这3个基本假定的基础上的。在研究中会出现一些样本，其所来自的总体和方差分析的基本假定相抵触，这些数据在进行方差分析之前必须经过适当的处理，即数据转换来变更测量标尺。计算题：下表是某地区4月下旬平均气温与5月上旬50株棉苗蚜虫头数的资料。试建立直线回归方程。年份1969197019711972197319741975197619771978197919804月下旬平均气温(x)19.326.618.117.417.516.916.919.117.917.518.119.05月上旬50株棉蚜虫数(y)头8617982928292312146450112解建立直线回归方程。计算回归分析所需的6个一级数据：n=12由一级数据算得5个二级数据：计算b值及a值：建立直线回归方程：由方程可知，某地区4月下旬平均气温每增加1，5月上旬50株棉苗蚜虫就增加18.0836头。第十五章名词解释 2、简单随机抽样法简答题 1、简单一级抽样样本容量的估计 2、分层抽样样本容量的估计 3、二级或多级抽样样本容量的估计 4、抽样单位大小与样本容量的相互关系

展开阅读全文

大学试验统计复习题.doc

最新文档