医学科研设计的基本原则与统计分析方法

资源描述

科研设计的基本原则科研设计的基本原则与与统计分析的思维方法统计分析的思维方法为什么要进行可科研设计？为什么要进行可科研设计？医学科学研究的实验设计是医学科研中至医学科学研究的实验设计是医学科研中至关重要的一个环节。关重要的一个环节。一项好的实验设计一项好的实验设计可以节约大量的人力、物力、财力和时间，可以节约大量的人力、物力、财力和时间，保证实验的科学性、可靠性和诚信度。保证实验的科学性、可靠性和诚信度。科研设计的一般要求科研设计的一般要求1科学性科学性能回答科研提出的问题。能回答科研提出的问题。2严密性严密性通过大量查阅文献和现场调查，搜集科学通过大量查阅文献和现场调查，搜集科学资料，或在进一步进行预备实验或可行性资料，或在进一步进行预备实验或可行性调查实验的基础上，进行严密的设计。调查实验的基础上，进行严密的设计。3合理性合理性能保证通过设计方案的实施，取得可靠的研究能保证通过设计方案的实施，取得可靠的研究成果，具有普遍意义，经得住实践的考验。成果，具有普遍意义，经得住实践的考验。4高效性高效性以最少的人力、财力、物力，得出有意义的结以最少的人力、财力、物力，得出有意义的结果。果。5道德性道德性符合社会道德规范，决不损害人的身心健康。符合社会道德规范，决不损害人的身心健康。科研设计的基本原则科研设计的基本原则随机原则随机原则对照原则对照原则均衡原则均衡原则重复原则重复原则盲法原则（盲法原则（临床试验时，可属均衡之列）这些原则的作用是减少误差，提高实验效率。这些原则的作用是减少误差，提高实验效率。对照原则对照原则对照就是对受试对象不施加处理因素或施对照就是对受试对象不施加处理因素或施加处理因素前的一种处理状态加处理因素前的一种处理状态用于与施加处理因素或处理后状态进行比用于与施加处理因素或处理后状态进行比较，充分暴露处理因素的效应。较，充分暴露处理因素的效应。1对照的意义：对照的意义：没有比较就没有鉴别，任何事物间的差异都是没有比较就没有鉴别，任何事物间的差异都是通过比较而显示出来的，比较的基准就是对照。通过比较而显示出来的，比较的基准就是对照。设置对照是为了更好的评价和鉴别实验结果的设置对照是为了更好的评价和鉴别实验结果的科学性、真实性，避免偏倚而产生错误的结论。科学性、真实性，避免偏倚而产生错误的结论。甄别处理因素与非处理因素效应，排除非甄别处理因素与非处理因素效应，排除非处理因素干扰处理因素干扰,减少实验误差减少实验误差公式表达如下：公式表达如下：T+S E+eF式中：T为处理因素，E为处理因素效应，S为非处理因素，e为非处理因素效应。对照的原理对照的原理T+S1 E+e1 0+S2 0+e2T E两个实验组相互比较的原理两个实验组相互比较的原理 T1+S1 E1+e1T2+S2 E2+e2如果 S1 =S2，e1=e2那么T1-T2 E1-E2 Td Ed 2对照的要求：对照的要求：对等：对等：除处理因素外，对照组要具备与实验组除处理因素外，对照组要具备与实验组对等的非处理因素。对等的非处理因素。同步：同步：对照组与实验组设立之后，在整个研究对照组与实验组设立之后，在整个研究进程中始终处于同一空间和同一时间。进程中始终处于同一空间和同一时间。专设：专设：任何一个对照组都是为相应的实验组专任何一个对照组都是为相应的实验组专门设立的。不得借用文献上记载或以往的结果门设立的。不得借用文献上记载或以往的结果或其他研究资料作为本研究对照。或其他研究资料作为本研究对照。3对照的形式对照的形式同期随机对照同期随机对照：相同时间、地点选择研究对象，以随机分配方式分组；其可比性强，避免了选择性偏倚，结果更具说服力。自身对照：自身对照：对照与实验在同一受试对象进行。历史性对照：历史性对照：将新的干预性措施的结果与过去的研究比较，即将研究者以往的研究结果或他人的研究结果与本次研究结果作对照。非随机同期对照：非随机同期对照：研究对象是同时间、同地点，用非随机分配的方法分为实验组和对照组，分组的方法不是随机的。配对对照：配对对照：将实验组的观察对象按照配对因素与对照组相配对。阳性对照：阳性对照：与已知疗效的典型药进行比较。空白对照：空白对照：对照组不施加任何处理因素。实验对照（效应特异性对照）实验对照（效应特异性对照）：采用与实验组条件一致的对照措施。随机化原则随机化原则随机化（随机化（randomization）指从总体中抽取个体或样本时，每个个体或样指从总体中抽取个体或样本时，每个个体或样本都有同等被抽取的机会。本都有同等被抽取的机会。随机抽样随机抽样指各个个体或样本都有同等机会被抽取的抽样。指各个个体或样本都有同等机会被抽取的抽样。随机不同于通常意义的随机不同于通常意义的“随意随意”、“随便随便”两词两词例如一个笼子里有例如一个笼子里有10只小老鼠，要求均分到对照和试只小老鼠，要求均分到对照和试验组中去，如果研究者规定验组中去，如果研究者规定“短尾巴老鼠分到对照组、短尾巴老鼠分到对照组、长尾巴老鼠分到实验组长尾巴老鼠分到实验组”就属于就属于“随意随意”分组，包含分组，包含有主观选择；有主观选择；如果研究者规定如果研究者规定“闭上眼睛捉老鼠，先捉住的作为对闭上眼睛捉老鼠，先捉住的作为对照组，后捉住的作为实验组照组，后捉住的作为实验组”则属于则属于“随便随便”分组，分组，包含有客观选择。包含有客观选择。因此随机抽样，可以理解为既没有主观选择、也因此随机抽样，可以理解为既没有主观选择、也没有客观选择的一种抽样方法。没有客观选择的一种抽样方法。随机化具体体现在如下几方面：随机化具体体现在如下几方面：抽样随机：抽样随机：F每一个符合条件的实验对象参加实验的机会相同。分组随机：分组随机：F每个实验对象分到处理组和对照组的机会相同，以保证各处理组间实验对象尽可能均衡一致，以提高各组间的可比性。实验顺序随机：实验顺序随机：F每个实验对象接收处理先后的机会相同，以消除不平衡的实验顺序所产生的偏差。随机化方法随机化方法 1抽签法抽签法例如要把例如要把12只动物分为两组，先将只动物分为两组，先将动物编号动物编号1、2、312，同时制作数字为，同时制作数字为112的标签，标签充分混匀后，按预先规定抽取的标签，标签充分混匀后，按预先规定抽取6个签号，将动物对号入座分到第个签号，将动物对号入座分到第1组，余下的组，余下的6个标签号的动物分第个标签号的动物分第2组。组。2随机数字表法随机数字表法根据随机抽样的原理编制而根据随机抽样的原理编制而成的，用于随机分配和随机抽样。成的，用于随机分配和随机抽样。3Excel 编程编程重复原则重复原则重复重复(replication)有两层含意：有两层含意：一是指实验的样本量必须足够大，在相同实验一是指实验的样本量必须足够大，在相同实验条件下充分的重复，以避免实验结果的偶然性，条件下充分的重复，以避免实验结果的偶然性，突出表现其必然规律；突出表现其必然规律；二是指任何实验结果的可靠世经得起重复实验二是指任何实验结果的可靠世经得起重复实验的考验，重复实验是检查实验结果可靠性的惟的考验，重复实验是检查实验结果可靠性的惟一方法。一方法。一个不可重复的研究是没有科学性的。一个不可重复的研究是没有科学性的。重复的目的有两个：重复的目的有两个：一是稳定标准差，获得实验误差估计值；一是稳定标准差，获得实验误差估计值；二可使均值接近真实值，实验组与对照二可使均值接近真实值，实验组与对照组差异能够准确地显露出来。组差异能够准确地显露出来。样本大小的影响因素样本大小的影响因素1总体参数总体参数()指两个样本均数或两个率比较指两个样本均数或两个率比较时，其总体均数或率的差值。时，其总体均数或率的差值。F越大，说明差异越明显，需要的样本量越小。2实验误差实验误差 F实验方法越准确，个体间差异越小，实验误差必然较小，越易达到统计等显著性，所需样本越小；否则，样本要大。3检验水准检验水准 F实验所需样本数与实验设计规定的检验水准成反比，检验水准定得愈低，所需样本含量愈大，=0.01所需样本数大于=0.05所需样本数。4检验效能检验效能(1一一)F检验效能指当两总体确有差别时，按检验水准发现它们有显著差别的能力。F检验效能由(第二类错误的概率)大小所决定，当=0.1，=0.2时，相应的检验效能为0.8和0.9。检验效能越大，所需要的时间样本量也越大。5资料性质资料性质F同等情况下，数值变量资料所需样本量少于分类变量。F如果分类变量结果上相差悬殊，对照组全为阴性，实验组全为阳性，则少数样本也达到统计学的显著性。6实验结果的可能性实验结果的可能性F双向结果(存在AB或AB两种可能性)所需样本数多F单向结果(只存在AB或AB一种可能性)所需样本数少。7实验设计的类型实验设计的类型F完全随机实验设计所需样本多F配对设计随机区组实验设计所需样本较少F拉丁方实验设计所需样本更少F序贯实验设计所需样本数又可少3050样本大小的估计方法样本大小的估计方法样本含量越大或重复次数越多，越能反应样本含量越大或重复次数越多，越能反应变异的客观真实情况。变异的客观真实情况。若样本含量过大，浪费人力物力。若样本含量过大，浪费人力物力。若样本含量过小，有专业意义的差异，也若样本含量过小，有专业意义的差异，也可能没有统计学意义，造成假阴性错误。可能没有统计学意义，造成假阴性错误。粗估法粗估法动物实验时动物实验时大动物大动物(犬、猫犬、猫)515只组；只组；中等动物中等动物(兔、豚鼠兔、豚鼠1020只组；只组；小动物小动物(大鼠、小鼠大鼠、小鼠)1530只组。只组。临床研究一般难治愈的疾病临床研究一般难治愈的疾病疗效显著时疗效显著时(如癌症如癌症)510例即可；例即可；急重病死亡率高的急重病死亡率高的(如休克、心衰、肾衰、呼吸衰竭如休克、心衰、肾衰、呼吸衰竭)需需3050例；例；一般病和慢性病一般病和慢性病300500例；例；按按WHO规定规定血清流行病学调查需血清流行病学调查需300600例，例，一般流行病学调查和正常值调查则常需千例以上。一般流行病学调查和正常值调查则常需千例以上。恶性肿瘤的流行病学调查至少恶性肿瘤的流行病学调查至少10万人口以上；万人口以上；多因素分析时，样本含量数是研究因素数的多因素分析时，样本含量数是研究因素数的510倍以上。倍以上。计算法计算法见样本含量的计算（Excel程序）均衡性原则均衡性原则均衡均衡(balance）即实验组和对照组或各实验组之间，除了观察的受试即实验组和对照组或各实验组之间，除了观察的受试因素外，其他一切条件应尽可能相同或一致因素外，其他一切条件应尽可能相同或一致F如动物的种属、品系、窝别、年龄、性别、体重、健康状况、如动物的种属、品系、窝别、年龄、性别、体重、健康状况、生理条件、饲养环境等要保持一致。生理条件、饲养环境等要保持一致。F如果受试对象是病人，则要求病人的病种、病期、病型、病程、如果受试对象是病人，则要求病人的病种、病期、病型、病程、年龄、性别、生活、社会、心理等因素保持均衡一致。年龄、性别、生活、社会、心理等因素保持均衡一致。均衡的意义均衡的意义在于更好地避免偏性，减少误差，提高实验的精确性。在于更好地避免偏性，减少误差，提高实验的精确性。均衡的方法均衡的方法1交叉均衡法交叉均衡法2分层均衡法分层均衡法均衡性检查均衡性检查先按主要影响因素分层，然后在层内随机抽样，这样组间均衡性较好。但若样本分配并不是采用分层随机，而是使用完但若样本分配并不是采用分层随机，而是使用完全随机的方法，在小样本实验中则可能出现严重全随机的方法，在小样本实验中则可能出现严重不平衡状态。不平衡状态。为弥补这一缺陷，应在实验样本数达到预定数为弥补这一缺陷，应在实验样本数达到预定数8090时进行均衡性检查。若发现不平衡指数时进行均衡性检查。若发现不平衡指数(影响因素差数绝对值之和，影响因素差数绝对值之和，di)较大时，随后的较大时，随后的样本分配应以如何使不平衡指数减小为原则。样本分配应以如何使不平衡指数减小为原则。例如，比较复方青黛与马利兰对慢性粒细胞白血病的疗效，预定观察20例，每组10例，按完全随机已收治17例。若性别、年龄、病情与病程是其主要影响因素，则按此进行均衡性检查。di=12检查结果不平衡指数检查结果不平衡指数di)较大，故随后继较大，故随后继续进来的病例应当以使续进来的病例应当以使di减少为原则。减少为原则。F如新来一位符合受试条件的本病患者系男性青年，病情较重，确诊已达1年半。若将此患者分至马利兰组，则若将此患者分至马利兰组，则di 增至增至16，若将其分至复方青黛组，则若将其分至复方青黛组，则di 减至减至8，故应将，故应将此患者分至复方青黛组。此患者分至复方青黛组。盲法原则盲法原则盲法盲法(blindness)是指按试验方案的规定，不让参与研究的受试受试者者和(或)观察者观察者、其他有关工作人员（部分设其他有关工作人员（部分设计者）计者）知道病人所接受的是何种处理(试验药或对照药)，从而避免他们对试验结果的人为干扰和心理因素的影响。单盲法单盲法(single blindness)单盲法：在研究中，受试对象不知道接受什么处理。单盲法：在研究中，受试对象不知道接受什么处理。单盲法的优点：单盲法的优点：避免研究对象的主观因素所致的偏差。单盲还保留非盲法的优点，即实施起来容易，在研究对象出现任何变化时，担任观察任务的研究人员容易判断其原因，并决定是否终止试验或改变方案，以保证处理因素使用的安全性。单盲法的缺点：单盲法的缺点：不能避免研究人员主观因素所产生的偏倚，单盲获得结论的客观性和可信度低于双盲法。用于单盲的对照药物既可是安慰剂，也可以是有效药物或用于单盲的对照药物既可是安慰剂，也可以是有效药物或标准治疗。标准治疗。双盲法双盲法(double blindness)：研究中，受受试者试者和承担观察任务的研究人员承担观察任务的研究人员均不知道每个受试对象的分组和接受处理的情况可避免受试对象的主观偏差和研究者的人可避免受试对象的主观偏差和研究者的人为偏差。为偏差。需要用双盲临床试验需要用双盲临床试验在临床研究中在临床研究中反映疗效和安全性的主要指标如果是主观、定反映疗效和安全性的主要指标如果是主观、定性的，或者虽是定量指标，但容易受心理、精性的，或者虽是定量指标，但容易受心理、精神因素影响的。神因素影响的。新的新药评审办法新的新药评审办法化学药品第一、二、三类药物；化学药品第一、二、三类药物；五类药物中需延长用药周期和五类药物中需延长用药周期和(或或)降低剂量的降低剂量的药物要进行药物要进行期临床实验的。期临床实验的。双盲法较为复杂，实际执行起来困难较大。双盲法较为复杂，实际执行起来困难较大。在研究过程中，由于种种原因容易造成盲在研究过程中，由于种种原因容易造成盲底泄露，称为破盲。底泄露，称为破盲。在执行双盲法时，如果病情发生变化，不在执行双盲法时，如果病情发生变化，不能准确判断并及时处理。能准确判断并及时处理。双盲法临床试验注意的问题：双盲法临床试验注意的问题：(1)严格随机分组，认真、客观填写病例报告表。严格随机分组，认真、客观填写病例报告表。(2)实验组与对照组所用的药物外观、形状、剂型实验组与对照组所用的药物外观、形状、剂型等必须高度一致。等必须高度一致。(3)要有一套完善的执行盲法编码制度，受试对象要有一套完善的执行盲法编码制度，受试对象的所有记录、请求单、回报单等全采用代号制。的所有记录、请求单、回报单等全采用代号制。(4)每个盲法试验应指定一位第三者作为统筹每个盲法试验应指定一位第三者作为统筹负责和监督整个研究工作的监视员。负责和监督整个研究工作的监视员。其职责是监督盲法执行，保证结果的可靠性，其职责是监督盲法执行，保证结果的可靠性，保证受试对象的安全，分发应急信件，保管盲保证受试对象的安全，分发应急信件，保管盲底，试验终末揭盲等。底，试验终末揭盲等。(5)设有应急信件和紧急情况个别病例揭盲规定。设有应急信件和紧急情况个别病例揭盲规定。临床试验必须符合科学和道德伦理原则：为防临床试验必须符合科学和道德伦理原则：为防止试验中出现紧急情况贻误病人治疗，应为每止试验中出现紧急情况贻误病人治疗，应为每一个编盲号设置一个应急信件一个编盲号设置一个应急信件(内容为病例用药内容为病例用药编号、药名编号、药名)，以便在紧急情况对个别病例揭盲，以便在紧急情况对个别病例揭盲抢救治疗。抢救治疗。(6)盲态核查盲态核查指最后一例受试者的最后一次观察完成后，数指最后一例受试者的最后一次观察完成后，数据管理员将病历报告表输入数据库，并经过复据管理员将病历报告表输入数据库，并经过复核、直到数据锁定，以及第一次揭盲间对数据核、直到数据锁定，以及第一次揭盲间对数据的核查和评价等所做的工作。的核查和评价等所做的工作。是双盲临床实验中标准操作规范中的一个必要是双盲临床实验中标准操作规范中的一个必要环节，必须严格实施。环节，必须严格实施。三盲法三盲法(triple blindness)三盲法是双盲法的扩展，即受试对象、研三盲法是双盲法的扩展，即受试对象、研究人员和资料分析人员均不知道受试对象究人员和资料分析人员均不知道受试对象的分组和管理情况。的分组和管理情况。理论上可以减少资料分析上的偏差理论上可以减少资料分析上的偏差分析时减弱了对整个研究工作的全局了解，对分析时减弱了对整个研究工作的全局了解，对研究的安全性要求较高，在执行时也较严密，研究的安全性要求较高，在执行时也较严密，难度较大。难度较大。统计分析的思维方法统计分析的思维方法统计学中的几个基本概念统计学中的几个基本概念 1、总体与样本、总体与样本总体总体(population)是根据研究目的确定的同质观察单位是根据研究目的确定的同质观察单位的全体，更确切地说，是同质的所有观察单位某种变的全体，更确切地说，是同质的所有观察单位某种变量值的集合。量值的集合。F根据总体所含有观察单位的个数是否可以清点数目，分为有限总体(finite population)和无限总体(infinite population)。F在实际工作中，对于无限总体或有限总体多采用随机化抽样进行研究，目的是通过样本信息推断总体特征。F按照随机化抽样原则，从总体中抽取的部分观察单位的某变量值的集合称为样本(sample)，这时的样本对总体具有较好的代表性。样本样本(sample)是按照随机化抽样原则，从总体是按照随机化抽样原则，从总体中抽取的部分观察单位的某变量值的集合中抽取的部分观察单位的某变量值的集合F这时的样本对总体具有较好的代表性。F样本所包含的个体数量，称为样本含量（sample size），用符号n表示。F如上例，在2006年某地正常成年男子中随机抽取120人，这120人的身高值即为样本。120为样本例数(即n120)。2、变量、变量观察单位的某项特征指标称为观察单位的某项特征指标称为变量变量(variable)，对变量的测量值称为对变量的测量值称为变量值变量值(value of variable)或或观察值观察值(observed value)，用符号，用符号x表示，表示，一群变量值构成一组一群变量值构成一组资料（资料（data）。例如，以人为观察单位，调查某地某年例如，以人为观察单位，调查某地某年1岁男岁男童的身体发育状况，身高、体重等都属于变量。童的身体发育状况，身高、体重等都属于变量。按变量值是定量的还是定性的，可将变量按变量值是定量的还是定性的，可将变量分为以下类型。分为以下类型。(1)数值变量数值变量F数值变量(numerical variable)或称定量变量，是通过仪器设备测量出来的，其变量值是定量的，表现有量的大小、值的高低，通常具有度量衡单位。F如人的体温()、呼吸(次min)、体重(kg)、血压(kPa)等。(2)分类变量分类变量F分类变量(categorical variable)或称定性变量，是通过清点数目得到的，其变量值是定性的，表现为互不相容的类别或属性的个数多少。F根据类别之间是否有程度上的差别又分为：la、无序分类变量、无序分类变量各类别之间有性质上的不同，而无程度上的差别。lb、有序分类变量、有序分类变量相对独立、自成一组，但组间排列有序、存在程度上的差别相对独立、自成一组，但组间排列有序、存在程度上的差别比如观察某人群成年男子的血红蛋白含量，按血红蛋白含量的多少可分为五个等级：重度贫血、中度贫血、轻度贫血、正常、血红蛋白增高；又如观察用某药治疗某病患者的疗效，以每名患者为观察单位，临床疗效分为治愈、显效、好转、无效四级。(3)变量间的转化变量间的转化F根据研究分析的需要，在一定条件下各类变量之间可以相互转化。F如人的血压属数值变量，当分析需要时可转化成无序分类变量(血压正常与异常)和有序分类变量(低血压、正常血压、高血压)。F有时还可以将分类变量数量化，如无序分类的性别（女、男）可转为0、1；有序分类的血压等级(低血压、正常血压、高血压)分别转成1、2、3。3、同质与变异、同质与变异同质同质(homogeneity)是指研究事物具有相同或相是指研究事物具有相同或相近的性质、条件或影响因素。近的性质、条件或影响因素。客观上，完全同质是做不到或难以做到的，所以客观上，完全同质是做不到或难以做到的，所以统计学中的同质是指对观察指标影响较大的、且统计学中的同质是指对观察指标影响较大的、且可以控制的主要因素的相同，可以控制的主要因素的相同，如研究某药物对肺结核病的治疗效果，要求结核病人如研究某药物对肺结核病的治疗效果，要求结核病人被确诊，其病情、病程、年龄、性别相同或相似，等被确诊，其病情、病程、年龄、性别相同或相似，等等；等；变异变异(variation)是指同质基础上的个体间是指同质基础上的个体间的差异。的差异。个体差异主要来源于一些已知的或未知的，甚个体差异主要来源于一些已知的或未知的，甚至是某些不可控制的因素所导致的随机误差。至是某些不可控制的因素所导致的随机误差。F如将对身高影响较大的因素控制在相同条件下，测试一批大学生身高，每个人的测得值并不完全相同，这种差异称为身高的变异。统计研究的任务就是在同质分组的基础上，通统计研究的任务就是在同质分组的基础上，通过对个体变异的研究，透过偶然现象，反映同过对个体变异的研究，透过偶然现象，反映同质事物的本质特征与规律。质事物的本质特征与规律。4、参数与统计量、参数与统计量参数参数(parameter)是通过总体的所有变量值是通过总体的所有变量值计算的描述总体特征的指标计算的描述总体特征的指标用希腊字母代表，如：总体均数用希腊字母代表，如：总体均数、总体率、总体率、总体标准差总体标准差等。等。统计量统计量(statistic)是根据样本的变量值计算是根据样本的变量值计算的描述样本特征的指标，的描述样本特征的指标，用拉丁字母代表，如：样本均数、样本率用拉丁字母代表，如：样本均数、样本率p、样本标准差样本标准差S等。等。前述某地前述某地2006年所有正常成年男子身高值的均数为参数，年所有正常成年男子身高值的均数为参数，120人的样本均数为统计量。人的样本均数为统计量。对于一个总体来说，总体的参数是固定、唯一的，而来自对于一个总体来说，总体的参数是固定、唯一的，而来自同一总体的不同样本的统计量是有差别的。同一总体的不同样本的统计量是有差别的。5、随机化、随机化 6、误差、误差误差（误差（error）泛指测量值与真实值之差）泛指测量值与真实值之差根据其产生的原因和性质根据其产生的原因和性质随机误差（随机误差（random error）非随机误差（非随机误差（nonrandom error）随机误差是由许多无法控制的因素引起的一类不恒定随机误差是由许多无法控制的因素引起的一类不恒定的误差。的误差。F包括随机测量误差、抽样误差。l 随机测量误差随机测量误差指在同一条件下对同一对象进行测量，虽极力控制指在同一条件下对同一对象进行测量，虽极力控制或消除系统误差，测量结果之间仍然存在差别，呈随机的变化；或消除系统误差，测量结果之间仍然存在差别，呈随机的变化；l 抽样误差抽样误差是由于抽样而使获得的样本统计量与总体参数之间存在是由于抽样而使获得的样本统计量与总体参数之间存在差别。差别。随机误差的特点：随机误差的特点：F随机误差是不可避免的，因为无法控制引起随机误差的因素。F随机误差呈正态分布，可以用统计学的方法加以分析。非随机误差分为非随机误差分为F系统误差系统误差是一类恒定，由可知或可控制的因素引起的误差。如测量仪器未经校准就进行测量，使测量结果一致的偏大或偏小。l系统误差可以通过周密的设计和要严格的技术措施加以消系统误差可以通过周密的设计和要严格的技术措施加以消除或控制。除或控制。F非系统误差非系统误差又称过失误差，是由于研究者的偶然过失而造成的误差。如差错数字，点错小数点等。l这类误差应通过认真核查加以消除。这类误差应通过认真核查加以消除。7、抽样误差、抽样误差抽样误差抽样误差(sampling error)是指由于随机抽是指由于随机抽样的原因引起的样本指标样的原因引起的样本指标(统计量统计量)与总体指与总体指标标(参数参数)之间差别，或从同一总体抽取的不之间差别，或从同一总体抽取的不同样本指标之间的差别。同样本指标之间的差别。根本原因是由于总体中的个体间存在变异因为生物个体之间的差异总是客观存在，所以抽样误差不可避免，但大小有规律可循。8、概率、概率概率概率(probability)又称为几率或或然率，又称为几率或或然率，以符号以符号P表示，是反映某一事件发生的可能表示，是反映某一事件发生的可能性大小的量，性大小的量，P越接近1表示该事件发生的可能性越大，P越接近0表示该事件发生的可能性越小。其取值范围在0到1之间，可以用小数或百分数表示。9、随机事件、必然事件、不可能事件、随机事件、必然事件、不可能事件随机事件有广义随机事件和狭义随机事件之分。随机事件有广义随机事件和狭义随机事件之分。广义随机事件是指概率值在广义随机事件是指概率值在0和和1之间，包括之间，包括0和和1的事件。的事件。其中其中P1的事件称为必然事件；的事件称为必然事件；P0事件称为不可能事件。事件称为不可能事件。所以，所以，P1和和P0可看成是广义随机事件的特例。可看成是广义随机事件的特例。狭义随机事件指概率值在狭义随机事件指概率值在0和和1之间，不包括之间，不包括0和和1的事件，即不包括必然事件和不可能事件。的事件，即不包括必然事件和不可能事件。10、小概率事件、小概率事件习惯上，把习惯上，把P 0.05或或P 0.01的事件称为的事件称为小概率事件。小概率事件。这就是为什么通常把这就是为什么通常把P0.05或或P0.01作为划作为划分事物差异是否具有统计学意义界限的理论依分事物差异是否具有统计学意义界限的理论依据。据。4、假设检验的基本思想（思维方法）小概率事件的反证法小概率事件的反证法小概率小概率事件实际不可能发生原理：事件实际不可能发生原理：小概率事件（P0.01或P0.05）在一次试验中实际上是不可能发生的。反证法思想反证法思想：先提出无效假设H0（备择假设H1），再用适当的统计方法确定H0成立的概率P。如果P小，则拒绝H0成立，承认 H1成立；若P不小，则没有理由拒绝H0成立，即接受H0，拒绝H1。比喻比喻：公安局办理一起：公安局办理一起“盗窃案盗窃案”一起高层居民楼发生盗窃案最后怀疑张三、李四两人由于张三是惯偷，先假定是张三所为调查证据和分析：盗窃案发生在盗窃案发生在10楼楼攀墙、越窗进入攀墙、越窗进入张三是瘸子张三是瘸子所以，张三盗窃的可能性很小（P0.01或P0.05）结论：不是张三干的，是李四所为！假设检验是如此假设检验是如此“办案办案”的的一起样本均数与总体均数比较的假设检验一起样本均数与总体均数比较的假设检验已经确定差别由抽样误差或本质差异引起已经确定差别由抽样误差或本质差异引起抽样误差经常存在，先假定是抽样误差抽样误差经常存在，先假定是抽样误差H0所致所致计算由计算由抽样误差抽样误差所致的统计量（所致的统计量（如如 t-值、值、F-值、值、2 2-值值）和概率和概率结论：拒绝结论：拒绝H0，接受，接受H1，认为存在本质差异！，认为存在本质差异！01.0,32557275Pt本例 l 根据研究目的，提出假设无效假设H0：抽样误差所致备择假设H1：本质差异造成l 确定显著性水准（=0.05 or 0.01=0.05 or 0.01）l 计算统计量（如如 t-值、值、F-值、值、2 2-值值），），确定P值l 作出结论P,拒绝H0、接受H1；否则，接受H0、拒绝H1假设检验的基本步骤假设检验的基本步骤统计资料的类型统计资料的类型统计资料按其性质一般分为计数资料计数资料计量资料计量资料等级资料等级资料不同类型的统计资料应采用不同的统计分析方法不同类型的统计资料应采用不同的统计分析方法。1、计数资料（、计数资料（measurement data）是先将观察单）是先将观察单位按某种属性或类别分成相互独立的若干组，再位按某种属性或类别分成相互独立的若干组，再清点各组观察单位个数所得到的资料。清点各组观察单位个数所得到的资料。如对一批某病患者检验完毕后，清点呈阳性或阴性反应的人数。又如调查某人群的血型分布，先按A、B、AB、O四型分组，再清点各血型组的例数。计数资料所对应的测量指标称为分类变量，所以计数资料也称为分类变量资料，相对于后述的有序分类变量资料而言，此类资料一般指的是无序分类变量资料，可计算百分比或率等相对数，需要时做百分比或率之间的比较，也可做两事物之间相关的相关分析。2、计量资料（、计量资料（enumeration data）是用测）是用测量仪器或其它定量方法对每个观察单位的量仪器或其它定量方法对每个观察单位的某项指标进行测定所得到的一组数值，一某项指标进行测定所得到的一组数值，一般带有度量衡单位。般带有度量衡单位。如检查某地青少年的体重，需要体重计称量，以公斤等为单位，测得大小不一的体重值。其它如身长（cm）、血压（mmHg）、脉搏（次分）、红细胞（万/mm3）、转氨酶（单位）等，都属于计量资料。计量资料所对应的测量指标称为数值变量，所以计量资料也称为数值变量资料，可计算平均数与标准差等指标，需要时做各均数之间的比较或各变量之间的分析。3、等级资料（、等级资料（ranked data）又称半定量资料，是）又称半定量资料，是将观察单位按某种属性或某个特征的等级顺序分将观察单位按某种属性或某个特征的等级顺序分组，然后清点各组观察单位的个数得来的资料。组，然后清点各组观察单位的个数得来的资料。这些资料既具有计数资料的特点，又兼有半定量这些资料既具有计数资料的特点，又兼有半定量的性质，的性质，例如对一批急性病毒性肝炎患者作麝香草酚絮状试验，将试验结果按浑浊程度分为-、+、+、+、+几组，显然各组之间既有等级程度差异，又有个数多少的差别。又如某病住院病人的治疗结果，按治愈、好转、无效、死亡分组，同样各组之间具有程度与数量之别。等级资料所对应的测量指标称为有序分类等级资料所对应的测量指标称为有序分类变量，所以等级资料也称为有序分类变量变量，所以等级资料也称为有序分类变量资料资料分析等级资料常用的统计指标有比和率，分析等级资料常用的统计指标有比和率，常用的统计方法有秩和检验、常用的统计方法有秩和检验、Ridit分析等。分析等。根据分组的多少、组与组之间有无等级程度的差根据分组的多少、组与组之间有无等级程度的差异将资料分为：异将资料分为：二项无序资料、二项无序资料、二项有序资料、二项有序资料、多项无序资料、多项无序资料、多项有序资料，多项有序资料，甚至相互交叉组成更为复杂的类型资料，如二项无甚至相互交叉组成更为复杂的类型资料，如二项无序序二项无序的资料、二项无序二项无序的资料、二项无序多项有序的资多项有序的资料等等。料等等。总之，根据不同的分析要求对统计资料可有不同总之，根据不同的分析要求对统计资料可有不同的分类方法。的分类方法。统计分析统计分析统计描述统计描述统计推断统计推断见Excel统计分析教程有关统计学假设检验方法的正确抉择有关统计学假设检验方法的正确抉择 The end

展开阅读全文

医学科研设计的基本原则与统计分析方法

最新文档