医学科研设计的基本原则

资源描述

第三章医学科研设计的基本原则医学科研设计是指对某一项医学研究的具体内容和方法的安排。作为科学研究，生物医学研究探索生物医学领域内未知事物和未知规律的科学活动，必须有科学的研究方法和合理的设计才能获得真实、可靠的研究结果。以人为主要研究对象的生物医学研究，由于研究对象的复杂性和特殊性，影响研究效应的因素很多、许多因素无法完全消除，因此对研究设计的要求就更高。如果研究设计存在缺陷（如样本代表性、可比性、混杂等），就可能影响研究结果的可靠性和研究价值。另一方面，还要考虑研究对象（样本）的数量，样本量过少或过多都会对研究结果造成影响。一个缜密而完善的研究设计，能合理地安排各种研究因素，严格控制各种误差，用较少的人力、物力和时间，最大限度地获得足够而可靠的资料。合理的研究设计是顺利开展各种医学研究的前提条件，也是得到预期结果、达到事半功倍的保证。为了达到上述目的，在医学研究设计中必须遵循四项基本原则：随机化原则、对照原则、盲法原则和重复原则。第一节随机化原则随机化的核心是机会均等。随机化是医学研究中一项非常重要的原则。在医学研究中，随机化包括两方面的内容：随机化抽样和随机化分组。通过随机化选择研究对象，可以得到一个有代表性的样本。当存在未知或不可控制的非处理因素时，随机化分组将研究对象随机分配到实验组和对照组之中，使这些非处理因素在实验组和对照组的分布一致。因此，随机化是实验性研究中保证组间均衡、可比的重要手段。一、随机化抽样随机化抽样是指总体或目标人群中的每一个个体都有相同机会被抽中作为研究对象（样本）。在医学研究中，由于时间、人力、物力限制，通常不能把所有目标人群都作为研究对象，而只能选取其中一部分作为研究对象（样本）。对一组（或几组）研究对象（样本）进行调查或实验，获得原始数据，经过数据整理和统计分析得到样本信息（如均数、率等指标），并以样本的信息来推断总体人群的特征。要实现这一推断的前提条件是所采用的研究对象（样本）要有代表性，即能代表目标人群。否则，就不能实现这一推断。获得一个有代表性样本的常用方法是采用随机化抽样来选择研究对象，即目标人群中每一个个体被选中的概率相等。这样获得的样本称为随机样本。“随机”不等于“随意”或“随便”。医学研究一般都需要推论，因此都需要采用随机化抽样的方法选择一组有代表性的研究对象。随机化抽样也是数据能统计分析和推断的前提。社会学、新闻传播学常用典型调查，其调查结果反映一部分（特殊人群）的特征，不能推论到普通人群。二、随机化抽样的常用方法在医学研究中常见的随机化抽样方法有单纯随机化抽样、系统随机化抽样、分层随机化抽样、整群随机化抽样以及多阶段抽样随机化方法。(1) 单纯随机化抽样表3-1 随机数字表也称为简单随机化抽样，一种最简单、最基本的抽样方法。其基本原理是从总体N个对象中，采用随机方法（如随机数字）抽取n个，构成一个样本。它的重要原则是总体中每个对象被抽到的概率相等（均为n/N）。常见的随机方法有抽签或抓阄、掷骰子、掷硬币（50的概率）等；比较科学又方便的方法是用随机数字。随机数字表是根据概率论的原理编制的一种统计表，是获得随机数字的常用工具，见表3-1。使用时是首先随机地确定所用表的起始行数、列数，然后逐行、逐列按次序连续选取若干随机数，其结果比抽签方法更理想。利用计算机数据库软件中的随机函数（RAND（X）和取整函数(INT（X）)可以产生任意位数的随机数字。例如利用公式INT（RAND（x）100）+1可以产生1100之间的随机数字。利用随机数字进行单纯随机抽样的基本步骤如下：1. 确定目标人群的特征；2. 将目标人群中的每个个体编号、排序；3. 给每个个体分配一个随机数字；4. 预先确定选择研究对象的方法。如欲抽取50%的人群作为样本，则可以按照随机数字是偶数或奇数还确定；如欲选择1/3的人群，则可以把随机数字除以3后根据余数的情况选择；也可以根据随机数字的大小；5. 根据随机数字选择研究对象。单纯抽样方法适合在总体单位数不大，各个单位之间变异较小的情况下经常采用的抽样方法。如总体数量大时，必须有所有单位的名单、编号，抽样过程比较麻烦。被抽到的个体比较分散，资料收集困难，可行性不大。如总体变异大，即使采用单纯随机抽样，获得样本的代表性也不一定好。单纯随机抽样的标准误按资料性质可用公式3-1和3-2计算。均数的标准误：（3-1）率的标准误：（3-2）上式中s为样本标准差，p为样本率，N为总体含量，n为样本含量，其中n/N为抽样比，若小于5%可以忽略不计。(2) 系统随机化抽样也称为机械抽样或等距抽样。它是指按照总体一定顺序，机械地每隔若干单位抽取一个研究对象组成样本的方法（图3-1）。图3-1 系统抽样示意图采用系统抽样的基本步骤如下：1. 确定目标人群的特征。2. 将目标人群中的每个个体排序、编号，如从1N相继编号。3. 确定抽样间隔：K=N/n。式中N为总体单位总数，n为样本含量；根据抽样间隔，把总体依次分成k组。4. 在第一组人群中，用随机抽样方法抽取个体i作为研究对象。然后依次加上K作为下一组的样本号，即第j组内的被抽中的样本号为：i+（j-1）K。以此来确定所有的样本。系统抽样优点：（1）事先不需知道总体内的单位数；（2）容易在人群现场进行抽样，特别是总体人数比较多时，也容易进行；（3）所得到的样本是从均匀分布在总体各个部分，一般代表性较好。系统抽样的缺点：假如总体各单位的分布呈周期性趋势，而抽样间隔刚好是其周期的倍数，则可能使样本产生很大的偏性。系统抽样标准误的计算可用单纯随机抽样公式代替。(3) 分层抽样如果一个总体中各个单位间的变异比较大，那么采用单纯随机抽样的方法获得样本的代表性并不很好。对这样的总体进行抽样，可以采用分层抽样的方法。先把总体按某种特征（影响变异最大的因素，如年龄、性别、文化水平、疾病程度等）分为若干层，然后分别从每一层内进行单纯随机抽样，组成一个样本，见图3-2。图3-2 分层抽样示意图通过分层，把内部变异很大的总体分成一些内部变异较小的层。每一层内个体变异越小越好，而层间变异则越大越好。分层可以提高总体指标估计值的精确度，比单纯随机抽样所得到的结果准确性更高，能保证总体中每一个层都有个体被抽到。分层调查除了能估计总体的参数值，还可以分别估计各个层内的情况。如果各层内的样本数ni按各层单位数（Ni）的比例分配，即：（3-3）式3-3中n为总样本数，N为总体单位数，Ni为各层内单位数，这种设计称为按比例分配的分层抽样。其标准误的计算公式如下：均数的标准误：（3-4）率的标准误：（3-5）若各层内样本数ni按下列公式计算：率的抽样：（3-6）均数抽样：（3-7）上两式中i为总体第i层的标准差；pi为总体第i层的率，qi=1-pi。在这种情况下所获得的样本均数或样本率的方差最小，称为最优分配的分层抽样，其抽样误的计算公式如下：均数的标准误：（3-8）率的标准误：（3-9）(4) 整群抽样采用单纯随机抽样等方法获得的研究对象可能包含在总体中的每一个部分。虽然这种调查覆盖面较大，但是，调查所花的人力、物力将很大，在现场也不容易组织实施。如先将总体分成若干群组（如居民区、班级等），以这些群组为基本单位，随机抽取部分群组作为观察单位组成样本，这种抽样方法称为整群抽样。如被抽到群组中每一个个体都作为研究对象，称为单纯整群抽样。若对被抽到群组再采用随机的方法选择部分个体组成研究对象，称为二阶段抽样。整群抽样的特点：（1）容易组织与实施，节省人力、物力；（2）群间差异越小，抽取群数越多，代表性越好；（3）与单纯随机抽样相比，抽样误差较大。因此，整群抽样调查的样本量比其他方法要增加1/2左右。整群抽样设计要求各群组之间的变异不能太大，否则抽样误差比较大。(5) 多级抽样在大型流行病学调查中，常常将上面几种抽样方法综合使用。如先从总体中抽取范围较大的单元，称为一级抽样单位（如省、自治区、直辖市），再从每个抽中的一级单元中抽取范围较小的二级单元（县、乡、镇、街道），最后抽取其中部分范围更小的单元（如村，居委会）作为调查单位，见图3-3。每个阶段的抽样可以采用单纯随机抽样、系统抽样或其他抽样方法。多级抽样可以充分利用各种抽样方法的优势，克服各自的不足，并能节省人力、物力。图3-3 多级抽样示意图三、随机化分组的常用方法在实验性研究中，除了干预因素外，实验组和对照组在非研究因素的分布上一致，这样才能消除这些因素对实验结果的影响。通过随机化分组，可以获得有均衡性的实验组和对照组。常用的随机分组方法有完全随机化分组、区组随机化分组、分层随机化分组和整群随机化分组等。(1) 完全随机化分组完全随机化就是用抽签或随机化数字表等方法直接对实验单位进行随机化分组，分组后各组实验单位的个数可以相同也可以不同。若为小样本资料，当组间个体数目差异较大时，需重新随机分组，直至两组样本含量相近为止。完全随机化简单易行，是实施其他随机分组方法的基础，但样本含量较大时，工作量较大，不易实施。完全随机化的基本步骤如下：1. 将每个研究对象排序；2. 给每个对象分配一个随机数字，随机数可从随机数字表或随机函数获得（见本节第二部分）；3. 事先确定分组的方法。如根据随机数字的单、双数分成二组；把随机数字除以3后的余数分成三组。4. 根据随机数字进行分组。例3-1：将12只小白鼠用完全随机化的方法分成3组。1. 将12只小鼠依次编号112；2. 从随机数字表（表3-1）中的任一行任一列开始，如第四行第一列开始，依次读取两位随机数分配给每只小鼠；3. 将随机数字除以3后记录余数。并规定余数为0为B组，1为C组，2为A组；4. 根据余数和选择方法，确定各小鼠的分组。分组结果见表3-2。表3-2 完全随机化分组方法(2) 配对设计配对设计是将受试对象按某些特征或条件配成对子，然后分别把每对中的两个受试对象随机分配到实验组与对照组（或不同处理组）。这种设计的优点是能缩小受试对象间的个体差异，从而减少实验误差，提高实验效率。受试对象配对的特征或条件，主要是指年龄、性别、体重、环境条件等非实验因素。在医学研究中，用同一受试对象作比较，称为同体比较或自身对照。例如同一组病人用某药治疗前后某项指标的比较；同一批受试对象施加某种处理因素后不同部位或不同器官变化情况的比较，如左眼与右眼，左手与右手的比较；同一批受检样品施以不同检测方法或培养方法所得结果的比较。这些设计方法也属于配对实验。(3) 区组随机化区组随机化是配对设计的扩大。配对设计是将多方面条件近似的受试对象配成对子（两个研究对象）。区组随机化设计是将非研究因素分布相同或相近的受试对象组成区组或配伍组。每个区组内受试对象数目取决于处理因素水平数。各区组间的受试对象不仅数目相等，而且生物学特点也较均衡；区组随机化设计缩小了组间差别，提高了实验效率。例3-2：将12只小鼠，按区组设计要求，分成3个处理组。分组步骤如下：1. 将12只小鼠按照性别相同、体重相近的原则分成4个区组，每个区组内有3只小鼠；2. 给每一只小鼠分配一个随机数字；3. 在每个区组内，根据随机数字的大小分至甲、乙、丙3组中；分组结果见表3-3。表3-3 随机区组分组方法(4) 分层随机化当研究对象变异较大，如按照完全随机化的方法进行分组，比较各组间某些混杂因素如年龄、性别等可能分布不均。如按影响研究对象变异最大的因素如年龄、性别、种族、文化程度、居住条件等进行分层，在每层内分别随机地把研究对象分配到不同组间，这种方法称为分层随机化分组。分层设计可以更好地保证各处理组间达到良好的均衡性，提高检验效率。分层随机化的基本步骤如下：1. 根据研究对象的某个非处理因素（混杂因素）对样本进行分层；2. 在每一层内进行随机化分组分成实验组和对照组；3. 各层实验组的研究对象组成实验组，对照组的研究对象组成对照组，见图3-4。图3-4 分层随机化分组示意图(5) 整群随机化按社区或一群组为单位分配，即以居民区、班级、村庄、医院、家庭等为单位进行随机分组、不直接涉及区组内的研究对象。例如，把10个班的大学生，以班级为单位随机分成2组，见图3-5。图3-5 整群随机化分组示意图该方法容易实施，可以节约人力、物力，适用于大规模调查和研究，但抽样误差较大。实施整群随机化分组要求各群组内变异较小、同质性要高。第二节对照的原则有比较才有鉴别。在医学研究中，除了有研究因素或接受处理因素的暴露组或实验组外，还同时设立对照组。对照组是除了不接受实验组的干预措施外，其他非研究因素的分布与实验组完全一致的研究对象。通过与对照组的比较，才能评价研究因素的作用，并消除其它的非研究因素的影响。一、设立对照的意义与其它自然科学相比，生物医学研究更具复杂性。除了研究因素与研究效应有关外，还有其它许多非研究因素影响研究结果。这些因素可以分为：1 不能预知结局的因素个体的人口学特征和其他生物学因素如年龄、性别、职业、饮食、营养、免疫、精神心理、种族、遗传因素等。由于这些因素的存在，导致在同样的暴露因素或同一干预因素的作用下，研究结局有差别。研究对象产生的研究效应是包括研究因素和众多的非研究因素共同作用的结果。对于自限性疾病，即使不经特异的治疗，也会好转或痊愈。如果不消除这些因素的影响，很难分析研究因素的真实效应。2 霍桑效应 (Hawthorne Effect) 是指研究对象由于成为研究中受注意的目标而改变其行为并产生一定的效应，这些效应与所接受的干预因素无关。如对医院或医生的信任，对治疗产生有利效应。反之，如果不信任，则对治疗会产生不利的效应。3 安慰剂效应安慰剂（placebo）是指不具有特异性治疗或致病效应的制剂，与干预药物在外形、颜色、气味、味道等方面没有差别。使用安慰剂作为对照的措施，要注意安慰剂效应。安慰剂效应是指由于安慰剂的使用，产生的一些非特异效应，包括类似于干预因素的效应。要消除这些非研究因素的影响，把研究因素的真实效应表现出来，必须设立对照。实验组：（3-10）对照组：（3-11）F因素的真实效应（3-12）上式成立的前提条件：F11=F01，F12=F02，F1n=F0n即对照组的研究对象，除了研究因素之外，其它非研究因素的分布与实验组一致，即实验组和对照组在主要非研究因素上具有均衡性。有均衡性，才有可比性，这种对照称为有效的对照。只有正确设立对照，才能把处理因素的效应充分暴露出来，平衡非处理因素对试验结果的影响，有效控制各种混杂因素。均衡性也是研究设计中的一项基本要求，在有些论著中把它独立于对照，作为一项医学研究设计的基本原则。通过对实验组和对照组的研究效应进行比较，反映研究因素真实的效应和效果。在医学科研中，尤其是对一些效应随季节变化（如慢性支气管炎的发病或疗效）、自限性疾病（如甲型病毒性肝炎、流行性感冒等）、或以主观感觉或心理效应作为主要观察指标的研究时，必须设立严格的对照。例如20世纪60年代出现的卤碱疗法、鸡血疗法等，都没有严格设计对照，虽轰动一时，最终却造成了许多不良影响。二、常见的对照形式(1) 空白对照即无干预措施，对照组不加任何处理措施。常用于干预试验疗效研究，以评定测量方法的准确性，观察实验是否处于正常状态，也可排除自然因素或自愈因素对试验结果的影响。如观察某种新疫苗预防某种传染病的效果，实验组儿童接种该疫苗，对照组儿童不接种任何免疫制品，最后比较两组的血清学和流行病学指标。在对感冒、皮炎等有自愈倾向的疾病进行防治效果研究时，空白对照可以很好地说明疾病的痊愈是防治的效果还是自然痊愈。空白对照的缺点是由于不给予患者任何治疗措施，在一些疾病的治疗试验中可能会违背医学伦理原则。此外，由于不能实施盲法观察，故无法排除心理因素对结果的影响。(2) 安慰剂对照对照组给予安慰剂。安慰剂是一种在外形（剂型、颜色、大小、气味、味道）与实验药物完全相同，但又不具有特异有效成分的制剂。常用乳糖、淀粉和生理盐水制成。使用安慰剂对照主要是为了避免心理因素对试验结果的影响；也可消除疾病自然进程的影响，观察到试验药物的真正作用。考虑到伦理学原则，安慰剂对照一般用于所研究的疾病尚无有效的防治药物或使用后不会影响到对照组研究对象的健康。同时，应用这一对照，要注意安慰剂效应的影响。(3) 实验对照为了有效地控制影响试验结果的非研究因素，仅采用空白对照是不够的，此时可以使用实验对照，即对照组的操作条件与实验组一致。例如青霉素过敏试验，以青霉素溶媒为实验对照，可排除由溶媒引起的过敏反应。再如观察某中药预防学生流感的效果，试验组服用该中药，同时每天进行教室的消毒、换气；对照组不服用该中药，但和试验组一样每天进行教室的消毒、换气。(4) 标准对照在临床试验中，考虑到要保护对照组人群的健康不受损害，有时不宜设立安慰剂对照或空白对照。这种情况下，可以采用目前公认有效的药物或治疗方法作为对照组的措施，即标准对照。采用标准对照，一方面可以起到比较的作用，即消除非研究因素对研究效应的影响。另一方面，也能保护对照组人群的健康，不违背医学伦理学原则。(5) 自身对照自身对照是指对照和实验在同一研究对象中进行。研究对象在前、后两个阶段，分别使用两种不同的干预措施，比较干预的效果，或者某种方法治疗前、后的比较。自身前后对照设计简单，但其运用前提是如果不给这些研究对象如病人以有效的治疗药物，其效应指标如病情将保持稳定不变。对于自限性疾病如流行性感冒、甲型病毒性肝炎等，不宜设置自身对照。自身对照还有一种形式是同一个人不同部位、器官的比较，如左、右眼睛，左手与右手。(6) 历史对照用过去研究的结果作为对照称为历史对照。历史对照不是同期对照，由于时间不同，试验条件不同，往往缺乏可比性，一般不建议使用。此外，还有交叉对照、潜在对照等，在此不一一赘述。第三节盲法原则在科研设计中，研究对象和研究者的主观因素往往会影响到研究信息的真实性，产生信息偏倚。这种偏倚可产生于设计到结果分析的任一环节。如在临床试验设计中，患者的心理因素和医务工作者的主观判断都可能干扰试验结果，产生偏倚。采用盲法试验可避免这种偏倚。所谓盲法，是指参加试验的研究者或受试者一方或/和双方都不知道试验对象被分配在哪一组，接受的是试验措施还是对照措施。盲法可以有效避免受试者或试验者的偏倚和主观偏见。根据盲法设置程度不同，一般可以分为公开试验、单盲、双盲和三盲试验。一、公开试验公开试验与盲法相对应，试验在公开状况下进行。研究对象和研究者均知道每个研究对象的分组情况。有些实验无法采用盲法观察，如评价某疾病手术、饮食和其它公共卫生措施的效果。公开试验适用于有客观观察指标的试验，例如以客观的疾病或健康指标为评价效果的观察或改变生活习惯的干预措施等。二、单盲法研究中只对研究对象设盲。如在新药试验中，患者不知道自己的分组情况和具体的用药情况，而参加试验的医护人员知道。该设计方法简单，易操作，可以消除受试者的心理因素影响，同时研究者可以较好地观察研究对象接受不同处理措施后的效果，及时处理治疗中可能发生的问题，保障研究对象安全。缺点是在获得和分析各种研究资料如结局的判断时，可能受到研究者的主观因素影响而产生偏倚。如，因为了解了研究对象的分组情况，医务人员在判断疗效时对治疗组和对照组病人采用不同的标准，或因为对照组没有得到治疗而有意无意地给对照组补偿性治疗等。实施单盲时，对照组需使用安慰剂。当安慰剂不利于患者病情时，可使用标准药物。三、双盲法研究设计者安排和控制整个试验，研究对象和给予干预或结局评估的研究人员均不了解试验分组情况。双盲观察可以避免研究者和研究对象的主观因素影响带来的偏倚，提高研究的真实性。如在临床试验中患者和执行医疗措施的医务人员均不知道患者接受何种治疗，可使医生在检查、询问患者时一视同仁，不带主观偏见。该法的缺点是操作难度大，出现意外很难及时处理，因此不适用于治疗过程中疗效变化大的试验和危重病人的治疗。双盲设计要求有一整套完善的代号，如全部受试者、相关记录、使用的药物或安慰剂以及化验单都要使用代码。保密是双盲设计的关键，试验结束前盲底泄露或退出试验的研究对象超过20%，则双盲试验失败。另外应预先制定一些观察指标，以明确停药或更换药物的指征。在盲法实施过程中要注意避免出现违背医德的现象。当研究对象出现严重的副反应、治疗无效或病情加重时，应中止盲法，给予相应的处理。四、三盲法研究对象、给予干预或结局评估的研究人员以及负责资料收集和分析的人员均不了解试验分组情况。该方法可避免资料分析人员带来的偏倚，设计更为合理，但方法复杂，实际操作困难。总的来说，盲法观察适用于疗效评价依赖于患者或医生的药物试验，可根据研究情况具体选择方法。例如，主要根据患者的主诉来决定药效的试验可用单盲法；主要由医生主观判断决定药效的试验须用双盲法。当然，并不是所有的临床研究都需要或能够采用盲法设计。例如比较手术疗法与放射疗法治疗乳腺癌的效果，就不必、也无法采用盲法。在观察性研究中，盲法观察的原则要求我们在收集资料（疾病的结局或暴露史）时，对每个研究对象（病例或对照，暴露组或非暴露组）采用同样的方法收集资料、给予同等程度的重视；或者在资料收集时，调查员不知道所调查对象的分组情况，以客观收集资料。第四节重复原则重复是指在相同条件下进行多次观察或多次研究以提高科研的科学性和可靠性。广义的重复包括样本数量的重复、观察次数的重复和研究结果的重复。狭义的重复即样本数量的重复。观察次数重复指的是对同一试验对象进行多次观察或测量，以提高观测结果的精确性。一般要求对某项指标至少观测三次。研究结果的重复即重复实验以验证相同条件下结果的重现性，保证结果的可靠性。无法重现的研究是没有科学意义的。样本数量的重复就是对多个试验对象进行观察，防止把偶然现象当成必然现象，把个别情况当成普遍情况，甚至错误地推广到总体。在本节中讨论的重复主要指样本含量。重复的意义在于控制抽样误差，保证结果的可靠性。通过试验对象内部的重复，可以总结总体内部的变异规律，估计抽样误差的大小。根据统计学的原理，样本的抽样误差，即标准误可以通过下列公式计算：计量资料：（3-13）计数资料：（3-14）从以上两式可以看出，抽样误差与样本含量开平方根成反比。样本量越大，抽样误差越小。样本含量越小，抽样误差就越大。因此，为了能够精确估计总体的参数，需要有足够的样本含量。另一方面，对于两组或多组的比较，样本含量与第二类错误（）发生的概率有关。样本含量太少，导致检验的效能（1）降低，而使两组之间差别的检出能力比较低，可能出现假阴性的错误。因此，一般要求检验效能应在0.75以上。一、样本含量估计重复设计的前提是有适量的样本。确定样本含量的原则是：在保证研究结论具有一定可靠性（精度和检验效能）的前提下，确定最小的样本例数。样本过小，检验效能较低，易致假阴性错误，导致研究无法做出明确的结论。但是，并不是说样本含量越大越好。样本太大，将加大试验规模，延长试验时间，造成人力、物力和财力的浪费；另一方面，也难以严格控制试验条件，增大系统误差，无法保证研究质量。因此，适当的估计样本含量非常重要。影响样本含量的因素：（1）容许误差：即在进行参数检验时希望发现的两个总体参数之间的最小差异。当容许误差为时，在检验水准得出有差别结论的把握度为1。越大，所需样本量越小。（2）检验水准：即第一类错误的概率。越小，所需样本量越多。一般取0.05。（3）检验效能1：即检验把握度。越小，则检验效能越高，所需样本量越多。一般要求1-大于0.75。（4）总体标准差或总体概率：反映定量资料的变异度。越小，所需样本量越小。总体概率越接近0.5，则所需样本量越少。无法得到总体参数时，可用样本统计量代替。也可以根据同类研究结果、文献资料或预实验获得。（5）单、双侧检验：根据专业知识，确定采用单侧还是双侧检验。（6）研究效应：研究因素的生物学效应，如OR值、RR值或干预措施实施前后效应的差值。研究因素的效应越大，所需的样本含量越小。样本估计的方法主要有经验法、查表法和计算法。(1) 经验法动物实验一般每组530只动物，小动物（如小鼠）可适当多些，大动物可少些。临床试验可根据干预措施效果来决定：如果一种治疗可降低5的死亡率，则需要上万人的研究；如果治疗效果远大于5，则几百人的研究就可以了；如果某种病的病死率为100%，那么治愈一个病例就足以说明治疗效果。通常来说，一般疾病每组需50200个病例，危重病可少些。社区试验所需例数较多，一般每组需在100例以上。(2) 公式计算法根据研究设计的方法和一些已知的条件，可以根据公式来估计样本含量。下面是几种常见的医学研究设计的样本含量估计1. 抽样调查的样本估计（1）均数调查的样本含量估计公式：（3-15）（3-16）（2）率调查的样本含量：（3-17）当0.05，Z1.962，d=0.1P，则可以简化为下式（3-18）上述公式（3-17）、（3-18）适用于符合二项分布的率的抽样调查。对于发病率或患病率很低的疾病如肿瘤，应采用泊松分布法估计样本含量。2. 样本均数与已知总体均数比较的样本含量估计：（3-19）式3-19中n为所需样本含量；为总体标准差，当未知时，用样本标准差s代替；为容许差值；u和u分别为与检验水准和第二类错误概率相对应的Z值，有单、双侧之分，只取单侧。例3-3：用某药治疗矽肺患者，估计可增加尿矽排出量，其标准差为25mg/L，若要求以0.05，10.9的概率，能辨别出尿矽排出量平均增加10mg/L，则需要多少例矽肺病人做试验？已知10，s25，单侧0.05，Z0.051.645（此处用单侧）；0.1，Z0.011.282。代入公式（3-19）得故需治疗54例矽肺病人。（3-20）3. 两样本均数比较的样本含量估计：式中n1、n2分别为两样本所需含量；为两总体均数之差；为总体标准差；Z和Z意义同上。例3-4：甲、乙两种药物都有降压作用，比较分别服用两种药物患者的平均血压降低。假设两药效果的标准差相等。试问在0.05，0.1时，若能分辨出两者降低的差别是其标准差的60%，则需要多少试验对象？已知/0.6；双侧0.05，Z0.051.96；0.1，Z0.011.282。代入公式得故每组需试验对象59人。4. 样本率与总体率比较的样本含量估计：（3-21）此公式适用于大样本。0式中为已知总体率，1为预期试验结果的总体率，10；u和u意义同上。例3-5：拟试验一种新药，预计治疗某病的有效率是90，已知常规药物有效率是80，若要发现这两种药物的有效率有10的差别（假定0.05，0.1），则需要观察多少病例？已知00.8，10.9，0.90.80.1，单侧0.05，U0.051.645；0.1，U0.11.282。代入公式3-21得：故至少需要观察138例5. 两独立样本率比较的样本含量估计（3-22）或（3-23）式中n为两样本所需含量；p1、p2分别为两总体率的估计值；p为两样本合并率，当两样本例数相等时，p=（p1+p2）/2。z和z分别为与检验水准和第二类错误概率相对应的u值，有单、双侧之分，只取单侧。角度单位为度。例3-6：观察A、B两种治疗方法对某病的疗效。A方法有效率为60%，B方法为85%。现欲做进一步的治疗试验，设0.05，0.10，则每组需要观察多少病例？本例采用双侧检验。已知p10.60，p20.85，z0.05/21.96，z0.011.282。代入式3-22得：故每组需要病例64例，两组共计128例。6. 病例对照研究中的样本含量估计（1）成组设计的病例对照研究样本含量估计（3-24）za和zb分别是a和b值对应的标准正态分布分位数，p0和p1分别是所研究因素在对照组和病例组的估计暴露率。在发病率比较低的时候，p0可以用人群的暴露率来近似代替。q0=1-p0，q1=1-p1；（3-25）p=(p0+p1)/2，q=1-p；（3-26）病例组p1也可以根据p0和估计的比值比推算（3-27）例3-7：用成组病例对照研究设计方法研究小儿先天性心脏病与母亲孕期口服避孕药(OC)关系。假定育龄妇女中应用OC者占30，孕期服用OC与小儿先天性心脏病的OR=2.5，a=0.05，b=0.10，试估计研究所需的样本量。查表za=1.96（双侧），zb=1.28（单侧），q0=1-0.3=0.7；p1=(2.50.3)/(1-0.3+2.50.3)=0.52；q1=1-0.52=0.48；在此条件下研究，病例组和对照组分别需要103人。（2）1:1配对病例对照研究的样本含量（3-28）（3-29）其中m为病例和对照暴露状况不一致的对子数。（3-30）（3-31）式中M为研究需要的总对子数，Pe为病例组和对照组暴露情况不一致的对子数出现的频率；P0和P1分别是人群中估计的暴露率和病例组估计的暴露率。例3-8：欲用1:1匹配病例对照研究方法调查某地45岁以上人群高血压与脑卒中的关系。设=0.05，=0.10，据资料报道，该地45岁以上人群高血压患病率为20%，OR为2.5。试计算所需的样本含量M。已知，OR=2.5，则病例和对照暴露状况不一致的对子数为：已知人群高血压患病率P0=20% 需要的总对子数为：（3）1：R 配比的病例对照研究的样本含量（3-32）（3-33）（3-34）二、检验效能分析在流行病学研究中，除了控制各种混杂偏倚之外，还需要考虑可能出现的假阳性和假阴性错误。统计学的结果都是概率性的，对于任何一次假设检验，不论其结论是拒绝H0，还是接受H0，有可能犯错误第一类错误（a）和第二类错误（），见图3-6。统计学的结果与真实值之间有下列四种情况，见表3-4。图3-6 第一类错误（a）和第二类错误（）示意图表3-4 真实值与统计学结果的关系出现不一致的结果有两种：（1）真实情况无差别，而统计结果有差别，即假阳性错误；（2）真实情况有差别，而统计结果无差别，即假阴性错误；当统计学检验结果P，即在水平下，不拒绝H0，未发现比较的两组间的差别无统计学意义。出现“阴性”结果有两种可能：（1）所比较的组间总体参数无差别。（2）所比较组间总体参数有差别，但由于样本含量不足、第二类错误太高，而导致检验效能（1-）低，这种差别还未被发现。第二类错误是指接受了实际不成立的H0。通常把l-称为检验效能(也称把握度)，它是指当两个总体确有差别时，按规定的检验水准能够得出差别有统计学意义的能力。如l-=0.80，则意味着当H0不成立时，理论上在每100次抽样检验中，按照的检验水准平均有80次能够得出差别有统计学意义的结论。所建立的假设检验主要是控制犯第一类错误的概率，即在H0为真时，拒绝H0的概率不超过给定的显著性水平，而对其犯第二类错误的概率却无法控制。值的大小一般很难确切估计，只有与特定的假设检验结合起来才有意义。即一般的假设检验我们不知道犯第二类错误的概率，所以不能盲目接受H0，应同时考虑检验效能的大小。如检验效能足够的条件下，我们才能对P的统计学检验结果可以明确做出阴性的结论。一般研究所需的检验效能在0.75以上。检验效能的计算可以根据样本含量和给定的其它条件，从相应的显著性检验的公式倒推，计算Z值，查正态分布表，得值。然后求相应的检验效能（1-）。1. 单组样本均数与总体均数比较的值估计（3-35）上式3-35中n为样本含量；为总体标准差，当未知时，用样本标准差s代替。为容许差值，为显著性水平。2. 两组样本均数比较的值估计（3-36）上式3-36中n1和n2分别为两组的样本含量，为两样本均数的差值。3. 两组样本率比较的值估计（1）当两组样本量相等，均为n时，（3-37）上式3-37中p1和p2分别为两组的样本率，为两样本率的差值。如在病例对照或队列研究中，已知RR或OR值，用下式计算（3-38）例3-8：假如研究使用口服避孕药（OC）与婴儿先天性心脏病的关系。已知未使用OC的妇女先天性心脏病的发病率为P0=0.008，RR=3，显著性水平=0.05。研究的样本数暴露组和非暴露组均为2500人，该研究的检验效能为：本例中，Z=1.65，则=0.05，检验效能=1-=0.95（2）当已知两组的暴露率或发病率，两组样本量不等时，用下式计算：（3-39）例3-9：某一研究探讨粉尘与支气管炎的关系。已知一般人群支气管炎的患病率为15%，吸入粉尘后的患病率为25%，显著性水平=0.05，暴露组为150例，对照组139例，试估计该研究的功效：已知，p1=0.25，p0=0.15， z=1.645（单侧）代入式3-39得：Z=-0.4778时，=0.6844，检验效能=1-=0.31564. 11匹配病例对照研究值估计（3-40）例3-10：暴露于危险因素的比例为0.30，显著性水平双侧=0.05，当按1：1配比设计，对子数为100对时，能发现预期OR值为2的检验效能是多少？此例中p0=0.30，RR=2，=0.05，n=100p1由公式3-29计算代入上式0.3917查正态分布表，当z=0.39时，=0.3483，检验效能=1-=0.6517图3-7 DSS方法计算样本含量和检验效能也有一些统计软件可以计算样本含量和检验效能，如Epi Infor、PASS ( Power Analysis And Sample Size)。一些在线的统计软件也可方便计算这两个参数，如DSS research ( toolkit/spcalc/ power_p2.asp)可以根据一些已知条件对常见的统计学检验的样本含量和统计学检验效能进行计算，见图3-7。采用病例对照等研究方法分析单核苷酸多态等基因型与疾病的相关性的样本含量和检验效能的估计，可以用QUANTO、Genetic Power Calculator (http:/pngu.mgh.harvard.edu/ purcell/gpc/) 等专用软件。小结随机化、对照、盲法和重复是医学科研设计中的基本原则，是保证研究结果真实可靠的基本条件。随机化抽样可以得到一个有代表性的样本，而随机化分组可以使比较的组间，除了研究因素之外，其它非研究因素和影响结果的其它因素的分布保持一致，即有可比性。设立对照可以排除非研究因素对实验结果的影响。而盲法观察可以排除由于研究对象或/和研究者各种因素对实验结果造成的影响，包括观察性偏倚。重复的原则，研究研究结果能有重复性；在一项研究中，要求要有足够的样本含量。（朱益民）K=N/n 图3-1 系统抽样示意图层内随机抽样按某因素分层目标人群第一层第二层第三层样本1样本2样本3样本图3-2 分层抽样示意图图3-3 多级抽样示意图第一层研究对象第二层第三层实验组E1对照组C1实验组E2对照组C2实验组E3对照组C3实验组图3-4 分层随机化分组示意图对照组图3-5 整群随机化分组示意图图3-6 第一类错误（a）和第二类错误（）示意图图3-7 DSS方法计算样本含量和检验效能表3-1 随机数字表表3-2 完全随机化分组方法编号123456789101112随机数585988975414101256859926除以3后的余数121102102102分组结果CACCBACBACBA表3-3 随机区组分组方法步骤区组1区组2区组3区组4按性别相同、体重高低排序123456789101112分配随机数字3157245568877474476721每个区组内按随机数字大小分组乙甲丙乙丙甲甲丙乙乙甲丙表3-4 真实值与统计学结果的关系统计学检验结果真实结果有差别无差别差异有显著性（Pa）正确第一类错误（a）差异无显著性（Pa）第二类错误（）正确

展开阅读全文

医学科研设计的基本原则

最新文档