资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,遗传图绘制和物理图绘制,赵利峰,2011-9-2,1,第二章 遗传图绘制,2,内容回顾:,基因组(Genome):,一个生物体、细胞器或病毒的整套基因和染色体组成,即全部基因的总称(包括所有的编码区和非编码区)。,基因组学(Genomics):,以基因组分析为手段,对所有基因进行基因组作图、核苷酸序列分析、基因定位、时序表达模式和基因功能分析的一门科学。,3,1975年F. Sanger、A. Maxam和W. Gilbert发明了DNA快速测序技术。,4,DNA 测序每次只能测不到1000个,碱基,人的基因组是多少个碱基?这就决定了DNA测序的基本步骤:,1. 将DNA拆分成许多个1000个碱基以下的小,片段。,2. 将这些小片段分别测序。,3. 将这些小片段测序的结果汇总,按它们原本的序列排列组装。,哪么测序后我们怎么知道每个小片段在基因组序列中正确的位置呢?答案是:基因组做图。,5,6,鸟枪法和重叠群法,7,什么是鸟枪法,全基因组随机测序战略主要采用,鸟枪法(shotgun),。鸟枪法,也俗称“霰弹法”,是随机先将整个基因组打碎成小片段进行测序,最终利用计算机根据序列之间的重叠关系进行排序和组装,并确定它们在基因组中的正确位置。,优点:,速度快,简单易行,成本较低,可以在较短的时间内通过集中机器和人力的方法获得大量的基因片断。,缺点:,用它来测序时,最终排序结果的拼接组装比较困难,尤其在部分重复序列较高的地方难度较大。此外有许多序列片段难以定位在确切的染色体上,成为游离片断;同时又会有许多地方由于没有足够的覆盖率而形成,空缺,。这些缺陷最终导致整个基因图会留下大量的空洞,影响其准确度。,8,重叠群法,以大片段定位的克隆为基础的定向测序战略主要采用,克隆步移法或称重叠群法,(Contig),:,先构建遗传图,再利用几套高度覆盖的大片段基因组文库(BAC、PAC等)获得精细的物理图,选择合适的BAC或PAC克隆测序,利用计算机拼装。BAC内的空洞基本上都可以利用设计引物等手段填补,形成一条完整的BAC序列。然后由相互关联、部分重叠的BAC克隆连成一个大的重叠群。理想状况下,整条染色体就是由一个完整的重叠群构成。,9,10,基因组测序的不同策略,基因组图的绘制可为基因组的全面测序提供工作框架。由于一些分子标记同基因座位紧密连锁,为靶基因的定位克隆提供了可能。根据靶基因所在基因组图中的位置,可以尽快获知重要基因的顺序。,正是基于这些理由,人类基因组计划最初6年的工作重心主要放在人类基因组图的绘制上。,根据采取的方法不同,基因组作图分为两个主要范畴:遗传作图和物理作图。,11,第一节 遗传图与物理图,遗传作图(genetic mapping):采用遗传学分析方法(杂交实验和家系分析),将基因或其他DNA顺序标定在染色体上,构建连锁图。遗传图距单位为厘摩(cM),每单位厘摩定义为1%交换率。,物理作图( phisical mapping ):采用分子生物学技术,直接将DNA分子标记、基因或克隆标定在基因组,实际位置。,限制性片段作图与克隆作图的图距单位为碱基对。,基因组图将遗传图与物理图通过共同的作图标记相互校正,获得的基因连锁图称为基因组图。,12,第二节 遗传作图标记,1.,基因标记,表型(phenotype) :,一个遗传性状必须以两种替换形式或表型存在才能用于遗传学分析。,等位基因(allele):,每种表型是由不同的等位基因控制。,肉眼分辨的表型:,颜色、形状等。如用于果蝇遗传图的构建。,生化表型:,微生物遗传学研究。,13,人类的生化性状,ABO血型,HLA(人类白细胞抗原),复等位基因(multiple alleles),人类白细胞抗原(HLA)是最复杂最具多态,性的体系,位于6号染色体。,HLA-DRBI(human leukocyte antigens-DRBI)基因位点至少有59个等位基因。,HLA-B抗原编码位点有60多个等位基因。,14,ABO 血型基因座上具有编码不同半乳糖转移酶复等位基因,其特异性决定了血型的差别。,15,2. DNA(分子)标记,基因标记:有用、有效,并非理想。,高等生物,可用作标记的基因十分有限。,许多性状都涉及多基因。,高等生物基因组中存在大量的基因间隔区,用基因标记将在遗传图中留下大片的,无标记,区段。,并非所有等位基因可以通过常规实验予以区分。,因而,用基因标记作的遗传图不完整,必须寻找其他更有效的标记。,16,限制性片段长度多态性,(restriction fragment length polymorphisms,RFLP),简单序列长度多态性,(simple sequenece length polymorphisrns,SSLPs),小卫星序列,:(Minisatellite DNA),微卫星序列,:(Microsatellite DNA),单核苷酸多态性标记,(single nucleotide polymorphisms,SNP),17,3. 遗传标记的发展,第一代标记,经典的遗传标记(蛋白质和免疫学的标记),70年代中后期,限制酶片段长度多态性(RFLP),第二代标记,85年,“小卫星序列(minisatellite),89年,“微卫星序列(microsatellite),第三代标记,单核苷酸多态性标记(single nucleotide,polymorphism,SNP),18,(1)遗传标记中的第一代标记,经典的遗传标记(蛋白质和免疫学的标记),ABO血型位点标记,HLA位点标记,存在问题:,已知多态的蛋白质很少。,等位基因的数目有限。,无法获得足够的信息量。,检测技术的繁琐等。,限制了人类基因组的遗传分析工作。,促使人们直接在DNA上寻找新的遗传标记。,19,70年代发展的DNA重组技术、DNA克隆技术和DNA探针技术。,为拓展遗传图谱的构建途径创造了技术条件。,使人类基因定位的方法从,细胞及染色体,水平过渡到,分子水平。,DNA水平的多态性标记位点作为绘制遗传图谱的主要界标,提高图谱的精确度、准确性。遗传图谱的绘制进入了一个崭新的时代。,现代遗传图谱的概念,1980首先提出,在此基础上,限制性片段长度多态性(RFLP)作为遗传图谱的第一代崭新标记得以问世。,限制性位点,能够用作基因标记。广泛应用到基因组研究中。基因或基因组可以用,重叠的限制性片段,来作图。最终扩展到整个序列,构建连锁图谱。,20,同源染色体同一区段DNA 序列的差异。,限制酶识别的碱基顺序有专一性。,限制性片段长度多态性,21,(2)遗传标记中的第二代标记,简单序列长度多态性 SSLPs,简单串连重复(short tandem repeat,STR),最重要的优点是高度多态性,提供的信息量相对很大;另外可用PCR技术使操作实现自动化,是遗传图与物理图研究中非常有用的工具。,20世纪80年代后期,人们开始应用微卫星序列绘制图谱。1994年底,美、法完成了以RFLP及微卫星为标志的遗传图谱。图谱包含了5826位点,覆盖4000cM,分辨率高达0.7cM。1996年法国报道了完全以微卫星DNA标志构建的遗传连锁图,包含2335位点,分辩率为1.6cM。,22,简单序列长度多态性(SSLP),23,(3)遗传标记中的第三代标记,单核苷酸多态性标记(single nucleotide,polymorphisms,SNPs),点突变,位于密码子的摇摆位置,表现为沉默突变而被大量保留下来。大多数不能被限制酶识别,必须采取测序或寡聚核苷酸杂交检测。,点突变在人类基因组中可达到300万个,平均每1000个碱基对就有一个。,SNP,数目多,覆盖密度大,它的开发和应用摒弃了遗传标记分析技术的“瓶颈”凝胶电泳,为DNA芯片技术应用于遗传作图提供了基础。,24,单核苷酸多态性(SNP),25,第三节 遗传作图的方法,遗传作图的基础:连锁分析。,在同一条染色体上的基因间表现出,遗传连锁(Genetic linkage),,因为它们都是在同一条长的DNA分子上。,部分连锁与重组:,比利时细胞学家Janssens发现减数分裂时同源染色体的交换。,2 个彼此靠近的基因之间因交换而分离的频率,要比相互远离的2个基因之间发生分离的频率要小。,重组率则可成为测量基因之间相对距离的尺度,只要获得不同基因之间的重组率,就可绘制一份基因位于染色体上相对位置的地理图。,26,由重组率绘制遗传图,27,1. 部分连锁与遗传作图,构建遗传图谱的基本原理,真核生物遗传过程中会发生减数分裂,此过程中染色体要进行重组和交换,这种重组和交换的概率会随着染色体上任意两点间相对距离的远近而发生相应的变化。根据概率大小,人们就可以推断出同一条染色体上两点间的相对距离和位置关系。正因为如此,我们得到的这张图谱也就只能显示标记之间的相对距离。我们称这一距离(概率)为遗传距离(cM),由此构建的图谱也称为遗传图谱。,28,连锁遗传图的做法,一般以最左端的基因位置为0,如发现有新的基因在更左端的位置时,把0点让给新基因,其余的基因座位作相应移动。,重组率在0-50%之间,但图谱上出现50以上的图距。这是由于较远的两基因之间发生偶数次交换,但没有出现重组类型,所以交换值要大于重组率。绘制连锁遗传图时,需根据重组率进行图距的校正。,29,遗传图的偏离,遗传图偏离的原因:,重组热点:染色体某些位点之间比其他位点,之间有更高的交换频率。,同一染色单体发生多次交换,会产生距离减,少的假像。,30,2. 不同模式生物的连锁分析,有性杂交实验,系谱分析,DNA转移,31,杂交实验的连锁分析:,选择已知基因型的亲本,设计杂交方案,获得交配的子代并分析其表型和基因型。,对于高等真核生物的常规连锁分析并不是直接检查配子,而是检测分别来自两个亲本配子融合形成的二倍体基因型,即进行遗传杂交。,两点杂交和多点杂交 也称两因子杂交、多因子杂交。,32,系谱分析,系谱分析法即对某家庭性状相关成员进行统计,分析性状之间的连锁关系,通过重组率进行相关基因定位,这种方法又称,家系分析法 (pedigree method) 。,不能进行有计划的遗传实验,只能收集家系成员的相关资料进行连锁分析,主要涉及人类和多年生树木。,优势对数值(lod score)分析:,lod值是基因连锁可能性的对数,用于判定所研究的两个标记是否在同一染色体上,换句话说就是基因是否连锁。如果优势对数分析确定了连锁,然后可以提供最可能的重组频率程度。理想的情况是资料来自不同系谱。,33,细菌的遗传作图,转化( transformation ):,供体细胞释放的一段DNA(通常小于50kb),经受体细胞摄取后整合到基因组中,可借助抗性培养基筛选重组克隆。,转导(transduction):,通过噬菌体将小片段DNA从供体细胞转移到受体细胞。,接合转移(conjugation):,两个细菌形成物理接触,DNA从供体转移到受体。,34,细菌的遗传重组,35,细菌遗传作图中采用的都是,生化标记,(如合成色氨酸的能力、对抗生素的敏感性等),隐性表型(如不能合成色氨酸)是可以互补的性状。,基因转移在具有,野生,型等位基因的,供体,品系与具有,隐性,等位基因的,受体,品系之间进行,根据受体细胞是否获得基因指令的生化功能来监测转移的DNA是否进入受体细胞。,接合:根据野生型基因进入受体的时间表,可以确定基因所在的位置。,转导及转化:依据所研究的基因是否同时出现在受体细胞中,紧密连锁的基因总是有最高的机率被同时转移。,36,RFLP连锁图,限制性片段多态性(RFLP),是第一种用于研究的DNA标记(David Bostein,1980)。,基本设想:,由于同源染色体同一区段DNA顺序的差异,用限制酶消化时,会得到长度各不相同的限制性片段。经过琼脂糖凝胶电泳分离,可直接显示不同个体同一位点DNA组成的差异。,由于限制酶的专一性,用不同的限制酶处理同一DNA样品时,可以产生与之对应的不同限制性片断,从而提供大量位点多态性信息。,37,DNA,限制酶分析,38,亲本:A1/B1和A2/B2,个体231;新组合:A1/B2和A2/B1,个体39。,交换率:39/(231+39)=14%;A与B相距14cM。,39,RFLP连锁图,左图表示三个世代限制图谱之间的血缘关系,其,限制片段长度多态性(RFLP),可以按孟德尔方式遗传,四种等位基因在每代中独立地分离,但图中经限制酶消化后所有等位基因之间的组合在凝胶电泳中都存在。,40,基因与分子标记的共分离,共分离,:,如果限制酶多态性在基因组中自由发生,则有些会在特定基因附近产生。我们可以确定这样的限制性标记,因为该标记与突变表型密切相关。如果比较患病者的和正常人的DNA限制图谱,可能发现一个特定的限制性位点通常出现(或者丢失)在患者DNA中,原因是限制性标记与表型间100%相关。它暗示,限制性标记与突变基因距离很紧,以至于它们在重组中不能分离,。,41,简单序列长度多态性,小卫星DNA,的核心序列一般为几个到几十个核苷酸,不同个体的不同基因座位重复次数不同,每个重复单位的组成可略有变异。这类重复单位数目分布有限,有些染色体上还未发现这类 小卫星DNA。它的位置一般在染色体端粒部位。已证明,这一序列广泛存在于人体基因组中。,42,43,SNP作图的一般步骤包括:, 获取DNA序列。, 从DNA序列确定序列标签位点(sequence tagged sites,STSs)。, 扫描STSs或ESTs确定候选SNPs 。, 确定SNPs 。, 将SNPs定位于染色体特定位置。,44,第四节 人类遗传图,人类基因组计划的最初目标-完成一份遗传图,其密度至少为每1000kb 一个标记。,1994年完成,密度达到600kb一个标记。,含有5264个微卫星序列。,不久,另一份物理图也随之问世,其密度为每100kb一个标记。,含有7000个微卫星序列。,45,第三章 物理图绘制,46,遗传图的局限性:,遗传图的分辨率有限。大基因组的人类及多数高等真核生物不能获得大量的子代;,遗传图的覆盖面较低;,遗传图的精确性低;,遗传图分子标记的排列有时会出差错。,47,限制性作图,基于克隆的基因组作图,荧光原位杂交(FISH),序列标记位点(STS),物理作图常用的方法:,48,3.1 限制性作图,比较不同限制酶产生的DNA片段的大小,单酶切、双酶切、对比组装。,部分酶切:多个相同酶切位点区段只发生一次酶切。,末端同位素标记(或其他标记)结合部分酶切:形成梯形分布带。,49,样品中仅存在较少的限制性位点/小分子量DNA分子,用常规的限制酶即可绘制物理图。,稀有切点限制酶,50,稀有切点限制酶,特殊的凝胶电泳技术:脉冲凝胶电泳PFGE(电场方向不断变换),51,52,3.2 基于克隆的基因组作图,克隆载体:,质粒、噬菌体、粘粒,啤酒酵母基因组,主要是先构建粘粒文库,然后建立克隆重叠群完成测序。,高等生物基因组,拟南芥1.2X10,5,bp,需要25000个克隆。,人类基因组是拟南芥基因组的33倍。,53,酵母人工染色体YAC:重组YAC分子只能在酵母细胞中扩增。YAC载体由三部分构成:,着丝粒:在细胞分裂时负责染色体均等分配。,端粒:位于染色体端部的特异序列,保持人工染色体的稳定性。,自主复制起始点:在细胞中启动染色体的复制。,缺陷:插入子稳定性问题、同一酵母细胞多个YAC引起交换产生嵌合。,3.2.1 大分子DNA的克隆载体,54,酵母人工染色体(YAC)操作,55,噬菌体P1载体:与载体相似,将天然噬菌体基因组中的一段区域缺失,容量达125kb。,细菌人工染色体BAC:由大肠杆菌中F质粒衍生,容量达300kb,单拷贝复制,稳定,不会因重组发生嵌合。,P1人工染色体PAC:结合P1载体和BAC载体的优点。,56,BAC 载体物理图,57,PAC 载体物理图,58,载体的种类和特征,质粒*,受体细胞,结构,插入片断,举例,E.coli,环状, 8*,p,UC18/19 , T-载体pGEM- 3z等,噬菌体,E.coli,线状,9 - 24kb,EMBL系列,, gt系列,丝状噬菌体及噬菌粒,E.coli,环状, 10 kb,M13mp系列,粘粒载体,E.coli,环状,35- 45kb,pJB8,c2RB, pcoslEMBL, pWE15/16, pCV,BAC (Bacterial Artificial Chro,mosome),E.coli,环状,300 kb,Pel oBAC系列,PAC (P1-derived Artificial chromosome),E.coli,环状,100 - 2000 kb,PCYPAC1,YAC (Yeast Artificial chromosome ),酵母细胞,线性染色体,100 - 2000 kb,MAC (Mammalian Artificial Chromosome),哺乳类细胞,线性染色体, 1000 kb,病毒载体,动物细胞,环状,SV40 载体,昆虫,杆状病毒载体,穿梭载体,动物细胞,和细菌,环状,pSVK3质粒,PBV,Ti质粒,59,3.2.2 重叠群组建,重叠群contig:相互间存在重叠顺序的一组克隆。,最早组建重叠群方法,染色体步移,:从基因组文库中挑取一个指定的或随机的克隆,然后在文库中寻找与之重叠的第二个克隆。在此基础上再寻找第三个克隆,依次延伸。,染色体步移的速度缓慢,仅适合于小基因组及小区段染色体的物理图绘制。,60,染色体步移,61,指纹作图,指纹fingerprinting:DNA样品所具有的特定,DNA片段,组成,限定的,序列特征,。指纹重叠,表明2个克隆具有共同的区段。,限制性带型指纹,:用不同限制性酶处理样品,凝胶分析,DNA条带有部分相同,说明它们含有重叠的序列。,重复序列DNA指纹,:不同克隆酶解电泳,转移到杂交膜中,用一种或几种基因组范围的重复序列作为,探针杂交,,出现相同的杂交带型,说明克隆重叠。,重复序列DNA PCR:设计与重复序列互补的引物,对检测的克隆进行PCR扩增,相同的产物,说明克隆重叠。,STS作图指纹,:STS是已知的单一序列。设计引物,对大量的单个克隆进行PCR扩增。,62,3种克隆指纹分析方法,63,3.3 染色体细胞图,荧光标记原位杂交(FISH):与同位素杂交的原理相同,DNA荧光染料。荧光标记信号在显微镜下观测,直接显示探针与染色体杂交的位置。,杂交技术的一种延伸,杂交靶子是完整的染色体,由杂交信号提供作图信息。将样品涂抹在载玻片上自然干燥,然后用甲酰胺处理使其变性。,中期染色体:主要用于确定新发现的分子标记属于哪条染色体,给出十分粗略的染色体定位。,机械伸展的染色体:分离与制备中期细胞核,离心,获得伸展的染色体,长度增加20倍。,间期染色体:已获得基本的位置信息,极度松驰的染色体可用于小区段分子标记排序研究。,64,3.4 辐射杂种作图,主流技术的缺点,限制性作图:快速,信息详细,但不适合大基因组。,重叠群构建程序复杂,费时费力。,指纹作图:对大基因组存在不少问题,如选用的限制酶不当或重复顺序干扰,会出现误排。,原位杂交:操作困难,资料积累慢,一次实验定位的分子标记不超过3-4 个。,65,STS:sequence tagged site,一小段长度100-500bp的DNA序列,每个基因组仅一份拷贝,易分辨。,利用,PCR,/杂交分析STS位置,自动操作。,表达序列标签EST:cDNA。,SSLP:具有多态性并已在连锁分析中定位。,随机基因组序列:在数据库中寻找所感兴趣的某些序列。,66,67,STS定位:定位在染色体或基因组中的DNA区段。,辐射杂种,:含有另一种生物染色体片段的啮齿类细胞。,克隆作图,:基因组测序计划的准备工作之一,将基因组或分离的染色体打断,并将这些片段克隆到高容量的载体中,构建全基因组文库。,PCR方法检测含有标记的STS克隆,根据重叠的STS标记可绘制克隆连锁图。,68,69,人类基因组图,1987年,发表了第一份人类RFLP连锁图,含有393 RFLP和10个其他多态性标记,来自21个家庭,平均密度为10Mb。,1996年,遗传图 5250个SSLP,0.7Mb。,1993年, 33000个YAC。,采取辐射杂种进行STS标记作图,对YAC物理图进行校正。,1996年STS图,含有7000个SSLP。,物理图与遗传图彼此衔接,产生一份具综合性的完全整合的基因组图,成为人类基因组计划测序阶段的工作框架,。,70,Thanks!,71,
展开阅读全文