资源描述
College of Life Science and Biotechnology,cDNA,文库构建及,EST,序列分析,陈威、丁立建、黄显军、刘振英、毛海花、上官巧灵、朱竹君,(按姓氏首字母排列,排名不分先后),组员任务分配,陈 威:统筹安排、资料收集,丁立建:,cDNA,文库应用、资料收集,黄显军:背景简介,刘振英:,cDNA,文库构建原理、资料收集,毛海花、上官巧灵、朱竹君:,EST,序列分析,目录,一、背景简介,二、,cDNA,文库构建原理,三、,cDNA,文库的应用,四、,EST,序列分析,五、参考文献,cDNA,文库构建及,EST,序列分析背景简介,黄显军,cDNA,基因文库:,某生物某一发育时期所转录的,mRNA,经反转录形成的,cDNA,片段与某种载体连接而形成的克隆的集合。,1.,cDNA,文库背景简介,1.1,cDNA,文库产生前的技术概况,随着生物及信息技术的迅速发展,寻找新基因、克隆新基因、进而研究基因的功能已成为功能基因组研究中的一项重要工作。,在过去寻找新基因的方法有:,a,)消减杂交,b,),mRNA,差异显示,c,),cDNA,的代表性差异显示分析法,d,)差异消减展示等方法,这些方法在新基因的发现方面都各有其独特的优势,可寻找出一些差异表达序列,但这些差异表达序列大部分情况都是不完整的基因。,1.2,cDNA,文库的产生,由于以前技术的缺点,目前,比较可行而且应用较多的方法主要是,cDNA,文库的筛选。,一方面,cDNA,文库只代表一定时期一定条件下正在表达的基因,是整个真核基因组中的少部分序列,因此,cDNA,克隆的复杂程度比直接从基因组克隆的要小得多。,另一方面由于每个,cDNA,克隆只代表一种,mRNA,序列,因此在基因克隆过程中出现假阳性的概率比较低。,所以,cDNA,文库的构建已成为当前分子生物学研究和基因工程操作的基础。,1.3.,为什么要构建,cDNA,文库?,cDNA,便于克隆和大量表达,它不像基因组含有内含子而难于表达,因此可以从,cDNA,文库中筛选到所需的目的基因,并直接用于该目的基因的表达。,1.4.,怎么构建,cDNA,文库?,1.5.,cDNA,文库构建后能干什么?,1),可保护濒危珍惜生物资源,2),可以提供构建分子标记连锁图谱的所用探针,3),可以用于分离全长基因进而开展基因功能研究,1.6.,cDNA,文库的优势及价值,1,)优势:,cDNA,在研究具体某类特定细胞中基因组的表达状态及表达基因的功能鉴定方面具有特殊的优势。,2,)价值:在个体发育、细胞分化、细胞周期调控、细胞衰老和死亡调控等生命现象的研究中具有更为广泛的应用价值,是研究工作中最常使用到的基因文库。,2. EST,序列分析背景简介,克隆全长,cDNA,序列的传统途径:,a),噬斑原位杂交的方法,b),采用,PCR,的方法,缺点:工作量大、耗时、耗材,这些传统方法已满足不了人类基因组时代迅猛发展的要求。,2.1. EST,序列分析的产生,随着人类基因组计划的开展,在基因结构、定位、表达和功能研究等方面都积累了大量的数据,如何充分利用这些已有的数据资源,加速人类基因克隆研究,同时避免重复工作,节省开支,已成为一个急迫而富有挑战性的课题摆在我们面前。,采用生物信息学方法延伸表达序列标签(,ESTs,)序列,获得基因部分乃至全长,cDNAycg,,将为基因克隆和表达分析提供空前的动力,并为生物信息学功能的充分发挥提供广阔的空间。,2.2. EST,技术的作用价值,EST,技术最常见的用途是基因识别,传统的全基因组测序并不是发现基因最有效率的方法,这一方法显得即昂贵又费时。因为基因组中只有,2%,的序列编码蛋白质,因此一部分科学家支持首先对基因的转录产物进行大规模测序,即从真正编码蛋白质的,mRNA,出发,构建各种,cDNA,文库,并对库中的克隆进行大规模测序。,Adams,等提出的表达序列标签的概念标志着大规模,cDNA,测序时代的到来。虽然,ESTs,序列数据对不精确,精确度最高为,97%,,但实践证明,EST,技术可大大加速新基因的发现与研究。,目录,一、背景简介,二、,cDNA,文库构建原理,三、,cDNA,文库的应用,四、,EST,序列分析,五、参考文献,cDNA,文库的构建,刘振英,为什么构建,cDNA,文库,真核生物基因结构原核生物有很大差异。,真核生物的基因不能直接在原核生物中表达,只有将加工成熟的,mRNA,经逆转录合成互补的,DNA,(,cDNA,),,并,连接相应的原核细胞表达控制元件,才能在原核生物中表达。,mRNA,的不稳定性,真核细胞的基因通常只有一小部分进行表达,由于,mRNA,的不稳定性,因而对真核基因的表达和相关的,mRNA,研究,一般都是通过对,cDNA,的研究来进行。,But,如何构建,cDNA,文库,LOGO,mRNA,的分离制备,寡聚胸苷酸,oligo(dT,),纤维素或琼脂糖亲和层析法,,,在高盐缓冲溶液中,poly(A,),RNA,与,oligo(dT,),结合,低盐缓冲溶液使它们解离。,LOGO,cDNA,第一链的合成,Oligo,(,dT,)引导的,cDNA,合成,高浓度,的,Oligo,(,dT,)引物与,mRNA,的,3,末端的,poly,(,A,)配对。,优点:逆转录反应基本被限定在以,mRNA,为模板,故即使样品中混有少量的,rRNA,时不会影响,cDNA,文库构建的质量。,缺点:只能从,mRNA3,末端其起始引发,cDNA,的合成,由于逆转录酶的能力有限,平均合成出的,cDNA,长度在,1kb,以下,因此合成,cDNA,通常会缺少,mRNA5,端的重要信息。,LOGO,随机引物引导的,cDNA,合成,采用,6,10,个随机碱基的寡核苷酸短片段来锚定,mRNA,并作为反转录的起点。由于随机引物可能在一条,mRNA,链上有多个结合位点而从多个位点同时发生反转录,比较容易合成特长的,mRNA,分子的,5-,端序列,。,优点:克服了,oligo(dT,),合成,cDNA,时缺少,5-,端序列,的缺点, 能更有效的反映出表达,mRNA,全长的序列信息。,缺点:对,mRNA,样品的纯度要求苛刻。,cDNA,第,二,链的合成,自身引导法,置换合成法,PCR,法,LOGO,方法一:自身引导法,LOGO,方法二:置换合成法,方法三:,PCR,法,cDNA,的,克隆,(,1,)修饰,cDNA,两端,(,2,),cDNA,与载体相连,(,3,)导入宿主细胞,:,重组体在一定条件下导入宿主细胞培养或保存宿主细胞必须是来自一个细胞的克隆体,以保证它们的遗传性状相同,。,LOGO, 000,多年的栽培历史,研究和利用大豆基因资源具有特殊的意义。本研究以栽培大豆为材料,通过干旱和低温处理,构建,cDNA,融合表达文库,为今后分离抗逆相关基因和分子育种工作奠定了基础,。,材料:,栽培大豆,(Glycine max),品种为吉林,35 ;,大肠杆菌菌株,DH5,和酵母菌株,YM4271 ;,用于构建文库的试剂盒,(,购自,Strata gene,公司,) ;,提取总,RNA,的,Trizol,试剂盒,(,购自,Invitrogen,公司,) ;,限制性内切酶、,T4,连接酶、,DNA,片断回收试剂盒,(,均购自大连宝,( TaKaRa ),生物工程公司,),等,方法与步骤:,大豆处理,低温处理,:,将上述植株置于,4,冰箱中,处理,4 h ;,干旱处理,:,将上述植株置于恒温箱中,25,下处理,4 h,总,RNA,提取和质量检测,cDNA,双链的合成,采用磁珠法从总,RNA,中分离出,mRNA,采用试剂盒进行文库的构建,cDNA,文库的质量鉴定,结果与分析,总,RNA,与,mRNA,的质量检,cDNA,文库插入片段长度的,PCR,分析,三疣梭子蟹是我国沿海重要养殖品种之一,近年来养殖病害呈逐年上升趋势,制约了三疣梭子蟹养殖产业的健康可持续发展。为大规模克隆三疣梭子蟹免疫相关基因,研究其免疫基因的功能和免疫机制,构建了三疣梭子蟹血细胞全长,cDNA,文库可以提供三疣梭子蟹病害防治理论基础 。为深入研究免疫相关基因的功能和免疫机制奠定基础。,研究背景:,1,、三疣梭子蟹采自浙江海域,;,2,、总,RNA,提取,Trizol,试剂盒,( Trizol Plus RNA Purificati on Kit),与,mRNA,分离试剂盒,( FastTrack 2 . 0Kit),购自,Invitrogen,公司,;,3.,、,SMART,TM,cDNA Library Construction Kit,与,Advantage 2 PCR Kit,购自,Clontech,公司,; pGEM2 T easy T,载体购自,Promega,公司。其余试剂均为进口或国产分析纯试剂。,材料:,FastTrack 2 .0Kit,试剂盒,通过,poly( T),纤维素柱进行亲和层析,从三疣梭子蟹血细胞总,RNA,中得,poly A+mRNA,。,成年雄性三疣梭子蟹采集后饲养于恒温水族箱,( 25 ),取,1,只蟹收集血细胞,采用,Trizol,试剂盒提取三疣梭子蟹血细胞总,RNA,.1.2%,琼脂糖凝胶电泳进行鉴定,同时测定,OD260,和,OD280,值,分析所提取,RNA,的浓度和纯度。,方法:,转化至高效感受态细胞,DH10B,在,37 ,、,200 r /min,培养,1 h,加入,5,mL,预冷,LB,培养基,(,含,25%,甘油,) ,即为全长,cDNA,原始文库 。,poly,A+mRNA,在反转录酶作用下转录合成,cDNA,第,1,链,Advantage 2 PCR,Kit(Clontech,),试剂盒作用下合成,cDNA,第,2,链,并取,5L,凝胶电泳检测,通过,Chroma,SP I N2400,分级分离,除去小于,500,bp,的片段,处理后的,ds,cDNA,与载体,pGEM2 T EASY,在,16 ,过夜连接,cDNA,文库的质量鉴定与随机测序,文库滴度的鉴定,文库重组率及平均插入片段的鉴定,部分序列测定及分析,总,RNA,电泳分析,方法:,克隆插入片段的,PCR,检测,丁立建,EST,序列分析,原理,方法,应用,毛海花、上官巧灵、朱竹君,ESTs,(,ExpressedSequencetags,)是从已建好的,cDNA,库中随机取出一个克隆,从,5,末端或,3,末端对插入的,cDNA,片段进行一轮单向自动测序,所获得的约,60500bp,的一段,cDNA,序列。,BACK,原理,分析,EST,序列的目的,获得,EST,序列的方法,分析,EST,序列的方法,如何提交,EST,序列,BACK,方法,分析,EST,序列的目的,基因识别,获得全长,cDNA,研究基因可变剪接类型,SNP,的发现,表达量比较,application,BACK,获得,EST,序列的方法,从数据库下载,dbEST,www.ncbi.nlm.nih.gov/dbEST/,CGAP,http:/,cgap.nci.nih.gov,/,UniGene,www.ncbi.nlm.nih.gov/UniGene,/,Tigr,Gene Index,www.tigr.org/tdb/tgi,/,cDNA,文库测序,BACK,分析,EST,序列的方法,Raw EST,Pre-processing,clustering,Assembly,Annotation,EST,分析流程,1. Raw EST,从,cDNA,文库随机挑取单一克隆进行,5,或,3,端测序;,测序方向的选择,根据不同的实验目的选择不同的测序方向:,5,端,5,上游非翻译区校短且含有较多的调控信息。一般在寻找新基因或研究基因差异表达时用,5,端,EST,较好,大部分,EST,计划都是选用,5,端进行测序的,而且从,5,端测序有利于将,EST,拼接成较长的基因序列。,3,端,3,端,mRNA,有一,20,200bp,的,plyA,结构,同时靠近,plyA,又有特异性的非编码区,所以从,3,端测得,EST,含有编码的信息较少但研究也表明,,10,的,mRNA3,端有重复序列,这可以作为,SSR,标记;非编码区有品种的特异性,可以作为,STS,标记,两端测序,获得更全面的信息。,2. Pre-processing,去除低质量的序列(,Phred,),应用,BLAST,、,RepeatMasker,或,Crossmatch,遮蔽数据组中不属于表达的基因的赝象序列,(,artifactual,sequences),载体序列,(,ftp:/,ncbi.nlm.nih.gov,/repository/vector,),重复序列,(,RepBase,http:/,www.girinst.org,),污染序列,(,如核糖体,RNA,、细菌或其它物种的基因组,DNA,等,),去除其中的,镶嵌克隆,。,最后去除长度小于,100bp,的序列。,镶嵌克隆的识别,Backtoback,poly(A,),+,tails,Linkertolinker,inmiddleofthe,seq-uence,Blastn/Blastx,search,3.,Clustring,聚类作用:,产生较长的一致性序列,(consensussequence),,用于注释,降低数据的冗余,纠正错误数据,可以用于检测选择性剪切,ESTs,聚类的数据库主要有三个:,UniGene,(,http:/,www.ncbi.nlm.nih.gov/UniGene,),TIGRGeneIndices(,http:/,www.tigr.org/tdb/tgi,/,),STACK(,http:/,www.sanbi.ac.za/Dbases.html,),聚类的目的就是将来自同一个基因或同一个转录本的具有重叠部分,(over,lapping),的,ESTs,整合至单一的簇,(cluster),中。,常用的拼接软件,Phrap,http:/,www.genome.washington.edu/UWGC/analysistools/Phr,ap.cfm,CAP3(XiaoqiuHuang,huangmtu.edu,), d2_cluster(,http:/,www.sanbi.ac.za,/,),错拼漏拼的原因,错拼,3,断,polyA,尾巴的存在,镶嵌,clone,的存在,重复序列,漏拼,拼接参数太严格,重复序列,镶嵌,clone,解决方法,调整拼接参数,EST,和,consensus,进行对比,根据注释结果来判断,4. Cluster,的连接,利用,cDNA,克隆的信息和,5,,,3,端,Reads,的信息,不同的,Cluster,可以连接在一起。,5.,基因注释,注释:, 序列联配,一级序列同源对比,Blastn,,,Blastx,蛋白质功能域搜索,(,二结构比对,),,蛋白质结构域和功能位点预测,Pfam,Interpro,后续分析,比较基因组学分析,基因表达谱分析,新基因研究,基因可变剪切分析,实验验证,MicroArray,GeneChip,RTPCR,Northen,bloting,BACK,如何提交,EST,序列,提交至,dbEST,发邮件至,batch-,subncbi.nlm.nih.gov,准备以下文件,a. Publication,b. Library,c. Contact,d. EST,back,应用,Goal,日本血吸虫(中国大陆株)表达基因的分离和序列测定,研究背景,1995,年,,Fanco,首先应用,EST,法对曼氏血吸虫,(,Sm,),的基因进行了分离和序列测定,。,到,目,前为止(,1999.5,),,,在,NCBI,的,GenBank,中已收录的血吸虫,EST,序列,9737,条,,,其中,Sm,有,8216,条,,,日本血吸虫,(,Sj,) 有,834,条,,,分别占,GenBank,中已收录的,Sm,和,Sj,基因序列的,94.26,和,86.60,。,尽管目前对,Sm,EST,的分离与测定进展迅速,,,但已知,Sj,EST,序列只占,Sj,表达基因数的,4.17,,,所,以,继续开展日本血吸虫编码基因的分离和序列测,定仍具有重要的意义。,材料,日本血吸虫(中国大陆株)成虫,cDNA,文库由南京医科大学陈淑贞教授构建。该文库系采用定向克隆构建于,gt 11/1090,系统中,所构建的基因表达文库容量为,3.13106,重组子。,方法,设计并合成引物,单个重组噬菌体的随机挑选,重组克隆,PCR,直接序列分析,ESTs,的同源性分析,结果与分析,重组克隆的分离及,P C R,鉴定,未知基因,EST,序列的确认,获得新基因,EST,序列进入,NCBI,的序列进入编号,其序列编号分别为,A I 7 2 5 3 5 7,、,AI 7 2 5 3 6 0,、,AI725 3 6 1,和,AI 7 4 0 1 8 9,A I 7 4 0 2 0 4,参考文献,1,沈倍奋分子文库北京:科学出版社,,2001.,2,赵亚华分子生物学教程,.,北京:科学出版社,,2004,3 P.c.,特纳等分子生物学北京:科学出版社,,2001,4,朱利军,长孙东亭,罗素兰,.,cDNA,文库在药用海洋生物研究中的应用,J.,中国海洋药物杂志, 2009, 28(1):53-58.,5,王庆胜,.,我国,cDNA,文库研究现状,J.,黑龙江农业科学, 2009(1):3-4.,6,吴忠道,余新炳,郑亦男等日本血吸虫(中国大陆株)表达基因的分离和,EST,序列测定,J,中国人兽共患病杂志,,2000,16(1):3-6,LOGO,
展开阅读全文