棉花非冗余性ESTSSR新标记的开发及其评价

上传人:沈*** 文档编号:93800128 上传时间:2022-05-21 格式:DOC 页数:10 大小:537KB
返回 下载 相关 举报
棉花非冗余性ESTSSR新标记的开发及其评价_第1页
第1页 / 共10页
棉花非冗余性ESTSSR新标记的开发及其评价_第2页
第2页 / 共10页
棉花非冗余性ESTSSR新标记的开发及其评价_第3页
第3页 / 共10页
点击查看更多>>
资源描述
作物学报ACTA AGRONOMICA SINICA 2012, 38(8):1443-1451 http:/www.chinacrops.org/zwxb/E-mail: xbzwISSN 0496-3490; CODEN TSHPA9DOI: 10.3724/SP.J.1006.2012.01443棉花非冗余性EST-SSR新标记的开发及其评价王 为1,2本研究由国家重点基础研究发展计划项目(973计划)(2010CB126000), 中央级公益性科研院所基本科研业务专项(SJB1105),国家自然科学基金项目(30900911, 31000729),江苏省科技支撑计划项目(BE2011304),江苏省农业科技自主创新基金(自由探索类),江苏沿海所所长基金项目 (YHS201103)和山西省基础研究计划项目(2009021032-1)。 通讯作者 (Corresponding author):王坤波 ,E-mail: wkbcri, wkbcri王长彪3,第一作者联系方式:E-mail: ww462* 同等贡献(Contributed equally to this work)Received(收稿日期):2011-12-30; Accepted( 接受日期):2012-04-20; Published online(网络出版日期 ):2012-06-04.URL: http:/www.c nki. net/kcms/detail/11.1809.S.20120604.1010.013.html刘 方1 陈浩东1,4 王琳1 王春英1张香娣1 王玉红1 王坤波1,*1中国农业科学院棉花研究所/棉花生物学国家重点实验室,河南安阳455000; 2江苏沿海地区农业科学研究所/农业部沿海盐碱地科学观测实验站,江苏盐城224002; 3山西省农业科学院棉花研究所,山西运城,044000; 4湖南省棉花科学研究所/国家杂交棉研究推广中心,湖南常德 415101摘 要:利用ClustalX等软件对公共数据库现有的393 753条棉花EST序列分析,得到349 815条非冗余EST序列,借助自主开发的 SSRmine软件共发掘 SSR位点11 372个,分布于10 507条EST中,EST-SSR的频率是3%,平均相 隔21 kb出现一个SSR。在26 bp的重复基元中,三核苷酸和六核苷酸分别占34.1%、40.6%,二、三、四、五和六核苷酸基序分别以 AG/CT、AAG/CTT、AAAT/ATTT、AAAAG/CTTTT 和AAAAAG/CTTTTT 的类型最多。利用去 冗余的且在亚洲棉、陆地棉、海岛棉中没有被开发过的410条EST序列设计开发了 200对非冗余性SSR引物,利用自主开发的 SSRD软件通过 SSR引物序列下载、预处理、Blastn、提取相似性分值 81%的引物编号、提取引物冗余对、冗余引物写成一行6个步骤去除来源于自身部分同源序列以及与CMD释放的不同棉种相似性SSR引物,得到了非相似性引物,定名为CRIXXX (CRI 即Cotton Research Institute)。并分别选用棉花12个种的代表性材料对其中100对进行引物功效评价,包括多态信息含量 (polymorphism information content, PIC)及引物通用性研究。结果显示,从自主开发的100对SSR引物筛选出56对均能在12份材料间扩增出稳定明显的条带,其中多态性引物 35对,多态率占35%。引物的PIC变幅为0.0970.888,平均为0.482; 1对海岛棉EST-SSR引物在12份材料间的通用性为 100%, 25对亚洲棉引物通用性为81%, 74对陆地棉引物通用性为80.1%。关键词:棉花;EST-SSR标记;冗余性;多态性;通用性Developme nt and Evaluati on of New Non-Red undant EST-SSR Markers from Gossypium12*3*11 411WANG Wei , , WANG Cha ng-Biao ,, LIU Fa ng , CHEN Hao-Do ng ,, WANG Lin , WANG Chu n-Ying1 1 1 *ZHANG Xia ng-Di , WANG Yu-Ho ng , and WANG Ku n-Bo ,1Cotton Research Institute, Chinese Academy of Agricultural Sciences / State Key Laboratoy of Cotton Biology, Anyang 455000, China;2Agricultural Sciences Institute of Coastal Area of Jiangsu / Observation and Experimental Station of Saline Land of Coastal Area, Ministry of Agri-34culture, Yan che ng 224002, China;Cott on Research In stitute, Shanxi Academy of Agricultural Scie nces, Yun che ng 044000, China;Hunan CottonResearch Institute / National Hybrid Cotton Research Promotion Center, Changde 415101, China-6-nucleotide re-Abstract: A software Clustal X was used to analyse the redundancy of 393 753 ESTs of Gossypium available in public database. By mining 349 815 non-redundant ESTs, a total of 11 372 SSR loci derived from 10 507 ESTs using a software SSRmine developed by ourselves were observed. The frequency of ESTs containing SSRs was 3%, with an average of one SSR in every 21 kb of EST sequence. Besides, trinucleotide and hexanucleotide repeats were found to be the most abundant among 2peat types, accounting for 34.1% and 40.6% respectively. In dinucleotide repeats, trinucleotide repeats, tetranucleotide repeats, pentanucleotide repeats and hexanucleotide repeats, AG/CT, AAG/CTT, AAAT/ATTT, AAAAG/CTTTT, AAAAAG/CTTTTT第8期王为等:棉花非冗余性 EST-SSR新标记的开发及其评价#motifs accounted for the highest proportions, respectively. Two hundred pairs of new non-redundant EST-SSR primers were developed based on 410 EST sequences removed the redundancy which have not been developed so far in Gossypium arboreum, G. hirsutum, and G. barbadense. We used a software SSRmine developed by ourselves to obtain non-similarity primers, designated CRI (Cotton Research Institute) XXX through six steps, including SSR primer sequences download, pretreatment, Blastn, extraction of primer numbers of similarity score more than 81%, extraction of redundant primers pairs and making redundant primers in a line, to remove homologous sequences from themselves and similar primers released in CMD from different cotton species. Among them, 100 primers were evaluated in polymorphism information content (PIC) and transferability using 12 cotton species including seven representative diploids species and five tetraploid species. The results showed that a total of 56 from the 100 pairs of SSR primers could be amplified the stable and clear polymorphic bands in the 12 accessions mentioned above, moreover, 35 out of 56 pairs of primers were polymorphic, with the primer polymorphism ratio of 35%. PIC of these primers ranged from 0.097 to 0.888, with the average of 0.482. Totally, the transferability among the 12 cotton species was 100% for a pair of EST-SSR primers from Gossypium barbadense L., 81% for 25 primers from G. arboreum, and 80.1% for 74 primers from G. hirsutum, respectively.Keywords: Gossypium; EST-SSR marker; Redundancy; Polymorphism; Transferability第8期王为等:棉花非冗余性 EST-SSR新标记的开发及其评价#第8期王为等:棉花非冗余性 EST-SSR新标记的开发及其评价1445近年来,棉花基因组研究迅猛发展,尤其是在 棉花分子遗传图谱1-2的构建和重要性状的分子定 位3-9等方面。在众多分子标记中,以PCR为基础的 SSR标记以其信息量高、易操作、呈共显性遗传等 特性被广泛开发利用,且SSR位点既存在于基因非 编码区,也广泛分布于基因编码区10。自2000年起, 已经在葡萄(V. vinifera )11、甘蔗(Saccharumspp.严、 硬粒小麦(Triticum durum )13、黑麦(Secale ce- reale)14、大麦(Hordeum vulgare )13、小麦(Triticum L.)16、马铃薯(Solanum tuberosum)17、大豆(Glycine max)18、橡胶(Hevea brasiliensis Muell-Arg) 19、芝 麻(Sesamum indicum )20、耐盐作物21、亚洲 棉 (Gossypium arboreum) 22、陆地棉(G. hirsutum) 23、 雷蒙德氏棉(G. raimondii) 24、非洲棉(G. herbaceu卅25、 海岛棉(G. arbadense) 26等作物开展了 EST-SSR标 记的开发并广泛用于基因组研究和分子标记辅助选 择育种。另外,不同棉种大规模的EST测序和公开释放,为棉花EST-SSR标记的开发提供了大量的信 息资源。截至 2012年2月22日,收录在GenBank (http:/www.ncbi.nlm.nih.gov/dbEST/)中的 5个棉种的 棉属EST序列共41 7433条。其中陆地棉为297 214 条,随后是雷蒙德氏棉63 577条,亚洲棉41 781条,而海岛棉为11 446条,非洲棉仅为1 280条。从 2009年2月到2012年2月过去的3年陆地棉 EST 增加了 28 435条,海岛棉增加了 10 423条,非洲棉 增加1 033条,亚洲棉增加13条,雷蒙德氏棉没有 增加。但是 CMD (http:/www.cottonmarker.org/)上公 布的引物存在冗余性(冗余性14.28%),冗余性引物 是指2对引物其中的1条或2条序列相似性较高(一 般认为超过 81%),导致重复扩增,引物功效降低, 也即本文提到的相似性引物。相似引物有两种情况,一种是正式匹配即1对引物和另外1对引物正向序列 匹配,另一种反式匹配就是1对引物的正向和另外一 对引 物的反 向序 列匹配。Blastclust (Blast 包, http:/blast .n cbi. nlm. nih.gov/Blast.cgi?CMD=Web & PAGE_TYPE=BlastDocs&DOC_TYPE=Dow nload)、 CD-HIT (http:/www.bioinformatics.org/project/filelist. php?group_id=350)和 seqmatchall (EMBOSS 包,http:/ emboss.sourceforge. net/等程序只能分析 1对引物的 正向或反向引物,不能同时分析1对引物是否冗余, 而seqmatchall不能分析序列的反向互补序列,还未 见有合适的软件同时分析1对引物的冗余性。为此,我们开发了 SSR位点发掘、标记冗余性大规模分析 2 个软件,方便研究者充分利用网络资源,同时分析1 对引物的冗余性,提高工作效率,为进一步生物学研 究奠定基础。为系统、集成研究棉花EST资源,开发非冗余的功能标记,并为基因组测序、转录组测序产生的 海量信息积累技术资料。本研究利用去冗余的且在 亚洲棉、陆地棉、海岛棉中没有被开发的EST序列设计开发了 200对SSR引物(已将该批引物与 CMD 释放的引物比对分析,得到了非相似性引物,定名 为CRIXXX),并分别选用棉花12个种的代表性材料 对其中100对进行引物功效评价,还对这200对引 物进行了定位,以期为标记开发功效的提高、遗传 多样性分析、饱和棉花遗传图谱等研究打下良好的 基础。1材料与方法1.1 试验材料选取12个棉种的代表种共12份材料,包括7个 二倍体和5个四倍体(表1)。材料样品全部保存在位 于海南三亚的国家野生棉种质圃。表1来自12个棉种的试验材料Table 1 Experime ntal materials from 12 cott on species序号种名染色体组No.Species nameChromosome group1亚洲棉(石系亚1号)G. arboreumA22异常棉 G. anomalumB13斯特提棉G. sturtianumC14雷蒙德氏棉G. raimondiiD55索马里棉 G. somale nseE26长萼棉 G. lo ngicalyxF17比克氏棉G. bickiiG18陆地棉仃M-1) G. hirsutum(AD) 19海岛棉(海 7124) G. barbadense(AD) 210毛棉 G. tomentosum(AD) 311达尔文氏棉 G. darwinii(AD) 512黄褐棉 G. mustelinum(AD) 41.2 EST 序列来源2011 年 5月 1 日从 dbEST/GenBan数据库(http:/ www. ncbi.nlm.nih/entrez)中以 FASTA 格式下载了所 有393 753条棉花EST序列,共得到349 815非冗余序 列用来研究EST分布特征;重点从2009年2月到2011 年5月增加的EST序列中选取引物设计所用序列。1.3 EST-SSR 的发掘采用 ClustalX 1.81 ( Soft/Seque nces/lig nmen t/200409/0.html) Treeview (ver 1.61) (http:/www.tax onom y.zool-ogy.gla.ac. nkrod/od. html 和 Gen edoc (ver2.6.02) http:/www.psc.edu/biomed/ genedoc/gddl.htm)软件对393 753条EST序列进行冗 余性查找,然后利用自主开发的软件SSRmine1.0(国家版权局登记号:2011SR015269)在非冗余序列 中查找SSR。利用该软件查找二、三、四、五、六 核苷酸5种类型的SSR。SSR的查找标准为二核苷 酸重复次数9,三核苷酸重复次数6,四核苷酸重复次数5,五核苷酸重复次数 4,六核苷酸重 复次数3,复合型的SSR整体长度不小于24 bp24,27。1.4 非冗余性EST-SSR引物开发利用去冗余的且在亚洲棉、陆地棉、海岛棉中 没有开发过的EST序列设计开发引物,借助自主开 发的SSRD1.0软件(国家版权局登记号:2011S- R001433)通过SSR引物序列下载、预处理、Blastn、 提取相似性分值81%的引物编号、提取引物冗余 对、冗余引物写成一行等 6个步骤去除来源于自身 部分同源序列以及与CMD释放的不同棉种相似性SSR引物,得到了非相似性引物,定名为CRIXXX 。 EST-SSR引物设计由primer3程序完成。设计的主 要参数是,弓I物长1820 bp,最适为20 bp; PCR产 物长100250 bp;最适Tm值为57C; GC 含量为 35%65%,最适50%23。引物由上海英骏生物技术 有限公司合成,Taq DNA聚合酶和dNTPs均购自河 南普金生物技术有限公司。1.5 DNA 提取、PCR扩增和电泳检测采用改良的CTAB 28法提取各材料基因组 DNA oPCR 含总体积为 10 丄,10 x Reaction buffer含 Mg2+) 1.0 此,10 mmol L -1 dNTPs 0.5 山,每对引物 的正反向引物(10 gol L -)各1止,2.5 U 止-1 Taq DNA聚合酶0.2止,50 ng 山-1模板DNA 1丄,ddH2O 5.3 此 o PCR 程序为,95 C 2 min; 94 C 40 s, 57C 45 s, 72C 60 s,共 30 个循环;72 C 7 min,最后 温度设定为15C。采用 Bio-Rad 公司 PowerPacHCTM电泳仪、北京六一仪器厂 DYCZ-30电泳槽装 置及8%的聚丙烯酰胺凝胶,电泳缓冲液为1X TBE, 在扩增产物中加入1.5山溴酚蓝上样缓冲液,混匀, 取1.8 pL加入点样孔,190 V恒压电泳45 min。参照 张军等29和Bassamf30的方法银染。1.6 多态信息含量和引物通用性分析Simpson多样性指数即多态信息含量PIC= 1 -2Pi2, Pi为第i个等位基因变异出现的频率9; Shannon- Weaver多样性指数也称基因型多样性 H = -Pi In Pi;每个位点的有效等位基因数为 Ne=1/2Pi2, Pi为 第i个等位基因变异出现的频率 。引物通用性用总扩增率来衡量30。总扩增率(%)=总的被扩增数X00 总的重组子(EST-SSR引物对数X待测棉种数)1.7 染色体定位利用本实验室前期构建的鲁棉研 15的F2群体进 行染色体初步定位 ,群体大小为 558;采用Join- Map3.0软件构建分子遗传连锁图谱(LOD值7),其 作图函数为Kosambi函数;采用MapChart2.2绘图软 件绘制遗传图谱31。2结果与分析2.1 EST-SSR的发掘与特征分布采用 ClustalX 1.81、Treeview (ver 1.61) 和Gen edoc (ver 2.6.02)软件,在所有的393 753条棉花 EST序列(共233.4 Mb,约相当于棉花基因组的 9%) 中共得到349 815条非冗余EST序列,然后利用软 件SSRmine1.0在非冗余序列中共发现 SSR位点第8期王为等:棉花非冗余性 EST-SSR新标记的开发及其评价#11 372,分布于10 507条EST中,在研究的所有 EST 序列中含有SSR序列的频率为3%,平均每隔21 kb 出现一个SSR。在26 bp的重复基元中,三核苷酸 和六核苷酸分别占 34.2%、40.7%,二、三、四、五、 六核苷酸分别以 AG/CT、AAG/CTT、AAAT/ATTT、 AAAAG/CTTTT、AAAAAG/CTTTTT 的类型最多(图 1和表2),其他类型达到了 39.1%。26 bp的各种重 复基元的SSR数目、丰度及在各重复类型中分布频 率如表2所示。其中复合型 SSR位点共282个,占 2.5%。第8期王为等:棉花非冗余性 EST-SSR新标记的开发及其评价#第8期王为等:棉花非冗余性 EST-SSR新标记的开发及其评价#39 10454035图1各种重复基元的EST-SSR所占比例Fig. 1 Proportions with SSR of various motifs2c岂亠第8期王为等:棉花非冗余性 EST-SSR新标记的开发及其评价#表2各种重复基元SSR数目、丰度及各重复类型中分布频率Table 2SSR n umber, abundance and distributi on freque ncy of various motifs第8期王为等:棉花非冗余性 EST-SSR新标记的开发及其评价#重复类型数目频率Repeat typeNumberFrequency (%)二核苷酸重复Dinucleotide repeats1467 12.9三核苷酸重复Trinucleotide repeats3885 34.2四核苷酸重复Tetranucleotide repeats525 4.6五核苷酸重复Pentanucleotide repeats585 5.1六核苷酸重复Hexanucleotide repeats4628 40.7复合型 Compound type282 2.5总数Total11372 100.0The most SSR motifFrequency in every repeat type (%)AG/CT44.0AAG/CTT26.8AAAT/ATTT28.3AAAAG/CTTTT14.3AAAAAG/CTTTTT7.4最多的重复基元在各重复类型中分布频率第8期王为等:棉花非冗余性 EST-SSR新标记的开发及其评价14472.2 非冗余EST-SSR新标记开发得到200对非相似性引物,定名为 CRIXXX (CRI 即 Cotton Research Institute, 编号为 CRI1- CRI200)。SSRD1.0软件涉及到的新开发引物和已释 放的引物相似性检测过程如下。(1) SSR分子标记的获得及预处理。分别从CMD 网上下载棉花分子标记,再把下载到的引物转换成ID forword_primer reverse_prmer 格式” 然后执行 pre_fasta2.pl脚本(自编程序,原理是:读取文件的 每行$1为引物编号,$2为正向引物,同时计算其长 度$lf, $3为正向引物同时计算其长度 $lr,然后输出), 转化成FASTA格式(图2)。(2) SSR分子标记相似性检索及相关信息提取,把处理好的FASTA文件备份一个文件,后缀名为.bk利用 Blast (2.2.24-win 版)软件(ftp:/ftp.ncbi.nih. gov/blast/executables/blast+/2.2.24/)对各个物种的 SSR分子标记分别比对,查询相似性序列。所用的主 要参数为-p blastn -a 2 -F F -m 8。从得到的结果中按 照相似匹配分值不低于81%同时没有gap过滤1对引 物,然后提取相似引物编号,匹配分值 S=aT x 100+ mx (-为查询序列和目标序列匹配上的序列长度 (bp); l为目标序列长度(bp); m为错配个数。通过上述方法把正式匹配(图3-A)和反式匹配(图 3-B) 2种情况提取出来得到冗余引物,但是存在编号 相同而顺序相反的情况。(3)为了解决这种问题,我们执行下一步,得到 没有重复行的结果文件“renum.2。”利用该软件定义哈希表同时进行排序,取出这种交叉重复,最后实 现相似引物写入一行的功能。把所有相似引物写入 一行,输出最终结果文件out.list (图2)。2.3多态信息含量和引物通用性分析用棉花12个种的代表性材料对 200对引物中的 100对进行引物功效评价,包括引物的多态信息含 量(PIC)及引物通用性研究(图4),扩增片段在150 350 bp之间,这12份材料有丰富的遗传多样性。结 果表明,从自主开发的100对SSR引物筛选出的56 对均能在12份材料间扩增出稳定明显的条带,其中 多态性引物35对,多态率占35.0%,共检测出137 个片段,其中多态性片段114个,占88.5%。每个位 点的等位基因为112个,平均每对引物3.91个。PIC的变幅为 0.0970.888,平均为 0.482;基因多样性 (H )的变幅为 0.4512.451,有效等位基因数(Ne)在 1.38510.490 之间变动(表 3)。1对海岛棉EST-SSR引物在12份材料间的通用 性为100%, 25对亚洲棉EST-SSR引物在上述材料通 用性为81.0%, 74对陆地棉EST-SSR引物在上述材 料通用性为80.1%。2.4 在陆邓击群体上的多态性及染色体初步定位将200对EST-SSR标记在鲁棉研15的2个亲本613和R55进行多态性筛选,共获得4对多态引物,第8期王为等:棉花非冗余性 EST-SSR新标记的开发及其评价#第8期王为等:棉花非冗余性 EST-SSR新标记的开发及其评价#SSE primer sequences第8期王为等:棉花非冗余性 EST-SSR新标记的开发及其评价#preprim er. Ixt -:er.firx lacopybkJbrnntfdb-fj F-O T-i primcrji/shr曲出 prifNer-Jasia-i prefer,jfax/a,t图2 SSR 分子标记冗余性分析流程图及程序执行命令Fig. 2Flow chart and program executive order of SSR molecular marker redundancy analysis第8期王为等:棉花非冗余性 EST-SSR新标记的开发及其评价#第8期王为等:棉花非冗余性 EST-SSR新标记的开发及其评价#Marker 5Marker 4第8期王为等:棉花非冗余性 EST-SSR新标记的开发及其评价#第8期王为等:棉花非冗余性 EST-SSR新标记的开发及其评价#图3 2种冗余引物Fig. 3 Two kinds of redundant primersA :正式匹配 ;B :反式匹配。A: forward match; B: reverse match.第8期王为等:棉花非冗余性 EST-SSR新标记的开发及其评价1449图4 8对引物在12份棉种材料上的扩增电泳图Fig. 4 PCR results of eight pairs of primers amplified with 12 cotton materials从引物为 CRI8(I)、CRI46(II)、CRI50QII) 、CRI52(IV)、CRI56(V)、CRI59(VI)、CRI71(VII) 、CRI94(VHI), 12 个一组112代表1中的材料 112。Primers are CRI8(I), CRI46(II), CRI50(III), CRI52(IV), CRI56(V), CRI59(VI), CRI71(VII), and CCRI94(VIII)with 12 bands in one group. The lanes 1 12 stand for the mate.第8期王为等:棉花非冗余性 EST-SSR新标记的开发及其评价#第8期王为等:棉花非冗余性 EST-SSR新标记的开发及其评价#表3 35 对多态性 EST-SSR 标记的扩增Table 3 Results of amplification of 35 pairs of polymorphicprimers引物PIC值PrimerPIC-value有效等位基因数NeEffective number of alleles基因型多样性 H zShannon-Weaver diversity indexCRI1 0.6532.8800.730CRI2 0.3891.6361.282CRI8 0.6813.1300.900CRI11 0.2361.3091.171CRI15 0.1671.2002.483CRI16 0.6673.0001.107CRI17 0.1531.1800.287CRI18 0.7574.1141.376CRI19 0.8510.8621.863CRI21 0.6182.6181.247CRI22 0.6532.8800.730CRI23 0.1111.1250.541CRI31 0.2431.3210.499CRI33 0.3061.4400.152CRI34 0.1461.1710.494CRI35 0.3061.4400.617CRI36 0.5282.1180.569CRI38 0.1531.1800.287CRI41 0.0971.1080.530CRI46 0.6462.8241.742CRI49 0.5422.1820.888CRI57 0.4861.9460.679CRI58 0.2151.2740.585CRI61 0.8899.0001.266CRI63 0.7500.8000.347CRI64 0.6673.0001.651CRI65 0.4721.8950.992CRI66 0.3681.5820.769CRI71 0.2781.3850.451CRI81 0.5422.1820.684CRI84 0.6883.2000.693CRI87 0.7994.9660.663CRI88 0.6322.7170.920CRI94 0.4861.9460.679CRI95 0.6883.2001.030多态率为2%。将这4对多态性引物在本实验室构建 的陆地棉鲁棉研15的F2群体进行基因型分析。图5 是开发的标记在该群体上扩增结果,上图为CRI81 显性标记,在F2群体有2种表现型;下图为CRI184 共显性标记,在F2群体中有3种表现型。扩增产物 片段在250300 bp之间。将其中的CRI002、CRI081 和CRI151标记定位在图谱上(群体大小558,共有 116个位点分布于25个连锁群,覆盖892.25 cM,总 图谱略)。对比前人图谱将 CRI151定位在A5染色体 上1,31, CRI002定位在A10染色体上32,而CRI081所 在的连锁图谱LG01没有找到对应的染色体(图6)。3讨论3.1 引物冗余性研究意义与通用性原因及EST-SSR 特征分布引物冗余性(相似性)是标记开发过程中一个重 要问题,但相关报道较少。CMD上公布的引物存在 冗余性(冗余性14.28%),至今没有合适的软件同时 分析一对引物的冗余性,造成不同研究者开发研究 的重复性,浪费时间和成本。本研究自主开发了 SSR 位点发掘软件SSRmine1.0及能同时分析1对引物和 已释放的引物间是否冗余的软件SSRD1.0,来开发设计非冗余性 SSR标记,减少了盲目性和重复性, 节约了成本,提高了效率。棉属不同棉种的基因组内涉及许多类型的重复基因,如直系同源基因(orthologous loci), 旁系同源 基因(paralogous loci), 生物同源位点 (homologous loci)等33。 Orthologs和Paralogs是同源序列的两种 类型,Orthology描述在不同物种中来自共同祖先的 基因,Orthologous基因可能有相同的功能。Paralogy第8期王为等:棉花非冗余性 EST-SSR新标记的开发及其评价#第8期王为等:棉花非冗余性 EST-SSR新标记的开发及其评价#第8期王为等:棉花非冗余性 EST-SSR新标记的开发及其评价#图5 开发的标记在鲁棉研15的F2群体上的基因型分析Fig. 5Geno type an alysis of Lumia nyan 15 F 2 populati on with CRI markers developed上图的第4泳道、下图的第 2泳道为分子量Marker,其他均为F?群体株系。The fourth lane band in the upper figure and the second lane band in the lower figure stand for molecular weight marker in the photo, others are F? population lines.A50 A IX -10175AIOLGfllNAIJ-IR7Q QNAU2970CGR5O9INAU 1225 NAU1255NAU (M2 CGR5732CRII51NAUIIS7 BNU589NAU5295 NAU5K50HW4917 44CGR55651971CRI002NAI.J?77635CRtCWI图6多态性标记的染色体初步定位Fig. 6 Preliminary chromosome mapping of polymorphic markers描述在同一物种内由于基因复制而分离的同源基因,功能可能有所改变。这些位点均存在引物的通用性。本文提及的引物通用性遗传原因应该包括以上3种类型,一种是同一基因由于生殖隔离等原因分布在 两个物种内(如亚洲棉A基因组和陆地棉、海岛棉中 的A亚组);另一种是同一基因由于基因复制(geneduplicati on)或基因组倍增(ge nome duplicati on)等分 子事件在同一物种内分离成结构不同的功能基因,但有共同起源关系;第3种是A基因组和D基因组 的部分同源关系(homoelogous)。与Cardle等35的分类标准相比,本研究搜索单 四核苷酸重复基元重复次数的标准提高 ,增加了对 六核苷酸重复基元的筛选。结果显示,在棉花中每21 kb的EST出现1个SSR,丰度和Cardle等35的 结果接近。Clems on大学基因组研究所(Clemson Uni versity Gen omics In stitute,CUGI)对不同来源的EST数据分析发现,包含SSR的EST频率亚洲棉为 2.73%,陆地棉为2.16%24。Wang等24研究发现雷蒙德氏棉包含 SSR的的EST频率是4.45%,本研究 基于目前所 有的棉花 EST序列综合分析,得出 EST-SSRs的频率是3%,该结果为 平均”数值,更 具有代表性。在26 bp的重复基元中,三核苷酸和 六核苷酸分别占34.1%、40.6%,三核苷酸重复出现 频率高是与其编码区三联体密码子相对应的,非三核苷酸重复面临移码突变的选择压36,而六核苷酸可能为2个串联的三联体密码子。3.2 对开发的新引物的评价与利用PIC值可用来估计每对扩增引物的等位基因的 变异,其大小基于所检测到的等位基因的数目及分 布频率36,所以在一定意义上,PIC也是引物检测多 态性的能力的一种度量。引物的PIC值越高,它揭示等位基因变异的能力就越强。本文PIC的变幅为0.0970.888,平均为0.482。表明所设计引物可以用 于遗传多样性、植物遗传和进化等研究。本文1对海岛棉EST-SSR引物在12份材料间的通用性为 100%,25对亚洲棉EST-SSR引物在上述材料通用性 为81.0%,74对陆地棉EST-SSR引物在上述材料通 用性为80.1%,低于Guo等31的96.5% (选用60对 亚洲棉EST-SSR引物)以及俞渝等24报道的88% (22 对草棉EST-SSR引物)相比有点低。本研究同时选用 12个棉种的代表种共12份材料,包括7个二倍体和 5个四倍体,推测可能是引物通用性稍低的原因。从进化的角度,所有的棉种来源于二倍体棉种,大约在750万年前由共同的祖先分化而来38,大约 110190万年前39A和D基因组杂交后经过多倍化 过程形成异源四倍体。由于EST为编码DNA,其序 列保守程度较高,因而从中发掘的SSR标记有较高 的通用性(本研究均大于80%)。在EST-SSR标记的有效扩增率研究方面,前人第8期王为等:棉花非冗余性 EST-SSR新标记的开发及其评价1451stages in Gossypium barbadense L. Plant Sci, 2008, 174: 290- 298 21 Xu Z-L(徐照龙),Yi J-X( 易金鑫),Yu G-H( 余桂红),Zhang所设计引物的有效扩增率应在60%90%之间,且可能因所设引物跨越mRNA剪切位点以及扩增产物包 含的内含子太大,造成一部分引物不能扩增出产物20。 本文自主开发的100对SSR引物有56对均能在12 份材料间扩增出稳定明显的条带。本实验室前期构 建的鲁棉研15的F2群体所用引物(来自CMD网站 SSR引物)多态性为1.25% (陆陆群体由于遗传基础 狭窄,多态性率相对很低),本研究开发的标记在该 群体上引物多态率为 2%,高于前者,表明这些新标 记的功效尚可。最终将其中 CRI002、CRI081、CRI151 三个标记定位在图谱上,CRI151定位在A5染色体, CRI002定位在 A10染色体上。由于EST数据与转录基因相关,基于EST-SSR的染色体定位可用于相 关基因表达和基因功能的关联分析。4结论利用自主开发的SSR位点发掘、标记冗余性分 析两个软件进行SSR引物设计开发、评价可以更好、 更高效利用公共数据平台资源,提高研究者的工作效率,具有一定的可行性。这种新开发的非冗余性 棉花EST-SSR标记功效尚可,下一步研究需要扩大 标记数量以获得更多标记,为遗传多样性分析、加 密棉花遗传图谱等研究奠定了基础。Refere nces1 Guo W 乙 Cai C P, Wang C B, Han Z G, So ng X L, Wang K,NiuX W, Wang C, Lu K Y, Shi B, Zhang T 乙 A microsatellite-based, gene-rich linkage map reveals genome structure, function and evolution in Gossypium . Genetics, 2007, 176: 527- 5412 Yu Y, Yuan D J, Liang S G, Li X M, Wang X Q, Lin Z X, ZhangX L. Genome structure of cotton revealed by a genome-wide SSR genetic map constructed from a BC 1 population between Gossypium hirsutum and G. barbadens e. BMC Genomics , 2011, 12: 153 Shen X L, Guo W Z, Zhu X F, Yuan 丫 L, Kohel R J, ZhangT Z. Molecular mapping of QTLs for qualities in three diverselines in Upland cotton using SSR markers. Mol Breed , 2005, 15: 169 - 1814 Liu R 乙 Wang B H, Guo W 乙 Qin 丫 S, Wang L G, Zhang 丫 M, Zhang T Z. Quantitative trait loci mapping for yield and its components by using two immortalized populations of a heterotic hybrid in Gossypium hirsutum L. Mol Breed , 2011,29: 297 - 3115 Song X L, Zhang T 乙 Identification of quantitative trait loci controlling seed physical and nutrient traits in cotton. Seed Sci Res, 2007, 17: 243 2516 Yang C, GuoW 乙 Li G Y, Gao F, Lin S S, Zhang T 乙 QTLs mapping for verticillium wilt resistance at seedling and maturity7 Dong C G, Ding 丫 乙 Guo W 乙 Zhang T Z. Fine mapping of thedominant glandless gene G l 2e in Sea island cotton ( Gossypium barbadense L.). Chin Sci Bull , 2007, 52: 3105- 31098 Qian N, Zhang X W, Guo W 乙 Zhan T 乙 Fine mapping of openbud duplicate genes in homoelogous chromosomes of tetraploid cotton. Euphytica , 2009, 165: 325- 3319 Zhao L, Cai C P, Zhang T Z, Guo W Z. Fine mapping of the redplant gene R1 in upland cotton ( Gossypium hirsutum ). Chin Sci Bull , 2009, 54(9): 1529- 153310 Gao W(高伟),Liu F(刘方),Li S-H(黎绍惠),Wang C-Y(王春英),Zhang X-D(张香娣),Wang Y-H( 王玉红),Wang K-B( 王坤波). Genetic diversity of allotetraploid cotton based on SSR markers. Acta Agron Sin (作物学报),2010, 36(11): 1902- 1909 (in Chinese with English abstract)11 Scott K D, Eggler P, Seat
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!