资源描述
代谢组学-方法与应用,1,“基因组学反映了什么是可以发生的,转录组学反映的是将要发生的,蛋白质组学指出了赖以发生的,只有代谢组学才真正反映业已发生的。” 许国旺,2,第一章 代谢组学的简介 第二章 代谢组学的研究方法第四章 代谢组学的应用第五章 代谢组学的发展前景,3,组学时代4种最重要的组学,4,代谢组学(Metabonomics/ Metabolomics )是通过考察生物体系(细胞、组织 或生物体)受刺激或扰动后(如将某个特定的基因变异或环境变化后),其代谢产物的变化或其随时间的变化,来研究生物体系的一门科学。代谢组(metabolome)是基因组的下游产物也是最终产物,是一些参与生物体新陈代谢、维持生物体正常生长功能 和生长发育的小分子化合物的集合,主要是相对分子量小于1000的内源性小分子。代谢物数量因物种不同而差异较大: 植物(200 000种)、动物(2500种)、微生物(1500种),5,代谢组学是继基因组学和蛋白质组学之后新近发展起来的一门学科,是系统生物学的重要组成部分。基因组学和蛋白质组学分别从基因和蛋白质层面探寻生命的活动,而实际上细胞内许多生命活动是发生在代谢物层面的,如细胞信号释放(cell signaling),能量传递,细胞间通信等都是受代谢物调控的。代谢组学正是研究代谢组(metabolome)在某一时刻细胞内所有代谢物的集合的一门学科。基因与蛋白质的表达紧密相连,而代谢物则更多地反映了细胞所处的环境,这又与细胞的营养状态,药物和环境污染物的作用,以及其它外界因素的影响密切相关。因此有人认为,“基因组学和蛋白质组学告诉你什么可能会发生,而代谢组学则告诉你什么确实发生了。”(Bill Lasley, UC Davis),6,第一章 代谢组学简介代谢组学的发展,7,代谢组学的特点: 关注内源化合物 对生物体系的小分子化合物进行定量定性研究 上述化合物的上调和下调指示了与疾病、毒性、基因修饰或环境因子的影响 上述内源性化合物的知识可以被用于疾病的诊断和药物筛选与转录组学和蛋白组学相比,代谢组学有以下优点: 基因与蛋白质表达的微小变化会在代谢物上得到放大,从而使检测更容易 代谢组学的研究不需要建立全基因测序及大量序列标签(EST)的数据库 代谢物的研究种类远小于蛋白质的数目 研究中采用的技术更通用,8,Genomics and Proteomics are not sufficient to describe reasons for toxicity or disease state基因组学和蛋白组学对于毒性或疾病状态的描述是不足的Neither Genomics nor Proteomics can produce time course information which is important for animal to animal comparison基因组学和蛋白组学都不能提供动态信息,但这些信息对于动物间的比较是重要的Metabolite profiling produces information on the biochemical pathways effected代谢物分析能提供生化途径结果的信息Monitoring metabolites allows concurrent or sequential affects to be monitored, e.g. blocking of a metabolic pathway in the liver can lead to toxicity in the brain (hydrazine)代谢监控可监控即时或相继的结果,例如:阻断肝脏中代谢途径会在脑中产生毒性肼Metabonomics, unlike the other “omics” is non-invasive不像别的组学研究,代谢组学是无创的,The Need for Metabonomic Information,9,代谢组学研究现状代谢组学属于全局系统生物学(Global systems biology)研究方法,便于对复杂体系的整体进行认识譬如,一个正常工作的人体包括“人体”本身和与之共同进化而来且共生的消化道微生物群体(或称菌群),孤立地研究“人体”本身的基因,转录子以及蛋白质当然可以为人们认识人体生物学提供重要信息,但无法提供使人体正常工作不可缺少的菌群的信息人体血液和尿液的代谢组却携带着包括菌群在内的每一个细胞的信息,因此代谢组学方法对研究如人体这样复杂的进化杂合体十分有效,10,不同器官组织具有不同的代谢轮廓,广谱全采集,11,代谢组学已经广泛地应用到了包括药物研发,分子生理学,分子病理学,基因功能组学,营养学,环境科学等重要领域.在代谢组学诞生后的6年里,有关代谢组学的研究论文和专利以指数的形式逐年增长.,12,代谢组学与系统生物学系统生物学概念的诞生标志着研究哲学由“还原论“向“整体论“的变化.系统生物学的中心任务就是要针对生物系统整体(无论它是生物细胞,多细胞组织,器官还是生物整体),建立定量,普适,整体和可预测(QUIP)的认知.具体而言,系统生物学研究就是要将给定生物系统的基因,转录,蛋白质和代谢水平所发生的事件,相关性及其对所涉及生物过程的意义进行整体性认识,从而出现了许多的“组“和“组学“的新概念.,13,现已提出的一百多个“组“和“组学“,可以大体归纳为“基因组“/“基因组学“,“转录组“/“转录组学“,“蛋白质组“/“蛋白质组学“和“代谢组“/“代谢组学“四个方面.显而易见,DNA,mRNA以及蛋白质的存在为生物过程的发生提供了物质基础(但这个过程有可能不发生!),而代谢物质所反映的是已经发生了的生物学事件.因此代谢组学是对一个生物系统进行全面认识的不可缺少的一部分,是全局系统生物学(global systems biology)的重要基础,14,第二章 微生物代谢组学的研究方法Challenges of Metabonomics Sample Complexity and Data Handling,Each sample has,a wide range of compound classesa wide variation in metabolite concentrationsa large number of potential components,Each group of samples has,many sample analyses are required for statistical relevancea complex raw dataset that needs to be processeddifferences between sample groups which need to be highlighted,15,代谢组学(metabonomicsmetabolomics)是效仿基因组学和蛋白质组学的研究思想,对生物体内所有代谢物进行定量分析,并寻找代谢物与生理病理变化的相对关系的研究方式,是系统生物学的组成部分。其研究对象大都是相对分子质量1000以内的小分子物质。先进分析检测技术结合模式识别和专家系统等计算分析方法是代谢组学研究的基本方法。,16,代谢组学利用高通量、高灵敏度与高精确度的现代分析技术,动态跟踪细胞、有机体分泌出来的体液中的代谢物的整体组成,借助多变量统计方法,来辩识和解析被研究对象的生理、病理状态及其与环境因子、基因组成等的关系。“代谢组学”是一种整体性的研究策略,其研究策略有点类似于通过分析发动机的尾气成分,来研究发动机的运行规律和故障诊断等的“反向工程学”的技术思路。由于代谢组学着眼于把研究对象作为一个整体来观察和分析,也被称为“整体的系统生物学”。,17,研究方法和步骤样品制备:足量的代表性样品(-80保存)2.数据采集和标志物识别:常用色谱-质谱联用 、NMR3.数据分析: PCA、 PLS、 ANN4.代谢途径分析:代谢轮廓分析和代谢组学分析,18,The strategy for large scale metabonomics research,19,样品制备微生物代谢物样品的制备一般分为微生物培养、淬灭和代谢产物的提取。根据研究对象、目的和采用的分析技术不同,所需的样品提取和预处理方法各异,不存在一种普适性的标准化方法。微生物代谢组学研究要求微生物的生长条件是可以控制和重复的。在一个生物反应器中,需要严格控制温度、pH、培养基组成、溶解氧和二氧化碳等以明确界定生长条件,建立标准的和可重复的参考培养条件。微生物的培养可以以分批、补料或者连续培养模式进行。由于连续培养的菌体生理稳定,易于控制且重现性较好,所以,大多数研究者倾向于应用生物反应器连续培养操作模式。,20,在样品淬灭和代谢物的提取过程中,应遵循的原则是:(1)淬灭工艺最好可以立即冻结细胞代谢 (2)在淬灭过程中要求细胞膜无明显损伤,以免胞内代谢物外泄。 (3)提取过程中应该尽可能多的提取胞内代谢物。 (4)代谢产物不应该遇到任何物理或化学修饰。 (5)得到的样品基质应与所选择的分析方法相容。冷甲醇、液氮和热乙醇是最常用的淬灭方法,而在提取方面由于特定的提取条件往往仅适合某些类化合物目前尚无一种能够适合所有代谢产物的提取方法应该根据不同的化合物选择不同的提取方法,并对提取条件进行优化。,21,对获得的样品中所有代谢物进行分析鉴定是代谢组学研究的关键步骤,也是最困难和多变的步骤。与原有的各种组学技术只分析特定类型的物质不同,代谢组学分析对象的大小、数量、官能团、挥发性、带电性、电迁移率、极性以及其他物理化学参数差异很大,要对它们进行无偏向的全面分析,单一的分离分析手段往往难以保证。色谱、质谱、核磁共振、红外光谱、库仑分析、紫外吸收、荧光散射、发射性检测和光散射等分离分析手段及其组合都被应用于代谢组学的研究。,22,23,一般来说,选择代谢物组学分析方法时,其原则是要同时考虑仪器和技术的检测速度、选择性和灵敏度,找到一种最适合目标化合物的方法。 化学分析技术中最常用的是1H核磁共振(1HNMR)以及色谱质谱联用(X-MS),如气相色谱耦联质谱(GC/MS)、液相色谱耦联质谱(LC/MS)和毛细管电泳耦联质谱联用技术 (CE/MS)来分析研究代谢物并为其绘制图谱。这些技术的耦联可以提高对样品的分辨率、敏感性及选择度,有利于对更多的生物体系内的代谢物绘制图谱。,24,GC/MS 、LC/MS和CE/MS 可以同时检测出数百种化合物,包括糖类、有机酸、氨基酸、脂肪酸和大量不同的次生代谢物 。GC/MS有很好的分离效率且相对较为经济,但需要对样品进行衍生化预处理,这一步骤会耗费额外的时间,甚至引起样品的变化。受此限制,GC/MS 无法分析膜脂等热不稳定性的物质和分子量较大的代谢产物。 近来,多维分离技术如二级气相色谱飞行时间质谱(GC-GC-TOF-MS),检测范围更广,但由于实际应用困难和花费较高等问题使其并未普遍使用。,25,HPLC 与 GC 原理相似,但在进样前不需进行衍生化处理,适合那些不稳定、不易衍生化、不易挥发和分子量较大的化合物。HPLC/MS 选择性和灵敏度都较好,但分析的时间相对较长,且需依赖纯的参照物。CE-MS分离样品效率比普通的色谱质谱联用要高得多,仅需要极少的进液量nL),而且其测试时间短,试剂成本低。CE-MS在微生物代谢组领域发挥着越来越重要的作用。色谱质谱连用技术具有分离效率高、灵敏度好及经济实用等优点。但需要解决的主要问题是:大量色谱峰的识别问题以及方法的重现性问题。,26,NMR是当前代谢组学研究中的主要技术首先,不同于质谱具有离子化程度和基质干扰等问题,NMR 没有偏向性,对所有化合物的灵敏度是一样的;其次,NMR 无损伤性,不破坏样品的结构和性质,可在接近生理条件下进行实验,可在一定的温度和缓冲液范围内选择实验条件,可以进行实时和动态的检测;此外,NMR 氢谱的谱峰与样品中各化合物的氢原子是一一对应的,所测样品中的每一个氢原子在图谱中都有其相关的谱峰,图谱中信号的相对强弱反映样品中各组分的相对含量,更为直观 。因此,NMR 方法很适合研究代谢产物中的复杂成分。与 GC/MS 和 LC/MS 相比, NMR 的缺点是灵敏度低,有可能形成信号重叠,且其对样品制备的要求很高。同时因为动态范围有限,很难同时测定生物体系中共存的浓度相差较大的代谢产物。,27,数据分析平台 在代谢组学研究中,大多数是从检测到的代谢产物信息中进行两类(如基因突变前后的响应)或多类(如不同表型间代谢产物)的判别分类以及生物标记物的发现。由于生物样品的组成复杂,在得到分析对象的原始谱图后,首先需要对数据进行预处理(归一化和滤噪),消除干扰因素,保留有用信息。数据的解析可分为如下3个基本步骤: (1)提取出色谱分离后未能有效分开的代谢物峰并得出其相应浓度; (2)根据其保留时间及质谱图等信息鉴别有效峰所代表的化合物; (3)根据代谢数据建立代谢网络模型。,28,代谢组学分析得到的是信息含量丰富的多维数据,应用模式识别和多维统计分析等方法能从这些大量的数据中充分挖掘出其中的信息,这些方法能够为数据降维,使它们更易于可视化和分类。目前数据分析常用的两类算法是基于寻找模式的非监督方法 (unsupervised method) 和有监督方法 (supervised method)。 非监督方法 是用来探索完全未知的数据特征的方法,对原始数据信息依据样本特性进行归类,把具有相似特征的目标数据归在同源的类里,并采用相应的可视化技术直观地表达出来。应用在此领域的常见方法有聚类分析 (cluster analysis) 和主成分分析 (principal components analysis,PCA) 等。,29,聚类分析依据物以类聚的原理分析具有相似性的事物,将分类对象置于一个多维空间中,根据事物彼此不同的属性进行辨认,将性质相近的归入一类,这样归在同一类的事物具有高度的相似性;聚类分析就是把事物按其相似程度进行分类,并找出每一类事物共同特征的分析工具。具体到代谢组学中,被归入一类的物质有相同的特征,可能有相同的功能作用,这样通过同一类事物中一个研究较为清晰的物质可以推断该类中其他物质的功能作用。聚类分析过程通常可分为以下步骤:数据收集并且收集相应的变量;产生一个相似矩阵;决定把目标总体细分为几类,及其对每一种类别相应的定义;实施聚类分析,产生结果。,30,主成分分析是目前应用最为广泛的多维分析方法之一。PCA 的特点是将分散在一组变量上的信息集中到某几个综合指标,即主成分 (principal component,PC) 上,利用这些主成分来描述数据集内部结构,实际上也起着数据降维的作用。主成分是由原始变量按一定的权重经线性组合而成的新变量。这些变量具有以下性质:1)每一个 PC 之间都是正交的;2)第1个 PC 包含了数据集的绝大部分方差,第2个次之,依此类推。这样,由头2个或3个 PC 作图,就能够很好地代表数据集所包含的生物化学变化,31,有监督方法 如果存在一些有关数据的先验消息和假设,有监督方法比非监督方法更适合且更有效。有监督方法在已有知识的基础上建立信息组 (class information),并利用所建立的组对未知数据进行辨识、归类和预测。在这类方法中,由于建立模型时有可供学习利用的训练样本,所以称为有监督学习。应用于该领域的常见方法有线性判别分析 (linear discrimination analysis)、偏最小二乘法-显著性分析 (PLS-discrimination analysis) 和人工神经元网络 (artificial neural networks,ANN),32,网上数据库 在信息时代,代谢组学的分析离不开各种代谢途径和升华数据库,利用网络资源进行研究是必不可少的,与基因组学和 蛋白组学已有较完善的数据库供搜索使用相比,目前代谢组学研究尚无类似的功能完备数据库。 DOME (http:/medicago.vbi.vt.edu/dome.html) 有许多关于代谢物的原始数据和分析结果,分析结果用多维统计软件处理后可用于 OMEs 的浏览器 (BROME) 浏览。 MetaCyc (http:/metacyc.org) 是一个关于代谢物的数据库,阐述了超过150种生物体中的代谢途径,包含了从大量的文献和网上资源中得到的代谢途径、反应、酶和底物的资料。 MMP (http:/www.chem.qmul.ac.uk/iubmb/enzyme) 对主要代谢途径及涉及的关键酶进行了详尽的描述。 ArMet (http:/www.armet.org) 是一个涵盖大部分植物代谢组学研究工作的网站,包含了这些工作开展的时间,甚至还有详细的实验步骤,并将代谢物信息标准化,以便于研究者交流。,33,第三章 代谢组学的应用,代谢组学在微生物领域的应用 (一)微生物分类,突变体筛选以及功能基因研究经典的微生物分类方法多根据微生物形态学以及对不同底物的代谢情况进行表型分类。最近,随着分子生物学的突飞猛进,基因型分类方法如16SrDNA测序,DNA杂交以及PCR指纹图谱等方法得到了广泛应用。然而,某些菌株按照基因型与表型两类方法分类会得出不同的结果。因此,根据不同的分类目的联合应用这两类方法已成为一种趋势。BIOLOG等方法在表型分类中应用较为广泛,但是,代谢谱分析方法(metabolic p rofiling)异军突起,逐渐成为一种快速、高通量,全面的表型分类方法。,34,采用代谢组分类时,可以通过检测胞外代谢物来加以鉴别。常用的胞外代谢物检测方法为样品衍生化后进行GC2MS分析、薄层层析或HPLC2MS分析,最后通过特征峰比对进行分类。Bundy等采用NMR分析代谢谱成功地区分开临床病理来源以及实验室来源的不同杆菌(bacillus cereus)。除了表型分类外,代谢组学数据可以应用于突变体的筛选。在传统研究中的沉默突变体(即未发生明显的表型变化的突变体)内,突变基因可能导致了某些代谢途径发生变化,通过代谢快照(metabolic snap shot)可以发现该突变体并研究相应基因的功能。,35,(二)发酵工艺的监控和优化 发酵工艺的监控和优化需要检测大量的参数,利用代谢组学研究工具可以减少实验数量,提高检测通量,并有助于揭示发酵过程的生化网络机制,从而有利于理性优化工艺过程。Buchholz等采用连续采样的方法研究了大肠杆菌在发酵过程中的代谢网络的动力学变化。他们在葡萄糖缺乏的培养液培养的大肠杆菌中加入葡萄糖,并迅速混匀,按每秒45次的频率连续取样。利用酶学分析、HPLC/LC2MS等手段监测样品中多达30种以上的代谢物、核苷以及辅酶,从而解析了葡萄糖以及甘油的代谢途径和底物摄取体系。通过统计学分析建模,发现在接触葡萄糖底物后的1525s范围内,大肠杆菌体内发生的葡萄糖代谢物变化与经典生化途径相符,但随后的过程则与经典途径不符,推测可能存在新的未知调控步骤。Takors认为,通过上述代谢动力学研究,掌握代谢途径及网络中的关键参数,将直接有利于代谢工程的优化,包括菌株的理性优化以及发酵参数的调控。,36,(三)环境微生物研究 微生物降解是环境中去除污染物的主要途径。深入了解污染物在微生物内的代谢途径,将有助于人们优化生物降解的条件,从而实现快速的生物修复。这些代谢中间体大都通过萃取、分析方法进行逐个研究,并借助专家经验拟合出代谢途径,其动力学过程亦很少触及。代谢组学方法的采用有可能改变这一现状。Boersma等采用代谢组学方法研究氟代酚的微生物降解途径。氟代化合物具有特殊的19F核磁共振属性,19F的核磁共振灵敏度与1H核相近;由于生物体内无内源性19F核磁信号,因而无本底干扰。所有19F核磁信号均可归结于异生素及其代谢物。19F核的化学位移值宽,约为700ppm(1H为15ppm,13C为250ppm)。较宽的化学位移导致19 F在不同取代物的峰图不易产生重叠。因此,借助核磁共振技术可以更方便地研究含氟化合物的代谢中间体。,37,代谢生物学在药物研发和疾病研究中的应用代谢组学在疾病动物模型的确证、药物的筛选、药效及毒性评价、作用机制和临床评价等方面有着广泛的应用。Nicholson 研究小组利用NMR代谢组学技术,在药物毒性评价方面开展了深入研究,结果表明代谢组学方法可判断毒性影响的组织器官极其位点,推测药物相关作用机制确定与毒性有关的签字生物标志物;变在此基础上建立棵供毒性预测的专家系统及毒物影响动物内源性代谢物随时间的变化轨迹。代谢组学在疾病的研究中的应用主要包括病变标志物的发现、疾病的诊断、治疗和愈后的判断。目前报道较多在疾病研究的应用,如新生儿的代谢紊乱、冠心病、膀胱炎、高血压和精神系统疾病等。,38,Nicholson及其工作组发现了给予氨基半乳糖的大鼠可以被分为有反应和无反应两组,而这两组动物可以根据它们在给药前的尿代谢物来区分,他们第一次提到药物代谢组学的概念,并将其定义为“根据用药前代谢产物的特点来预测对个人进行药物或外来物的干预的结果”。,39,NMR Acquisition and Gilson 215 Control System,NMR flow probe,N2 gas,Varian Inova 600 Shielded magnet 120 ul flow probe,Gilson 215 autosampler,Biomek Robot,Refrigerated Metabolism Cage (0o C.),Frozen Storage,+ NaN3,Deuterated Buffer,TSP,Data Processing,40,Synthesis,Efficacy/HTS,Efficacy/In Vivo,Lead,TOX,IND,P1,P2,P3,Metabonomics in Drug Development,Preclinical EfficacyBiomarkers,Preclinical SafetyBiomarkers and Mechanisms,Rapid ThroughputTox Screening,Clinical Efficacy Biomarkers,Clinical SafetyBiomarkers,PreLead Prioritization,Development Timeline (Not to Scale),41,42,代谢组学在植物研究中的应用植物代谢组学研究大多集中在代谢轮廓或代谢指纹图谱上。根据代谢对象的不同,植物代谢组学的研究主要包括: 1.某些特定种类植物的代谢组学研究。 2.不同基因型植物的代谢学表型研究。 3.某些生态型植物的代谢组学。 4.受外界刺激后植物自身的免疫应答。代表性研究工作:利用代谢产物进行分类、鉴别和寻求植物代谢过程中的关键基因。,43,代谢组学与中医药现代化中药成分复杂,数量和质量制约因素多,作用机制不明,毒性和不良反应认识不足,研究水平低,这些因素严重影响了中医药的发展,不能为西方社广泛接受。代谢组学的核心是研究外源性物质对生物体所产生的整体效应。用它研究对机体所形成的内源性代谢组的系统作用时,其研究方法与中医药治疗疾病的整体观念相一致,用其研究中药,对中药的药效作用物质基础、产生毒副作用的物质基础,正确认识用药剂量和疗程、防止毒性反应都有重要意义。中药代谢与肠道菌群密切相关,了解肠道菌群的基因组对中药汤剂的毒性和有效性的反应调节机制,可能会开发出一种突破性的治疗方法调节人体菌群治疗疾病。,44,代谢组学的问题和展望庞大数据的处理问题如何建立合理有效的数据分析平台 数据的解释问题如何判断代谢组分析结果与基因的表达或阻遏的对应 低浓度代谢物的分析如何富集低浓度代谢物而不引起试验误差 代谢组学和其它组学的拟合 商品化的数据软件和图谱库缺乏、不完善 细胞代谢的瞬时状态较难反映代谢组学的发展仍处于初始阶段,在方法学和应用两方面均面临极大的挑战,需要其他学科的配合和交叉。全组分分析和动态分析将不断发展,非歧视性检测尚待时日;能否从大量代谢产物中找出特异性生物标志物决定了此技术能否在广泛应用的重要因素,不同代谢组学的整合建成的网络图对于快速识别早期标志物及生理过程的关键组分非常有用。应用方面,代谢组学要想生存发展,必然要有特色,要从表形入手回答其他组学不能回答的生物问题。,45,
展开阅读全文