当前位置:首页 > 实验室知识集锦

代谢组学的平台与资源

作者:管理员    出处:佚名    浏览次数:60(2017-4-25)

代谢组学(Metabonomics or Metabolomics)是效仿基因组学和蛋白质组学的研究思想,对生物体内所有代谢物进行定量分析,并寻找代谢物与生理病理变化相对关系的研究方式,是系统生物学的组成部分。其研究对象大都是相对分子质量在1000 Da以内的小分子物质。代谢组学的目的是采用全面和综合的方法了解代谢系统。这得益于各种测量仪器对代谢的研究。代谢物组学的方法使我们能够进行多种代谢产物的平行鉴定和定量分析,值得注意的是,植物代谢组代表着一个巨大的化学多样性系统,这是因为每个植物物种都有一套复杂的代谢物。因此,植物代谢组学会遇到一个大的分析挑战,如果解决了这个难题,代谢组学就能够阐明植物细胞系统。代谢研究能够允许我们进行分子育种,提高抗逆性,并能够生产药品、功能食品、生物材料和能源。

1、研究代谢组学的工具和设备

最近研究代谢的仪器方面有了许多显着的技术进步,代谢组学实验开始于代谢指纹采集。采集方法有气相色谱、质谱、液质联用(LC-MS)法、傅立叶变换质谱、红外光谱和核磁共振等。样品分离的方法有气相色谱(GC)、高性能或超高效液相色谱(UltraPerformance LC)、毛细管电泳等。分离方法通常与各种质谱技术结合在一起使用。

毛细管电泳-质谱联用(CE-MS)是一种特别有效的、高灵敏度的分离和分析样品中极化分子的方法。飞行时间质谱(TOF MS)和四级管质谱(qMS)也非常实用。经实验证实,前者的灵敏度和分辨率都高于后者,具有更好的应用前景。三重四极杆质谱(Triple-Q)质谱和四极杆-飞行时间串联质谱(Q-Tof)也经常使用。不涉及预分离样品的方法,如傅立叶变换离子回旋共振质谱仪(FT-ICR MS,也被使用。

核磁共振为基础的方法也可用于代谢物组学分析。根据样品的溶解度,这些方法大致可分为溶液核磁共振和不溶性或固态核磁共振。使用高分辨率(hr-MAS技术有可能从难溶样品和固态样品中获得代谢指纹。在一维核磁共振(NMR)中,质子(1H)通常被仔细观察(1H-NMR核磁共振氢谱)和更详细地分析,如代谢产物的鉴定或流量分析等,都可以在二维或多维核磁共振分析中通过1H与其它核,尤其是13C15N相结合而获得。

产生的指纹、质谱和核磁共振光谱要进行前处理,包括背景噪声抑制、峰值调整和选择高峰期。前处理数据集随后用于识别代谢物。这些化合物在数据库检索中分别对应每个频谱信号。在非目标分析中,包括对未知化合物的频谱数据集要进行统计分析,如多元分析以挖掘数据的生物学意义。在目标分析中,频谱数据,特别是相关的化合物集被用于进一步分析化合物代谢概况。

数据分析在代谢组学中具有重要的生物学意义。统计分析采用多元分析,如主成分分析等法(PCA)、层次聚类分析(HCA)和自组织映射(SOM)分析等,这通常被用来区分样品和/或代谢物。关于代谢途径代谢的可视化图也常用,并与其它组学方法,包括基因表达谱,特别是参与代谢途径的酶基因表达谱相结合。

2、植物代谢谱

系统收集代谢物是在代谢组学研究的第一步。这一步可以利用各种具有高通量特点的工具完成,如上面提到的那些工具。全面的代谢数据集可以帮助我们理解细胞针对内外环境的变化做出的反应。此外,与代谢相关的表达谱变化可以和基因差异联系在一起,从而鉴定与表型变化相关的基因。

人们目前已经开始进行多种植物物种代谢谱的研究工作,并建立了一些相关的数据库。例如,在拟南芥方面,一个美国国家科学基金会(National Science FoundationNSF)资助的项目最近已开始(http://lab.bcb.iastate.edu/sandbox/pbais05/alpha/plantmetabolomics_trimmed/index.php)。该计划旨在开发植物代谢组学数据库。茄科植物已经有几个可以利用的数据库。番茄的代谢组数据库(Metabolome Tomato DatabaseMoToDB)是基于液相色谱-串联质谱(LC-MS)分析为基础的代谢组数据库(http://appliedbioinfor matics.wur.nl/moto/)。KOMICSKazusa-omics)数据库收集了由 LC-FT-ICR-MS质谱检测代谢物峰得到的信息,包含了番茄栽培品种Micro-tomMicro-Tom番茄植株矮小、生长密度高、生命周期短、容易被高效转化,成为功能基因组学研究的新型模式植物。

Armec Repository计划提供了电喷雾质谱得到的马铃薯代谢组数据(http://www.armec.org/MetaboliteLibrary/index.jsp)。Golm代谢组数据库(GMD)提供了公众可以获取的代谢物的质谱特征,以及其它信息和相关工具 http://csbdb.mpimp-golm.mpg .de/csbdb/gmd/gmd.html)。串联质谱光谱标签数据库(The MS/MS spectral tagMS2T)提供了很多植物的光谱(http://prime.psc.riken.jp/lcms/ms2tview/ms2tview.html)信息。这些数据库作为信息资源具有重要作用。它们也可以作为工具,全面服务于从其它组学研究获得数据的分析或进一步整合

3、代谢组和其它组学资源的综合方法

代谢组学方法也有助于我们理解细胞整体之间的关系,这些方法也和其它组学信息联系,如转录组学、蛋白质组学和基因变异等。结合许多其它组学资源,如目前存在的全基因组序列信息、大规模的转录组数据集、相关的共表达信息、突变体和全长cDNA克隆集合等生物资源,这些综合的方法已成功地体现在拟南芥的研究中。一种系统鉴定代谢相关分子网络的概念性提纲也被提了出来,这也充分利用了转录组和代谢组的分子网络资源信息。在硫和氮元素不足诱导胁迫条件下,利用BL-SOMa batch-learning, self-organizing map)技术对拟南芥转录组和代谢组进行了分析,鉴定出了涉及葡萄糖苷生物合成的基因。

整合代谢组和转录组分析的方法是分析标签激活突变体、过表达MYB转录因子和PAP1基因,以鉴定拟南芥中的涉及花色苷生物合成有关的基因。ATTED-II是一个基于反式因子、微阵列表达谱数据及顺式调控元件预测的针对拟南芥的共调控、共表达基因查询的数据库。该数据库的共表达网络是通过对58个公共可得的58个试验系的数据分析得到的,其中包括1388个微阵列芯片数据、从基因上游200bp区域中预测的调控因子数据,对每一个基因都有直观的表达模式描叙。从ATTED-II获得的拟南芥转录组共表达信息已经用于特定代谢途径相关基因的鉴定,然后又用到了目标基因的突变株代谢组分析。ATTED-II数据库被用来确定在脂代谢相关新基因时,发现了一种新基因-尿苷二磷酸葡萄糖焦磷酸化酶(UDP glucose pyrophosphorylaseUGP3)。UGP3催化硫脂生物合成第一步。共表达分析,也可以用来确定有关黄酮类化合物的合成的基因,从而让人们进一步发现了两个黄酮合成基因-UGT78D3RHM1

代谢组和转录组信息整合的方法也已经用来阐述调控网络。这些网络使植物对外界环境胁迫做出应激反应。拟南芥在寒冷和脱水条件下的代谢途径用代谢组方法进行了分析,具体方法是利用各种质谱技术结合微阵列技术分析过表达的两种转录因子DREB1A/CBF3DREB2A的基因。另外,代谢组学信息也已经被用来鉴定野生拟南芥和敲出9-顺式环氧类胡萝卜素双加氧酶(9-cis-epoxycarotenoid dioxygenase, NCED)基因突变体在脱水条件下的表型变化 ,从而发现了一种脱落酸依赖性的调节网络。

代谢组学信息也已经被用来评估自然变异的化学表型变化或隔离群体的化学表型变化。综合运用代谢组和转录组信息,及其它们之间的联系将有助于我们分析涉及代谢变化的关键基因,还有助于我们找到代谢和表型变化之间的遗传关系。利用分离群体分析代谢的数量性状基因座(QTL)的方法已经用于多种植物,如拟南芥、白杨和番茄等。此外,随着包括再测序等高通量基因分型方法的利用,已经有很多全基因组范围内的变异数据库已经可以利用,这使人们对寻找表型变化和核苷酸序列变异之间的关系更加感兴趣,尤其是那些在进化过程中具有重要作用的基因。试图寻找代谢和基因组多样性之间关联模式的研究最近也被应用于芝麻和水稻等植物中。

4、代谢组学的信息资源

代谢有关的各种信息资源,不仅在代谢组研究,而且在与其它组学数据的协同整合方面的也具有重要作用。位于美国斯坦福的拟南芥信息资源网站(The Arabidopsis Information Resource, TAIR)(http://www.arabidopsis.org/portals/metabolome/index.jsp)是国际上最为权威的拟南芥基因组数据库和拟南芥基因组注释系统,它具有丰富的数据资源和最新的注释信息。拟南芥转录因子数据库DATF的每个条目都有TAIR链接,可以直接查看最新更新信息。

KEGG是日本基因组学网络服务中最基础的数据库,对于更高层次地理解生命具有重大的意义。KEGG包括代谢路径数据库(PATHWAY database)(http://www.genome.jp/kegg/pathway.html),可用于进行研究代谢途径和化合物的分子反应网络。另外,KEGG还提供预测注释基因功能、代谢路径的功能。

GENES database提供产自基因组测序工程的大量的基因或蛋白序列信息。

LIGAND 数据库提供大量细胞活动涉及的化合物结构。除此之外,还有一些有限的源于试验的数据信息,如分别储存于EXPRESSION BRITE 数据库的微阵列基因表达谱数据和酵母双杂交数据。

植物代谢网络(The Plant Metabolic NetworkPMN)是一个合作项目,旨在建立植物代谢途径数据库(http://www.plantcyc.org/)。PlantCyc是它的主要组成成分之一。它包含计算分析的基因信息、酵素信息、化合物信息、反应信息和初级、次级代谢产物的信息(http://www.plantcyc.org:1555/PLANT/server.html),并且可以使用可视化通路工具(http://bioinformatics.ai.sri.com/ptools/)。

AraCycPoplarCyc也是可以利用的植物调节网络网站(Plant Metabolic NetworkPMN)。它们能够提供有关拟南芥和杨树代谢途径的信息。

还有一些代谢途径数据库可以提供其它植物物种的代谢信息,这些数据库由PMN的合作者完成。

MapManPPDBPlant Proteome Database)数 库(http://ppdb.tc.cornell.edu/)所 供的一种工具。它按照蛋白质在生物体代谢途径和生物过程中的功能对基因进行分类,也涉及代谢途径和其它过程(http://mapman.gabipd.org/web/guest)。其原理与GO很相似,都是利用层次分类方式对基因产物进行功能分类。

KaPPA-View是另一个基于Web的分析工具,它可以将转录组和代谢组数据加到植物代谢途径图谱上(http://kpv.kazusa.or.jp/kappa-view/)。

PRIMe是一个基于Web的服务器,它提供了多方面的代谢产物数据集,这些代谢产物来自核磁共振光谱、气相色谱质谱(GC/MS)或液相色谱-串联质谱(LC/MS/MS)和毛细管电泳-质谱(CE/MS)分析。

【关键词】