生物信息学Biological

分子功能注释系统(MAS)介绍

晶芯 生物分子功能注释系统(CapitalBio Molecule Annotation System,MAS)是一个对高通量生物实验数据(如生物芯片实验数据)提供全面生物学功能注释的分析平台系统。系统可处理多个物种的高通量实验数据,具有全面、快速、准确、直观等特点,是目前国内唯一免费的大型综合性生物数据整合查询系统,登陆网址(http://bioinfo.capitalbio.com/mas3/),您只需简单的注册,我们会将激活链接发到您的注册邮箱。

MAS 将目前多种生物信息学公共数据库中的注释相关信息相整合,提供包括基因、蛋白、功能、表达、蛋白相互作用、信号转导、调控、疾病、甲基化等生物学信息,有助于用户了解表达基因之间的相互关系。MAS 系统是使用者深入挖掘和理解高通量实验数据生物学意义的有力工具,此外,它还支持多种查询方式,提供图形化的显示结果。

多生物学数据库支持--目前整合的数据库通用类有GenBank、RefSeq、EMBL、UniProt、Ensembl,功能类有Gene Ontology、KEGG、BioCarta、GenMap,物种类有HUGO、MGI、RGD、JGI、WormBase、FlyBase、SGD、TIGR,专业类有mirBase、EPD、HPRD、 MIND、DIP、intAct 、TRANSFAC、UniGene、OMIM、InterPro等共27个权威生物学数据库。

多生物分子类型支持--目前支持来自27个不同数据库德50余种生物分子的identifier的输入查询,满足不同研究方向用户的查询需求。

多物种支持--目前已收录的物种包括:人、大鼠、小鼠、牛、家猪、鸡、恒河猴、斑马鱼、果蝇、家蚕、线虫、拟南芥、大豆、苜蓿、玉米、水稻、杨树、西红柿、大肠杆菌、酵母等21种,并且支持的物种数量在持续增加中。

mas

图 1 可确保良好用户体验的科学合理的系统架构

数据库在线查询访问方式--当用户研究大量的差异表达基因时,若逐个基因去查找文献将是一件非常累人的工作,并且还难以从总体上把握这些变化基因的内在联系。建议这些差异基因输入博奥在线 MAS 分析系统,先对这些变化的基因进行批处理,分析出变化基因所在 pathway 的富集程度、基因按照功能分类的富集度、基因功能分类、是否存在共表达的基因、是否可能受到 microRNA 的调控等等信息后,再重点研究以上批处理结果中最感兴趣的部分。以下为MAS 系统核心数据库查询访问方式流程图。

mas2

图2 MAS核心数据库访问查询方式图

功能分析和基因注释--MAS系统根据整合的不同数据库信息,对基因、蛋白或序列进行注释,并可以根据基因的序列信息,进行功能预测。mas

图3 功能分析和基因注释常用数据库

miRNA关联分析--对于特定的 miRNA,预测其作用的靶标 mRNA;或者对于特定的 mRNA 推测可能会调控该基因的 miRNA。

共表达分析--默认假定有4个基因共同定位在1Mb的染色体片段上,这些基因的转录起始位点可能相邻,甚至可能共用相同的转录起始位点,由系统分析结果可以帮助用户寻找表达差异基因中在空间位置上是否存在共表达基因。

mas4

图 4 表达差异基因中在空间位置上是否存在共表达基因