生物信息学Biological

Pathway和GO功能分析及显著性判断

晶芯生物分子功能注释系统(CapitalBio Molecule Annotation System,MAS)对筛选到的目标基因群进行Go、Pathway注释以及统计分析等。注:对于该系统的使用,博奥免费负责培训。 

一、Pathway功能分析及显著性判断

MAS 系统整合了来源于KEGG、BioCarta和GenMAPP三个公共Pathway数据库的信息,可分析差异基因所在Pathway,以及某个Pathway中基因富集度的显著性水平。通过统计分析,选择合适的计算方法计算通路显著性p-value。在实际的分析中,我们也关注以某个p-value阈值筛选后得到的pathway的假发现率,以q-value衡量。

 

图片31

Pathway功能分析

二、 Pathway 中基因相关性分析

根据每两个基因共出现在同一pathway中的次数统计,绘制基因共相关点线图,进而得到不同 pathway 上基因的关联情况。

图片26

Pathway 间基因关联图

三、KEGG图片中展示基因的上下调关系

直观的展示出某些基因在通路图中的变化关系,便于了解某一同路中基因的可能的相互作用关系

图片27

KEGG通路图

 四、多组数据的pathway统计结果聚类分析

该分析便于揭示和比较不同处理对样品信号通路的影响。

图片28

对Pathway的聚类分析

五、GO功能及富集度分析

GO(Gene ontology)注释收集了来源于 Gene ontology(www.geneontology.org/pub/go/gene-associations)和NCBI(www.ncbi.nih.gov/gene/data/GO(Gene ontology))数据库的信息,按照生物途径(Biology Process),分子功能(Molecular Function)和细胞定位(Cellular Location)对基因进行注释和分类。通过对差异表达基因进行GO terms富集度统计学的分析,计算出差异基因GO term的p-value和p-value的FDR值(q-value),定位差异基因最可能相关的GO term。对生物模型中变化的基因功能进行整体的把握。同时可以绘制与输入蛋白相关的GOterm 的丰度统计饼图、p-value聚类热图、GO-蛋白网络图以及GO中蛋白富集度p-value在GOterm树的关系图等。

图片29

GO mapping

图片30

Protein-GO网络