生物信息学Biological

人类全基因组拷贝数变异分析

全基因组拷贝数变异(Copy Number Variant)分析是通过比较疾病样品和对照样品在全基因组上的拷贝数情况,在基因组结构层面寻找和疾病相关区域,并进一步确定致病基因或疾病抑制基因。随着检测技术的发展,在拷贝数水平上寻找疾病相关区域开始普及。博奥生物对此方面研究走在国内前沿,已有丰富的经验,现推出相关生物信息服务内容:

1)根据疾病特点及样本类型,提供研究设计咨询服务;

2)样品质控:基于分型结果计算性别及样品间分型一致率,核对样品性别、检验样品是否存在血缘关系,观察样品是否污染等;

3)数据预处理:采用合适的归一化方法对数据进行预处理,减少噪音;

4)计算每个样品在每个位点的拷贝数,并基于样品的拷贝数结果,利用非监督聚类分析、主成分分析(PCA)等,观察样品间的关系;

7

13个样品基于1号染色体拷贝数变异情况的聚类图

5)配对拷贝数分析根据指定的配对方式,用Genomic Segmentation与Hidden Markov Model方法进行拷贝数分析。基于识别出的CNV区域,找出在指定的样品中共同出现的CNV区域;

6)非配对拷贝数分析:使用指定的对照用Genomic Segmentation与Hidden Markov Model方法识别拷贝数变异区域。基于识别出的CNV区域进行关联分析;

7

左图为某个体上检测到的CNV在基因组的分布情况;右图为特定染色体上CNV展示图

7)基于等位基因的拷贝数(allele specific Copy Number)分析:计算每个等位基因的拷贝数,识别等位基因不平衡区域;

8)杂合子缺失(LOH)分析:通过和对照样品比较,识别每个样品的杂基于芯片上对SNP探针的检测数据,分析每个样品的LOH区域,并结合该区域CNV数据,将LOH分为伴有CN增加的LOH、伴有CN减少的LOH以及拷贝数中性(Copy-Neutral)LOH。

8

A:LOH伴有CN减少;B:LOH伴有CN增加

9)变异区域注释:用MAS软件查询变异区域上的基因及其对应的promoter、mRNA、miRNA、GO、pathway信息。