生物信息学Biological

动植物群体遗传学分析

以全基因组范围DNA序列变异SNP为基础进行群体遗传学研究是最近兴起的一个新思路, 博奥生物根据目前国内外群体遗传学发展趋势,推出了动植物研究领域群体遗传学相关的生物信息学分析服务,主要服务内容有:

1 全基因组芯片检测及定制服务(illumina iScan、Affymetrix):包括根据客户提供的数据库信息进行Tag SNP筛选、SNP位点注释、SNP位点评估及探针设计等。
2 根据研究物种和群体情况,提供实验设计相关的咨询服务
3 遗传结构评估:在全基因组范围内挑选适合的SNP, 综合采用多维标度分析(MDS)、主成分分析(PCA)、基于贝叶斯模型聚类等多种方法进行遗传结构分析,推定群体可能的亚群数、个体分属以及是否存在混合(admixture)。遗传结构Structure

遗传结构Structure

4 全基因组连锁不平衡特性分析:连锁不平衡(linkage disequilibrium, LD),即基因组上两个或多个基因座上等位基因的非随机相关。LD程度有多种度量指标,其中D’和r2最常用。LD衰减程度与间接关联定位基因的精度密切相关:LD衰减速度慢则定位粗略,衰减速度快则定位精细。因此,对群体LD特性的分析,有助于开展基因定位和关联分析研究。下图展示了某物种在全基因组范围内LD随物理距离衰退的图谱。

全基因组范围内LD随物理距离衰退的图谱 [1-2]

全基因组范围内LD随物理距离衰退的图谱 [1-2] 

5 有效群体大小估计:有效群体大小(effective population size,Ne)指与实际群体有相同基因频率方差或杂合度衰减率的理想群体含量,它决定群体平均近交系数增量的大小, 可反映群体遗传结构中基因的平均纯合速度, 是群体遗传学研究的一个重要内容。对Ne的研究有助于更清楚地了解群体的遗传变异、进化和复杂性状的遗传机制。随着高密度SNP标记的出现,越来越多的研究利用SNP间连锁不平衡估计Ne。我们针对不同长度染色体片段的连锁不平衡程度计算不同世代的有效群体大小。下图展示了估计的某物种的Ne变化趋势。

某物种Ne变化趋势 [3]

某物种Ne变化趋势 [3]

 
6 遗传多样性评估:提供分子方差分析(AMOVA),多态信息含量(PIC)、期望杂合度(He) 、观察杂合度(Ho)、Wright’s F-统计量、等位基因丰富度(Ar)、核苷酸多样度(∏)、私有等位基因丰富度(pAr)等多种遗传多样性评价指标的计算。
7 选择信号检测:在进化、驯化和现代育种过程中,动植物基因组会受到选择,发现受选择区域的重要功能基因,将对性状改良起到推动作用。根据群体遗传学理论,由于选择偏好的存在,与选择有关的有利基因会表现出与其他中性突变基因不同的变异模式,通常表现为某些DNA片段多态性的降低,而根据基因组信息可以对这种差异—选择信号(Selection Signature)进行检测。针对高密度的SNP标记,目前已发展出多种方法对基因组范围选择信号进行检测,如基于FST、PIC、CLR、EHH、iHS等的多种检验方法。
上图为基于FST的选择信号检测;下图为平滑后的选择信号图形 
上图为基于FST的选择信号检测;下图为平滑后的选择信号图形
  
8 系统进化树构建:主要以距离矩阵法、最大简约法、最大似然法三种方法构建系统发育树,其中距离矩阵法包含平均连接聚类法(UPGMA法)、Fitch-Margoliash 法 (FM法)、邻接法(NJ法)三种方法。 
1. Gibbs R.A.et al. Genome-wide survey of SNP variation uncovers the genetic structure of cattle breeds. Science, 2009, 324(5926): 528-532.
2.Lam H.M. et al. Resequencing of 31 wild and cultivated soybean genomes identifies patterns of genetic diversity and selection. Nature Genetics, 2010, 42: 1053-1059 .
3.Lu D. et al. Linkage disequilibrium in Angus, Charolais, and Crossbred beef cattle. Frontiers in Genetics, 2012, 3: 152.
4.Jiao Y. et al. Genome-wide genetic changes during modern breeding of maize. Nature Genetics, 2012, 44: 812-815.
5.Zhao K. et al. Genomic diversity and introgression in O. sativa reveal the impact of domestication and breeding on the rice genome. PLoS ONE, 2010, 5(5): e10780.