生物信息学Biological

动植物全基因组关联分析、eQTL关联定位及基因组选择

全基因组关联分析

全基因组关联研究(Genome-wide association studies, GWAS)在全基因组范围内寻找与动植物重要经济性状相关联的遗传变异,是一种复杂性状功能基因鉴定的分析策略。博奥生物根据目前国内外GWAS发展趋势,推出动植物研究领域GWAS相关的生物信息学分析服务,主要服务内容有:
1 全基因组芯片检测及定制服务(illumina iScan、Affymetrix):包括根据客户提供的数据库信息进行Tag SNP筛选、SNP位点注释、SNP位点评估及探针设计等。
2 根据研究性状类型和样本收集、储备情况,提供实验设计相关的咨询服务
3 数据产出与SNP分型

左图为illumina SNP分型结果聚类图;右图为Affymetrix SNP分型结果聚类图

左图为illumina SNP分型结果聚类图;右图为Affymetrix SNP分型结果聚类图

4 数据质控
(1)样本质控:基于样本call rate对样本进行质控,检验样本性别和重复样本,如果有系谱信息,还可检测样本间的亲缘关系是否正确。
(2)SNP 质控:通过相关分型聚类指标、SNP call rate、最小等位基因频率(MAF)、Hardy-Weinberg 平衡(HWE)检验、非孟德尔遗传错误等指标对SNP进行筛选。
5 基因型填补(Imputation)
基因型填补是基于已有检测位点信息对未进行基因分型的位点进行基因型预测的方法。通过基因型填补,可以整合不同芯片的数据,用于GWAS数据的meta分析;另外,结合高密度SNP芯片数据,通过基因型填补,可将低密度分布的SNP芯片数据填充成高密度的SNP芯片数据。
6 群体分层(Population Stratification)分析:提供基因组控制(genomic control)、结构化关联(structured association)、主成分分析(PCA)、多维标度分析(MDS)、分层分析(stratified analysis)、基于家系的关联研究设计等多种群体结构检验和校正方法。

左图为群体结构的MDS分析结果展示,右图为群体结构的Structure分析结果展示

左图为群体结构的MDS分析结果展示,右图为群体结构的Structure分析结果展示

7 单位点关联分析:针对研究性状的类型(数量性状/质量性状)以及是否存在性别、年龄、批次、群体分层等效应,提供线性回归模型、混合线性模型(MLM)、压缩混合线性模型(compressed MLM)、logistic 回归模型、基于家系的关联分析等多种关联检验方法。同时根据需求提供多种形式的结果图形化展示。

A:全基因组关联分析结果的Manhattan图; B:Q-Q 图;C:区域关联分析图

A:全基因组关联分析结果的Manhattan图; B:Q-Q 图;C:区域关联分析图

8 多重检验校正:可以提供经典Bonferroni校正、基于LD修正的Bonferroni校正、FDR等多种方法的校正。
9 显著位点注释及其附近单体型构建、单体型关联分析

显著SNP附近单体型

显著SNP附近单体型

生物学通路和基因的全基因组关联分析

作为对单位点GWAS分析(最显著SNPs/Genes策略)的一种有益补充,博奥生物也可以提供基于生物学通路和基因的GWAS分析服务。
 
三 eQTL关联定位
整合高通量基因分型和基因表达谱数据,以mRNA或miRNA表达水平为数量性状,定位与基因表达变异相关联的遗传变异位点,进而建立相关的基因调控网络。
 
基因组选择
为了更有效地将全基因组SNP标记信息应用于动植物遗传改良,研究人员提出了基因组选择(Genomic selection,GS)的策略。GS是利用覆盖全基因组的SNP估计基因组育种值(GEBV)进而实现选种的一种标记辅助选择技术。
目前GEBV计算方法包括两种:一种是间接法,即通过在参考群体(Reference population)中估计的所有标记效应间接计算候选群体中个体GEBV(如下图),方法包括岭回归BLUP(Ridge Regression BLUP)、Bayes A、BayesB、Bayes C等;一种是直接法,即通过将SNP标记构建的个体间关系矩阵(G矩阵)加入到混合模型方程组 (MME),直接计算个体GEBV,如GBLUP、TABLUP。博奥生物可以根据具体项目选择适当方案进行基因组选择分析。

间接估计GEBV计算模式示意图

间接估计GEBV计算模式示意图