生物信息学

当前位置:首页 > 生物信息学 > 深层分析

构建预测模型及生物标志物筛选

从庞大的芯片数据中找到一群基因作为Biomarker,并以此构建模型,达到区别不同组织、不同状态、不同类型生物样品的目的,以便于进行早期诊断、疾病预测和预后分析,是生物芯片的一个主要应用方向。利用mRNA、miRNA、lncRNA、DNA methylation、snp等数据,结合样品的组织、类型、药物敏感性、预后等临床信息,使用KNN、LDA、SVM等机器学习方法或Logistic回归对芯片数据进行预测模型的构建,从海量的数据中找出一组合适的Biomarker,并建立最优模型,达到最好的分类预测效果。

通过SVM的方法建立的最优模型达到癌症样品与正常样品之间最好的分类效果

通过SVM的方法建立的最优模型达到癌症样品与正常样品之间最好的分类效果

 

Logistic回归预测模型的ROC曲线[2]

Logistic回归预测模型的ROC曲线(引自:Zhou J et al。 J Clin Oncol ,2011