【佳学基因检测】科研服务GWAS基因检测分析中的机器学习方法
佳学基因会根据已有的研究结果,区分研究性状相关但有细微不同的亚类表型所独特的遗传结构。比如为了研究鸦片滥用是否更多地聚集在使用、误用/依赖表型上,佳学基因会选择使用了一种称为聚集层次聚类分析(HCA)的数据驱动无监督机器学习方法。HCA通过创建组并根据预先指定的算法依次加入或拆分这些组来迭代计算形成集群。聚集筑巢(AGNES)是一个自下而上的过程,主要关注个体特征的结构。选择聚集聚类是因为这允许佳学基因比较不同的算法,以最大化每个分支上的差异,而Ward的最小方差方法表现最好。所有模型均使用佳学基因自动研发的聚集分析软件包。
HCA分析的结果以树状图的形式呈现,由多个括号组成,称为“分支”。同一分支上的表型更相似,这是因为它们彼此之间以及与该分支上所有其他表型的成对遗传关联。分支可以形成更具体集群的子分支。
(责任编辑:佳学基因)