【佳学基因检测】GWAS基因检测的分析流程
全基因组关联分研究教程导读:
在人类基因信息解码的知识体系中,全基因组关联研究常用来识别在人群中广泛存在的基因突变序列或者是基因变体对某一特定性状产生的关联性。在此基础上,全基因组关联研究演变为不同的形式。佳学基因在此对这一分析方法进行介绍,以便三甲医院的医生及研究生可以在佳学基因获得全基因组范围的单核苷酸多态性分析后,进一步建立所研究的疾病与特定基因的多态性位点之间的相关性。通过提供理论背景和实践经验,佳学基因的目标是让研究人员更容易获得 GWAS,而无需在该领域接受正式培训。本教程无法涵盖GWAS研究的各种形式,但是可能从佳学基因的其他技术文章中得到更详细的了解。除了标准 GWAS 的说明外,佳学基因分型基因检测数据还可以进行多基因风险评分 (PRS) 分析。多基因风险评分 (PRS) 分析的目的不是识别单个 SNP,而是汇总来自整个基因组 SNP 的信息,以提供个体水平的遗传风险评分。
GWAS基因解码体系的基本要求:
全基因组关联研究(GWAS),GitHub,PLINK,多基因风险评分(PRS),教程
GWAS简单介绍:
随着基因测序技术的快速进展,先是人类获得了人类基因组的一个草图,在2022年,更完整的人类基因组全部序列也被获取,这为基因检测建立了一个可以开始使用的参照基因组数据库。但是基因与人体疾病表征、个性特点、精神心理方面的特质之间的关系却未能得到充分的阐释。而随着候选基因、基因解码技术的应用,基因测序带来的TRIO数据在帮助获得遗传病的致病基因突变方面变得清晰而直接,但是在微效性基因位点、多基因位点相互作用及基因与环境相互作用方面的基因序列的揭示方面却处于一个难以重复不同基因解码团队研究结果的状态。同时,人们越来越关注研究遗传风险因素对人类行为变化的影响。进行基因研究所需的技术和分析工具变得越来越容易获得。这种增加的可及性提供了巨大的希望,因为遗传学领域以外的研究人员可能会为该领域带来新的专业知识(例如,对精神病学特征的疾病学有更深入的了解)。然而,以正确的方式进行遗传关联研究需要特定的遗传学、统计学和(生物)信息学知识。佳学基因一方面介绍GWAS相关的关键概念,并提供开源可用的程序运行脚本,从而基因信息的基因解码分析提供指导。
全基因组关联研究 (GWAS) 的目的是识别单核苷酸多态性中以等位基因频率作为函数与人体疾病及表型特征发生变化的数值。比如在精神分裂症患者和健康对照之间,或在神经质得分高与低的个体之间某个SNP的等位基因频率的系统性变化。鉴定与性状相关的 SNP后,可能帮助揭示对这些疾病与表型背后的生物学机制。佳学基因提供的全基因组高密度分型芯片基因检测技术可以在全基因组范围研究大量 SNP 对一个或者是多个表型与疾病特征的影响。
为了掌握佳学基因GWAS分析技术所需要了解的基本概念
聚集(Clumping):是用于识别和选择每个LD块中最重要的SNP(即最低p值)以进行进一步的分析的过程。通过这一过程,降低了剩余SNP之间的相关性,同时保留了具有最强统计证据的SNP。
共同遗传性(Co-heritability):在基因解码中用来衡量疾病之间遗传关系的指标。基于SNP的遗传性分析是指通过SNP分析两个疾病与表征(例如精神分裂症和双向情感障碍)之间的协方差比例。
基因(gene):这是DNA中编码某个分子(例如蛋白质:在这里蛋白质中只是其中一种分子,这是一种较为先进的基因定义)的核苷酸序列
杂合性(Heterozygosity):这是指所检测的基因位点携带特定 SNP 的两个不同等位基因。个体的杂合率是杂合基因型的比例。在佳学基因的基因解码质量控制体系中,个体杂合性过高可能是因为样本质量低,而杂合性太低可能是由于近亲繁殖。