【学术成果】统计中心22届博士毕业生郭瀚民在Nature Communications发文提出基于贝叶斯统计的跨种族疾病风险预测算法

学术成果、新闻动态、最热新闻、科研领域
发布时间:2023年03月07日

2023年2月,清华大学统计学研究中心侯琳副教授课题组在Nature Communications上发表了题为Quantifying portable genetic effects and improving cross-ancestry genetic prediction with GWAS summary statistics的研究论文[1],课题组2022届郭瀚民博士为该文的共同第一作者,侯琳副教授和威斯康辛大学麦迪逊分校吕琼石助理教授为该论文的共同通讯作者,威斯康辛大学麦迪逊分校的缪嘉诚为共同第一作者,宋格非、赵梓杰为本文的共同作者。

多基因风险评分是基于全基因组关联分析实验的复杂疾病遗传风险预测算法,对疾病的精准预防和治疗有重要应用价值。现有方法主要基于欧洲人群的全基因组关联分析研究,相应模型在欧洲人群中有较好的预测效果,但在其他人群中预测效果欠佳。研究团队针对跨种族遗传风险预测问题开展研究,首先发展了挖掘种族间局部遗传相关性的统计方法,进一步提出基于相关性区域注释的贝叶斯多基因风险评分方法,实现跨种族疾病遗传信息迁移;经模拟数据和实际数据验证,该方法可以显著提高疾病风险预测的准确性。此外,研究团队还开发了实现上述算法的软件包X-Wing[2],将该方法应用于英国、日本等生物样本库(UK Biobank, Biobank Japan)。测试结果显示,该方法可以显著提高样本中的非欧人群遗传风险预测准确性,对改善种族间遗传资源不平衡的现状具有重要意义。