深度分析 2999 名中国人基因，中科院发布“女娲”数据集

网络5年前 (2021-11-28)网文选读4335

遗传变异图谱是研究人群演化史、医学遗传学、基因型－表型关联的基础。此前，大多数全基因组测序相关研究主要集中在欧洲血统人群。已有研究表明，罕见和低频的变异往往特定于人群或样本，尤其是与疾病相关的变异。针对特定人群的基因组数据可以为全基因组关联研究、区域适应性研究、用药指导等提供更准确的参考。

据中科院生物物理所消息，单倍型参考面板可基于大型人群队列中已知的单倍型信息，对来源于相对稀疏的基因变异芯片或低覆盖率测序样本中缺失的基因型进行推演，是促进全基因组关联研究 (genome-wide association study, GWAS) 有意义且具有成本效益的方法。此前缺乏中国人群特异的参考面板，其他参考面板对中国人群特异的变异推演效果较差，从而导致 GWAS 中遗漏潜在的表型相关变异。

中国人群全基因组测序资源和单倍型参考面板的缺乏阻碍了世界上最大人群的遗传学与精准医学研究。为此，中国科学院院士、中科院生物物理研究所研究员徐涛团队，研究员何顺民团队合作，在 Cell Reports 上在线发表了题为 NyuWa Genome Resource: A Deep Whole Genome Sequencing-Based Variation Profile and Reference Panel for the Chinese Population 的文章，介绍该团队关于 "女娲"（NyuWa）中国人群基因组资源库的工作，提供针对中国人群的遗传变异图谱与参考面板基因型推演服务，旨在促进中国人群的遗传学与医学研究。

研究团队分析了 2,999 个中国人的全基因组深度测序数据（26.2X），并以“女娲（NyuWa）”命名。基于 NyuWa 数据资源，研究构建了包含 7106 万 SNPs 和 819 万 InDels 的中国人群遗传变异图谱（图 1），并对其进行全面注释。

深度分析 2999 名中国人基因，中科院发布“女娲”数据集网文选读第1张

▲ 图 1.NyuWa 全基因组测序资源的变异数量

相比其它人群队列，NyuWa 数据集包含 2501 万新变异，其中包括 14.9 万非同义变异、10.1 万有害变异、11493 个编码和非编码基因的功能丧失变异、636 个癌症相关基因的蛋白截短变异。大量新变异表明，在以往遗传研究中，中国人群的变异代表性不足，NyuWa 基因组资源则填补了这一空缺。此外，根据临床相关数据库的注释，研究在 NyuWa 中发现了 1,140 个致病变异，以及药物基因组学相关位点（图 2A）和癌症风险位点（图 2B）上中国人群与世界其他人群的变异频率差异。这些发现有助于中国人群精准医学研究，可能促进新的遗传学和医学进展。

深度分析 2999 名中国人基因，中科院发布“女娲”数据集网文选读第2张

▲ 图 2.NyuWa 中的药物基因组学位点（A）与癌症风险基因座（B）变异

为汉族人群构建一个完整的、大队列的、高质量的参考面板，对汉族的遗传学与医学研究具有参考价值。基于 NyuWa 数据资源，科研人员构建了包含 5804 个单倍型和 1926 万变异的单倍型参考面板，其中 325 万变异未包含在其它参考面板中，这些 NyuWa 参考面板特有变异可能会在未来关联研究中带来新发现，是首个数千人级别公开可用的中国人群特异的单倍型参考面板。

为评估 NyuWa 参考面板的基因型推演性能，科研人员使用来自人类基因组多样性计划（the Human Genome Diversity Project, HGDP）的亚洲各个人群芯片基因分型数据和高覆盖率 WGS 数据作为测试数据集。与其他参考面板相比，NyuWa 参考面板将汉族人群基因型推演的错误率降低了 30%-51%，在大多数其他东亚和东北亚人群中也有优异表现（图 3A-D）。研究进一步比较了不同等位基因频率的推算结果和实际基因型之间的相关性，NyuWa 参考面板性能在汉族的所有等位基因频率区间中均具有绝对优势（图 3E）。

深度分析 2999 名中国人基因，中科院发布“女娲”数据集网文选读第3张

▲ 图 3.NyuWa 参考面板对汉族基因型推演具有最佳性能

此外，NyuWa 参考面板与千人基因组 (1KGP3) 面板的结合进一步提高了亚洲人群的基因型推演效果。考虑到南北方汉族遗传差异，科研人员将 NyuWa 参考面板中的样本分为北方和南方子集，使用子集样本分别构建北方和南方汉族的参考面板，通过基因型推演的模拟测试，证明以 NyuWa 的人群规模，一个南北整合的参考面板对中国北方人和南方人均适用（图 4）。

深度分析 2999 名中国人基因，中科院发布“女娲”数据集网文选读第4张

▲ 图 4.南北方汉族测试数据集的基因型推演错误率

综上，基于中国人群的大型队列深度 WGS 数据，研究构建了中国人群的遗传变异图谱和首个数千人级别公开可用的中国人群单倍型参考面板，将所有结果整合为中国人群基因组资源库 NyuWa（图 5），有助于中国和亚洲人群的遗传学和精准医学研究。

▲ 图 5.NyuWa 资源库

IT之家了解到，当前有关医学基因组学的知识和指南主要来自以欧洲人群为主的遗传和基因组资源，可能遗漏有关非欧洲人群的遗传信息。亚洲人群起源、迁徙和融合历史悠久而复杂，使得其遗传多样性研究面临挑战和机遇。针对中国人群的全基因组测序工作，对于扩充世界人群遗传资源多样性、提高中国人群医学研究准确性十分必要，有助于深入了解亚洲人群结构与人群历史，并对寻找复杂疾病遗传因素的研究设计以及人口健康指导具有参考价值

关注并使用“百度APP”访问无忧岛数码家电，各种价格便宜大牌精品数码产品等你发现~

分享给朋友：

上海首例！8人非法经营“IQOS”电子卷烟涉案1200万元，被采取刑事强制措施！

深度分析 2999 名中国人基因，中科院发布“女娲”数据集

相关文章

上海首例！8人非法经营“IQOS”电子卷烟涉案1200万元，被采取刑事强制措施！

申城最老24小时食品店:40年商品从百种增至千余种

上海春节出游指南:豫园灯会如期而至春节赏梅正当时

iPhone X萎靡让OLED屏市场供大于求三星急寻买家

两会个税调整起征点热议~我帮大家总结了几点。大家可以看看

为应对特朗普批评，亚马逊扩充游说团队

不裁员、给期权，王兴出席了摩拜全员大会，还点评了ofo

理工男的逆袭：做AI，不做聊天杀手

发改委：通过5年过渡期汽车行业将全部取消限制

制约华为影响力澳大利亚揽下海底光缆项目

发表评论

© CopyRight2025 无忧岛网沪ICP备17010807号-1

Powered By Z-BlogPHP. Theme by TOYEAN.

深度分析 2999 名中国人基因，中科院发布“女娲”数据集

相关文章

发表评论取消回复

var _hmt = _hmt || []; (function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?c0534a2c94f7d445d3bcaa8347a8d778"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s); })(); © CopyRight2025 无忧岛网 沪ICP备17010807号-1

Powered By Z-BlogPHP. Theme by TOYEAN.

发表评论

© CopyRight2025 无忧岛网沪ICP备17010807号-1