当前位置:首页 > 生活资讯 > 网文选读 > 正文内容

深度分析 2999 名中国人基因,中科院发布“女娲”数据集

网络4年前 (2021-11-28)网文选读4215

遗传变异图谱是研究人群演化史、医学遗传学、基因型-表型关联的基础。此前,大多数全基因组测序相关研究主要集中在欧洲血统人群。已有研究表明,罕见和低频的变异往往特定于人群或样本,尤其是与疾病相关的变异。针对特定人群的基因组数据可以为全基因组关联研究、区域适应性研究、用药指导等提供更准确的参考。

据中科院生物物理所消息,单倍型参考面板可基于大型人群队列中已知的单倍型信息,对来源于相对稀疏的基因变异芯片或低覆盖率测序样本中缺失的基因型进行推演,是促进全基因组关联研究 (genome-wide association study, GWAS) 有意义且具有成本效益的方法。此前缺乏中国人群特异的参考面板,其他参考面板对中国人群特异的变异推演效果较差,从而导致 GWAS 中遗漏潜在的表型相关变异。

中国人群全基因组测序资源和单倍型参考面板的缺乏阻碍了世界上最大人群的遗传学与精准医学研究。为此,中国科学院院士、中科院生物物理研究所研究员徐涛团队,研究员何顺民团队合作,在 Cell Reports 上在线发表了题为 NyuWa Genome Resource: A Deep Whole Genome Sequencing-Based Variation Profile and Reference Panel for the Chinese Population 的文章,介绍该团队关于 "女娲"(NyuWa)中国人群基因组资源库的工作,提供针对中国人群的遗传变异图谱与参考面板基因型推演服务,旨在促进中国人群的遗传学与医学研究。

研究团队分析了 2,999 个中国人的全基因组深度测序数据(26.2X),并以“女娲(NyuWa)”命名。基于 NyuWa 数据资源,研究构建了包含 7106 万 SNPs 和 819 万 InDels 的中国人群遗传变异图谱(图 1),并对其进行全面注释。

深度分析 2999 名中国人基因,中科院发布“女娲”数据集  网文选读 第1张

▲ 图 1.NyuWa 全基因组测序资源的变异数量

相比其它人群队列,NyuWa 数据集包含 2501 万新变异,其中包括 14.9 万非同义变异、10.1 万有害变异、11493 个编码和非编码基因的功能丧失变异、636 个癌症相关基因的蛋白截短变异。大量新变异表明,在以往遗传研究中,中国人群的变异代表性不足,NyuWa 基因组资源则填补了这一空缺。此外,根据临床相关数据库的注释,研究在 NyuWa 中发现了 1,140 个致病变异,以及药物基因组学相关位点(图 2A)和癌症风险位点(图 2B)上中国人群与世界其他人群的变异频率差异。这些发现有助于中国人群精准医学研究,可能促进新的遗传学和医学进展。

深度分析 2999 名中国人基因,中科院发布“女娲”数据集  网文选读 第2张

▲ 图 2.NyuWa 中的药物基因组学位点(A)与癌症风险基因座(B)变异

为汉族人群构建一个完整的、大队列的、高质量的参考面板,对汉族的遗传学与医学研究具有参考价值。基于 NyuWa 数据资源,科研人员构建了包含 5804 个单倍型和 1926 万变异的单倍型参考面板,其中 325 万变异未包含在其它参考面板中,这些 NyuWa 参考面板特有变异可能会在未来关联研究中带来新发现,是首个数千人级别公开可用的中国人群特异的单倍型参考面板。

为评估 NyuWa 参考面板的基因型推演性能,科研人员使用来自人类基因组多样性计划(the Human Genome Diversity Project, HGDP)的亚洲各个人群芯片基因分型数据和高覆盖率 WGS 数据作为测试数据集。与其他参考面板相比,NyuWa 参考面板将汉族人群基因型推演的错误率降低了 30%-51%,在大多数其他东亚和东北亚人群中也有优异表现(图 3A-D)。研究进一步比较了不同等位基因频率的推算结果和实际基因型之间的相关性,NyuWa 参考面板性能在汉族的所有等位基因频率区间中均具有绝对优势(图 3E)。

深度分析 2999 名中国人基因,中科院发布“女娲”数据集  网文选读 第3张

▲ 图 3.NyuWa 参考面板对汉族基因型推演具有最佳性能

此外,NyuWa 参考面板与千人基因组 (1KGP3) 面板的结合进一步提高了亚洲人群的基因型推演效果。考虑到南北方汉族遗传差异,科研人员将 NyuWa 参考面板中的样本分为北方和南方子集,使用子集样本分别构建北方和南方汉族的参考面板,通过基因型推演的模拟测试,证明以 NyuWa 的人群规模,一个南北整合的参考面板对中国北方人和南方人均适用(图 4)。

深度分析 2999 名中国人基因,中科院发布“女娲”数据集  网文选读 第4张

▲ 图 4.南北方汉族测试数据集的基因型推演错误率

综上,基于中国人群的大型队列深度 WGS 数据,研究构建了中国人群的遗传变异图谱和首个数千人级别公开可用的中国人群单倍型参考面板,将所有结果整合为中国人群基因组资源库 NyuWa(图 5),有助于中国和亚洲人群的遗传学和精准医学研究。

▲ 图 5.NyuWa 资源库

IT之家了解到,当前有关医学基因组学的知识和指南主要来自以欧洲人群为主的遗传和基因组资源,可能遗漏有关非欧洲人群的遗传信息。亚洲人群起源、迁徙和融合历史悠久而复杂,使得其遗传多样性研究面临挑战和机遇。针对中国人群的全基因组测序工作,对于扩充世界人群遗传资源多样性、提高中国人群医学研究准确性十分必要,有助于深入了解亚洲人群结构与人群历史,并对寻找复杂疾病遗传因素的研究设计以及人口健康指导具有参考价值

关注并使用“百度APP”访问无忧岛数码家电,各种价格便宜大牌精品数码产品等你发现~

相关文章

米其林如死亡之吻 香港得奖店家倒闭

米其林如死亡之吻 香港得奖店家倒闭

获得「米其林」推荐,固然是餐饮业殊荣,却也成了部份店家「不可承受之重」。其中香港不少小吃店连连上榜,房租却也跟着喊涨,有的涨幅高达120%,有店家因此被迫多次搬迁,更有的因此关门大吉,更让港媒戏称「米...

今日头条完成对相机拍照工具Faceu激萌的收购,交易总价约为3亿美金

今日头条完成对相机拍照工具Faceu激萌的收购,交易总价约为3亿美金

今日头条的触角仍在不断延伸。36氪从相关交易人士处独家获悉,今日头条已经完成了对相机拍照工具Faceu激萌的收购,交易总价约为 3 亿美金。在被头条收购后,Faceu激萌相继冠名了浙江、东方...

申城数十家艺术展馆春节长假不打烊 展览活动花样多

申城数十家艺术展馆春节长假不打烊 展览活动花样多

原标题:近百道“菜式”,申城艺术过年“筵席丰盛” 图片说明:在上海博物馆一楼的中国古代青铜馆内,游客正在参观大克鼎。  这个春节长假,申城数十家艺术展馆...

兄妹俩离奇身亡凶手成“谜”警方首次披露细节

关注一起非常蹊跷的兄妹中毒案的告破。出事的这对兄妹,哥哥名叫嘻嘻,年仅7岁;妹妹名叫妮妮,年仅5岁,一天之内,一个家庭的两个孩子相继离奇死亡,家长痛不欲生,医院找不出具体的死因,法医也百思不得其解,对...

为什么越来越多城市爱办马拉松?

一个城市的马拉松往往是这个城市的一个节日,由于在城市的街道上奔跑,因此除了参赛选手和主办方外,还会与城市的方方面面产生联系。一个城市举办马拉松一般会从以下几个方面考虑:1、城市的宣传和展现。马拉松的赛...

发改委:通过5年过渡期 汽车行业将全部取消限制

一、习近平总书记在博鳌论坛上宣布了扩大开放重大举措,如何落实这些举措?能否透露一些消息?  今年是改革开放40周年。习近平总书记在博鳌论坛上的重要讲话,宣布了扩大开放重大举措,展示了新时代我国对外开放...

上海首条BRT正式通车 “零污染、零排放”快速充电

上海首条BRT正式通车 “零污染、零排放”快速充电

上海首条BRT(快速公交线路)——“奉浦快线(区间)”20日正式通车。 芊烨 摄中新网上海4月20日电 (记者 陈静)上海首条BRT(快速公交线路)&m...

千万别让自己,成为公司里可有可无的人

阿力最近碰上件烦心事:公司要裁员,他可能在其中。阿力就职于一家纸媒,受新媒体浪潮冲击,纸媒不得不转型。转型需要新媒体人才,习惯了一支笔一个采访本出行的阿力,开始担心还能不能继续混下去。经历过纸媒黄金期...

天津落户记:“没想到北漂群体落户的需求如此强烈”

5月21日,站在和平区行政许可服务中心门口,王晔还是没拿定主意要不要落户天津。王晔是东北人,从上大学算起,今年是她生活在北京的第七年。大学四年,户口迁到学校集体户口,王晔没有在意户口的重要性。即便毕业...

呼兰胖子:姑娘 就算你考了状元 也不该赞美贫穷 

【新闻背景】河北18岁女孩王心仪今年高考以707分的成绩被北大中文系录取。当录取通知书寄到家门口时,她正只身在异地打工。她在文章中写下“感谢贫穷”,“尽管它狭窄了我...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。