新浪博客


如果你希望获得别处没有的信息,这一定是你能看到的最全的祖源知识通关攻略,配合祖源分析报告食用,佐以中国历史,你会发现基因测祖源远比「晒外国血统」更有趣。
首先要告诉大家,各色 DNA 的祖源检测结果不久前升级了,祖源部分由原本的 14 个地区,细分了成全世界 59 个地区和族群。
新版的祖源检测报告长这样
中国北方人被查出有5%的人祖源是美洲土著血统!基因检测到底是啥?
1、我的祖源结果是怎么得出来的?
我发现人们对祖源检测存在一个误解:“祖源测的就是我祖先曾经所在的地方。”
其实并不是,祖源分析的参考数据都是连续几代生活在这个地方的现代人。
拿北方汉族来说,当我们找到足够多长期生活在北方汉族地区的人,我们就构建了一个北方汉族地区的参考数据库。
2016 年,当我刚开始做中国人祖源解读的时候,我发现,几乎没有中国不同地域的基因参考数据库。
即使在全球用户量最大的 23andMe(目前可以探测全球 150 个国家和地区的祖源),中国人也只是被粗略划分为南方人和北方人。
一个典型的中国人在23andme的祖源成分检测结果
在我们去年9月份发布第一版祖源解读的时候,我们积累了第一版中国人族群数据库。
我们将生活在中国的人分成了 6 个地区,将国外人口分成了8个地区。据此给出了每个人的比例解读,并且邀请大家继续参与家庭出生地的调查。
今年,我们有了更大更丰富的族群数据库。升级之后,各色的祖源由原来 14 个地区,升级为 59 类,主要是源自于祖源参考数据集的优化。
我们积累的参考数据库包括有:
由数万名各色用户贡献的 DNA 数据
国际千人基因组计划中的公开数据
中国北方人被查出有5%的人祖源是美洲土著血统!基因检测到底是啥?
斯坦福大学人类基因组多样性研究计划中的公开数据
由于各色用户绝大部分是中国人,因此在收集和整理国外不同族群的参考数据时,我们仍然重点分析中国人的数据,特别是汉族群体。
2、测出来的“外国血统”,到底怎么理解?
我看到很多人会乐于在社交网络上分享自己的「5% 美洲土著基因」,这听上去很酷。它的科学解释是:祖源成分并不代表你一定有这里的祖先,而是你的祖先有 5% 的可能是这里人。
人有 23 对染色体,22 对常染色体,1 对性染色体(女性是 XX,男性是 XY )。做祖源成分分析使用的是 22 对常染色体数据。
人类基因组中,大约 99.9% 的 DNA 序列都相同。所以要通过祖源成分分析获得你属于某一个或几个地区或族群的“可能性”,第一步是收集在不同地区和族群分布有差异的基因位点。
比如,影响人是否有腋臭的基因位点是 rs17822931,这个点基因型为 C 的人,体味更重一些。
rs17822931 在世界不同地区的分布差异很大,在非洲有 99% 的人携带 C ,在美洲和欧洲携带 C 的比例是 86%。
而在东亚携带 C 的比例只有 22%,大部分人东亚人在这个位点是 T型,表现为干燥的耳垢和更轻的体味。
如果一个人 rs17822931 检测结果为 TT,从概率上来讲,他更可能是一个东亚人。
rs17822931 在世界各地的分布,圆圈白色部分指的是 “T”
中国北方人被查出有5%的人祖源是美洲土著血统!基因检测到底是啥?
所以,当我们找到足够多像 rs17822931 这样的基因位点,即在不同地区,不同人群中基因位点类型频率分布有差异的位点, 我们就可以去推测你的祖源成分。
族群1 族群2 族群3 族群4
位点1(C) p11 p12 p13 p14
位点2(A) p21 p22 p23 p24
位点3(G) p31 p32 p33 p34
祖源参考数据集示例
计算祖源成分的算法上,我们使用的是美国加利福尼亚大学洛杉矶分校相关人员研发的,也是目前使用比较广泛的专门计算祖源成分的方法—— ADMIXTURE(http://software.genetics.ucla.edu/admixture/)。
其核心算法是极大似然估计法(Maximum Likelihood Estimate,MLE),简单说就是通过你的基因数据,计算出你最可能由哪几种族群组成,以及相对应的百分比。
所以,如果改变祖源地区的划分类别,检测结果就会发生变化。
3 :你的基因中藏了哪些地域的秘密?
各色的祖源主要是以地域而非民族为划分标准的。因为,大部分中国人是北方汉族或南方汉族主体,如果用民族来做祖源划分,一个汉族人的祖源结果会比较「无聊」。
其实,除了民族之外,基因中还蕴藏着非常丰富的地域差异信息。
今年新发表的一项大规模中国人祖源研究,根据 19 个省和直辖市 共 11670 名汉族人的分析发现:
汉族人南方和北方之间的差异是最大的。
北方省市中,甘肃、陕西和山西,与其他省市(东北三省、山东和河南等)有差异。
相比北方汉族呈现出来的东西差异,南方汉族则呈现南北差异,即长江流域(江苏、安徽、湖北、浙江等)和东南沿海(湖南、福建和广东)存在差异。
各色选择 3620 个代表用户,得到了跟上面这个研究类似的结果:
当地各色汉族用户较少的国内省市和自治区未包含,图中的分类「中国」为用户填写的原始数据
这张结构图可能看上去有点费解,你记住这几点就好了:
中国汉族可以分为南北两部分,南方汉族和北方汉族。
北方汉族中,甘肃与吉林省和其他省市存在差异,这可能是因为甘肃与新疆和内蒙相连,长期的民族融合交流会影响汉族的特异性;而吉林省满族人聚居,且东临朝鲜半岛。
天津市明显区别北方汉族的表现,让我们有些费解。希望有更多天津土著参与我们的检测,期待未来我们可以一起破解这一谜题。
南方的划分中,贵州省、重庆市和云南省与其他地区存在差异。其他地区可以分为长江以南和东南沿海两大部分。
根据层次聚类和 PCA 分析结果,我们选择了区域而非民族(南方汉族和北方汉族)来给大家进行祖源成分划分。
中国历史上多次人口迁徙和民族融合,比如四川省与湖北、江西和浙江等省市比较类似,我们都将其定义为「长江以南」地区。这也呼应了清朝初期「两广填四川」的人口迁移史。
北方中部
你的祖先是最早的「华夏儿女」。根据《史记》记载,黄帝与炎帝的战争即发生在今天河北山西一带,
历史上频繁的战乱也带来了西北少数民族的融合和迁徙。你们爱吃面食和酸辣口味,通常有高大强壮的体魄。
北方蒙古人种|河北|山西|陕西|脸长且平|鼻高|单眼皮更多|关羽|张艺谋|郭晶晶|面食
北方东部
你的祖先分布在黄河中下游地区和华北平原,在两千多年的时间里,原本居住在此地区的汉族不断向外扩张,并和别的民族融合。
北方蒙古人种|山东|河南

我的更多文章

下载客户端阅读体验更佳

APP专享