从百岁老人的基因组中寻找结构变异的秘密

来源: 生物通 / 作者: 2020-11-13
0

人类基因组中存在着大量的重复序列,有时会影响神经系统的健康。在极少数情况下,重复序列会变得不稳定,在家族中逐代扩增,一旦超过临界长度,就可能会影响基因转录,造成神经系统疾病,比如亨廷顿舞蹈症、肌萎缩性侧索硬化症、精神分裂症等。随着重复序列的增加,后代的病情往往更严重,发作年龄更小。

然而,研究这些结构变异(SV)仍具有挑战性,因为通常使用的短读长测序方法很难对大的重复区域进行评估。为此,荷兰和比利时的科学家采用 PacBio 的单分子实时(SMRT)测序技术生成了一名荷兰百岁老人的二倍体基因组组装,并对检测到的变异进行了详细分析。

这项成果发表在《Translational Psychiatry》杂志上,由阿姆斯特丹自由大学的 Henne Holstege 领导。他们的目的是确定与神经系统疾病发作相关的结构变异。因此,他们将百岁老人的基因组组装与几个现有的人类基因组组装进行了比较。

Henne Holstege

研究团队之所以选择 PacBio 的长读长测序技术,是因为短读长测序方法对结构变异的挖掘还不够。“采用常见的测序方法很难对大的重复区域进行评估,因为 100-150 bp 长度的短读数无法覆盖整个结构变异,” 作者在文中写道。“解决方案是生成更长的测序读数。”

在这项研究中,Holstege 及其同事对荷兰老人 Hendrikje van Andel-Schipper 的基因组 DNA 进行测序,并用 FALCON-Unzip 工具建立了约 2.82 Gb 的二倍体组装。这名老人在 115 岁高龄时去世,依然没有出现认知能力下降的迹象。他们将这个称为 W115 的组装与两个单倍体组装及人类参考基因组进行比较,以搜索 50 bp 或以上的结构变异。

研究人员采用了一个名为 REVEAL 的多基因组比对工具,共发现了 31,680 个结构变异。大约 62% 的变异可归为可变数目的串联重复序列(VNTR)。“有趣的是,我们发现亚端粒区域的 VNTR 由更长的重复亚基组成,而且它们的 GC 含量更高,” 作者写道。VNTR 的扩增与错误的基因转录存在关联。他们发现,VNTR 数量最多的基因(比如 PTPRN2 和 DLGAP2)主要在大脑中表达,并与多种神经系统疾病相关。

此外,研究人员还分析了结构变异列表,以了解 SMRT 测序在检测方面有何不同。在仅使用 W115 基因组的短读长数据时,他们只发现了 5,826 个结构变异。他们指出,通过 PacBio 组装发现的超过 18,000 个变异是只能通过长读长测序鉴定的。

下一步,Holstege 及其团队打算开展一项大型研究,至少涵盖 150 名认知正常的百岁老人和 150 名阿尔茨海默病的患者,以确定两组参与者的 VNTR 长度明显不同。为此,他们已经购买了 Sequel II 测序系统。他们希望用单个 SMRT Cell 来覆盖每个基因组。(生物通 薄荷)

原文检索

Linthorst, J., Meert, W., Hestand, M.S. et al. Extreme enrichment of VNTR-associated polymorphicity in human subtelomeres: genes with most VNTRs are predominantly expressed in the brain. Transl Psychiatry 10, 369 (2020). https://doi.org/10.1038/s41398-020-01060-5

声明:本网所有文章(包括图片和音视频资料)系出于传递更多信息之目的,且明确注明来源和作者,不希望被转载的媒体或个人可与我们联系(edit@bio360.net ),我们将立即进行删除处理。所有文章仅代表作者观点,不代表本站立场。