直到最近,这些复杂的区域中的许多都可以与月球的远端相比:已知存在,但不可见。
当人类基因组计划这项技术于1990年首次推出,由于技术限制,无法完全揭示基因组中的重复区域。可用的测序技术一次只能读取大约500个核苷酸,这些短片段必须相互重叠才能重建完整的序列。研究人员利用这些重叠的片段来识别序列中的下一个核苷酸,一次一个片段地逐步扩展基因组组装。
这些重复的空隙区域就像把乌云密布的天空中1000块拼图拼在一起:当每一块看起来都一样的时候,你怎么知道一朵云从哪里开始,另一朵云从哪里结束?18新利最新登入由于在许多位点上几乎完全相同的重叠部分,通过零碎的方式对基因组进行完全测序变得不可行。数百万个核苷酸一直隐藏在人类基因组的第一次迭代中。
从那时起,序列补丁逐渐填补了人类基因组的空白。在2021年,端粒-端粒(T2T)联盟这是一个由科学家组成的国际联盟,致力于完成人类基因组从头到尾的组装最后了.
这是通过改进的测序技术得以实现的读取更长的序列数千个核苷酸长度。随着更多的信息在更大18luck手机登录的图景中定位重复序列,更容易确定它们在基因组中的适当位置。就像将1000块拼图简化为100块拼图一样,长读序列也做到了这一点组装的可能性第一次出现大面积重复区域。
随着长读取DNA测序技术的日益强大,遗传学家有能力探索基因组学的新时代,首次解开跨越种群和物种的复杂重复序列。一个完整的、无间隙的人类基因组为研究人员研究形成遗传结构和变异、物种进化和人类健康的重复区域提供了宝贵的资源。新利国际网站品牌官网
但一个完整的基因组并不能捕捉全部。继续努力创造多样化的基因组参考,充分代表人口数量而且地球生命.随着更完整的“端粒到端粒”基因组引用,科学家对DNA重复暗物质的理解将变得更加清晰。
加布里埃尔·哈特利是康涅狄格大学分子与细胞生物学的博士候选人。她得到了国家科学基金会的资助。
本文转载自谈话在创作共用许可下你可以在原文在这里。