鉴定表型相关的遗传变异是现代遗传学研究的核心。遗传多态性,特别是单核苷酸多态性(SNP),已被广泛应用于生态、农业、医学等领域。近年来,随着高通量测序平台的发展,全基因组SNP位点的筛查和分型得以实现,为基因组学研究提供了前所未有的契机。全基因组重测序,虽能获取最全面的基因组变异信息,但若应用于具有较大基因组的物种或上百乃至上千样本量的大规模分析时,成本仍然过高。近年来,基于限制性内切酶的简化基因组测序方法被广泛应用,这一类技术(如RAD、GBS、2b-RAD)通过酶切手段降低基因组的复杂度,能够以较低成本获得全基因组范围内的部分SNP位点。因其只能针对酶切位点附近的SNP进行测序和分型,使得这些方法更适用于大规模标记的开发。
随着基因组学研究的深入,丰富的“功能性”标记资源得以深度挖掘和积累,大量与表型性状相关的标记定位于基因或基因附近区域,对这类遗传标记的开发和研究在生态、农业和医学等领域具有重要的意义,因此靶向基因分型是后基因组时代的必然需求。基因芯片技术是一种高效的靶位点分型技术,已广泛应用于人和模式生物。但非模式生物仍缺乏成熟的标准化商业芯片,若要应用芯片技术,通常需要进行额外定制。然而,固相芯片在定制后难以更新位点,若在有限的群体资源中开发固定阵列易使芯片存在固有偏差。
近年来,基于测序平台的液相杂交捕获技术逐渐兴起,有望克服上述芯片平台的局限性。迄今为止,已发展出多种基于测序平台的靶向分型技术,主要包括基于聚合酶链反应(PCR)的方法和液相杂交捕获的方法。其中,基于PCR的方法,如微滴 PCR和IonAmpliSeq等易于自动化处理大量样品,但依赖于专业仪器的检测,且体系内可能存在引物间的竞争,导致非特异性扩增产物的产生。多重PCR中复杂的引物互作也给通量的进一步提升带来难度。液相分子杂交方法可以捕获较长(250 Kb~5 Mb)的目标区域,是一类有效的捕获分型技术。通量可超过50 000个靶向位点,并且可以应用于痕量DNA(小于10 ng)甚至是降解的DNA样品,这一特性使液相捕获技术优于固相芯片平台。通常这类方法更适合用于检测较长基因组区域内的变异,并不只针对单位点的靶向检测。这类技术的靶向特异性为40%~60%,较低的靶向特异性往往需要更高的测序深度来实现目标位点的均匀覆盖;这也使得测序成本较高。
目前,对于非模式生物,仍迫切需要开发以高效、低成本和灵活的方式对全基因库位点靶向分型的技术。本文的研究团队在前期研究中开发了一种基于液相分子杂交的方法HD-Marker,可以在单管内对12 472个位点同时进行靶向基因分型,在通量级和标记类型的选择上具有很高的灵活性。该方法的原理是基于位点特异性探针(LSP)与目标位点的侧翼序列进行杂交,通过延伸、连接和扩增步骤,完成高通量文库的构建。
HD-Marker技术有效结合了GoldenGate技术的高特异性、灵活性和测序平台的成本优势,可检测数百到12 472个位点,具有较高的捕获率(超过98%)和分型准确率(超过97%),对于非模式生物的大规模靶向基因分型是一种有前景和有吸引力的工具。然而,HD-Marker的检测性能还没有被充分挖掘,以往的12 000通量还不能满足全转录组基因覆盖的需求。因此,在本研究中,中国海洋大学包振民院士、吕佳研究团队进一步提升了单管内容纳的检测位点通量,使之超过86 000个位点,并且综合评估了三种通量级别(30 k、56 k和86 k)的检测性能。
研究结果表明,各通量级别下均具有较高的捕获率(约96%)和基因分型准确率(约96%),且单位点的分型成本可低至0.0006美元。鉴于超高通量级、高灵活性和高稳定性的检测性能,超高通量的HD-Marker技术有望成为非模式生物大规模靶向基因分型的理想工具。
原文链接:http://www.engineering.org.cn/ch/10.1016/j.eng.2021.07.027