科学家使用移液器的图片

尽管限制性内切酶广泛应用于分子克隆,但它还作为分子工具还可应用于分子生物学的其它应用。其中两大重要应用为 DNA指纹识别和甲基化分析,这二者是基因组作图、分析表观遗传学图谱的主要方法。

使用限制性内切酶进行 DNA 指纹识别

DNA 指纹识别或分析的概念在上世纪 80 年代开始出现,是指根据来自于基因组的不同大小DNA 片段构成的独特图谱,对不同个体进行基因识别。换而言之,DNA 片段及其长度差异可作为区分标记物——即所谓的“指纹”——来进行基因识别(如等位基因),而不单纯依赖表型特征进行识别。

如今,DNA 指纹识别技术的应用已经极为常见。大多数公众已经认识到 DNA 指纹识别和谱图在法医学和刑事案件之中的重要性,但该技术还在疾病检测和植物育种等其它领域也得到广泛使用。DNA 指纹识别技术的广泛应用促使业内开发了许多 DNA 指纹识别方法,而如何选择这些方法主要依赖实验目标及所研究的生物体。

限制性片段长度多态性 (RFLP)

限制性片段长度多态性简称 RFLP (英文发音为“rif-lip”,最原始的指纹识别方法即基于此概念。此方法的典型实验流程包括限制性酶切、片段分离、Southern 印迹杂交、探针杂交以及成像分析(图 1)

schematic workflow for identifying restriction fragment length polymorphisms
图 1.鉴定限制性片段长度多态性(RFLPs)的基本实验流程。

第一步,使用一种或多种限制性内切酶消化经纯化的基因组 DNA。通常根据酶区分基因差异的能力和酶成本来选择合适的限制性内切酶。然后使用琼脂糖凝胶电泳分离酶切的片段。由于酶切产生的不同大小片段在凝胶上广泛扩散,会在凝胶上形成连续拖尾。

为了检测所需的片段,将经凝胶分离的 DNA 片段转印到硝化纤维膜或 PVDF 膜上进行处理和检测。将一个带有标记的单链 DNA 探针杂交到膜上,以识别所需片段。将最终的结果成像,获得独特的 RFLP 指纹。   

RLFP 的探针基于基因组内的单拷贝数或低拷贝数序列,大小通常为 500 至 2,000 bp。将探针进行标记,检测超低量的样本,并识别将用作指纹基础材料的片段。观测到的 RFLP 标记物为特异性探针和限制性内切酶结合的结果。例如,探针 A 和 EcoRI 酶切的 DNA 可确定某个基因组的一种 RFLP。探针 A 和 HindIII 酶切的 DNA 会确定该基因组的另一种 RFLP(图 2A)。事先了解模板序列(虽然非必需),可以快速开发出有用的 RFLP 探针。

RFLP 和限制性内切酶还可用于检测两个不同个体的 DNA 差异。图 2B简单阐释了探针杂交和检测,比较了两个个体的两个等位基因的 HindIII 酶切 RFLP(标为“1”和“2”)。在本例中,根据等位基因 2 HindIII 限制性位点的缺失或获得,探针 A 可以识别两个个体的不同限制性指纹。但在多数情况下,两个个体的片段长度差异是由于酶切位点外的 DNA 序列插入或缺失(由天然的重组或复制引起)所致。RFLP 分析还用于遗传咨询、动植物育种以及疾病监测等应用。

尽管 RFLP 用处很大,但其仍存在部分局限。这种分析方法需要大量的起始样本 DNA,而且整个操作流程进展缓慢且繁琐。随着 PCR 技术的发展,许多此类缺点均已被解决——例如, 可采用扩增片段长度多态性 (AFLP)技术,后者所需的样本更少,同时可采用更多基于快速 PCR 技术的实验方案执行。

扩增片段长度多态性 (AFLP)

AFLP 是另一种基因作图技术,该技术不需事先了解基因组序列,即可通过 RFLP 及之后的选择性 PCR 从任意生物体的基因组 DNA 扩增片段。此外,AFLP 分析仅需少量起始模板(通常为 ng 级)。

尽管 AFLP 最初专门针对植物研究而开发 [1],但如今其已在许多领域广泛使用,如:

  • 绘制新物种的基因图谱
  • 测定不同品种的相关性
  • 建立交叉关联群
  • 研究遗传多样性和分子亲缘关系

AFLP 操作流程包括:酶切基因组 DNA 获得限制性切割片段,接头连接接头,PCR 扩增,电泳进行片段分离, 以及通过放射自显影或荧光法进行PCR 扩增子最终成像(图 3)。

AFLP 的第一步,使用限制性内切酶(通常使用EcoRI 和 MseI)酶切基因组 DNA 样本。基因组 DNA 的 GC 含量会影响酶切效率和最终的指纹。例如,如果使用 MseI,当 GC 含量为<50% 时酶切效果最佳。GC 含量过高(例如,>65%) 可能妨碍 MseI 的酶切作用,导致片段量过低。同样,较低的GC 含量可有助 EcoRI 完全酶切。

酶切完成后,会有两个接头连接在片段两端。这些接头经设计包括 19–22 bp 序列以便后续引物结合,而接头的链接会破坏原来的 MseI 和 EcoRI 识别位点(图 3B)

接下来进行两轮 PCR 扩增:选择性预扩增以及之后进行的更具选择性扩增反应。在选择性预扩增 PCR 阶段,首先扩增连接有 EcoRI 和 MseI 接头的 DNA 片段(图 3C)。完成此步骤后,使用 3′ 端最多带三个额外碱基的引物对进行更具选择性的 PCR 反应(图 3D)。这类引物包括选择性核苷酸,其和严格的 PCR 条件一起作用可有助于确保仅与选择性引物3′ 端具有序列同源性的 DNA 片段才能被扩增。在这一选择性扩增步骤中,EcoRI 接头引物进行放射性标记或荧光标记以便进行下游片段检测,而 Msel 引物则不会被标记。

选择性引物和选择性标记的组合可以精简后续的图谱,通过凝胶或电泳揭示独特的指纹(图 3E)。扩增后的指纹最佳组成范围为 50 至 200 个片段,片段长度范围为 45 至 500 核苷酸。在各种成像方法中,首选荧光标记结合毛细管凝胶电泳的方法,这是因为该方法可实现从片段分离到数据收集的自动化流程,有助于提高效率和稳定性。

限制性内切酶进行甲基化分析

甲基化是一种在真核和原核生物基因组内都会存在的内源性 DNA 修饰和调控方式。尽管 DNA 甲基化也属于原核生物限制性修饰系统的一部分(参见限制性内切酶基础知识),但其在调控真核生物基因表达方面却发挥着更重要的作用 [2]。目前人们已发现 DNA 甲基化参与调控许多细胞进程及疾病状态,如胚胎发育、X 染色体基因沉默、细胞周期调控和肿瘤形成。

在许多植物和动物体内,甲基化通常发生在 5′-CpG-3′,表现形式为甲基基团添加到胞嘧啶的含氮环的第五个碳上,形成 5-甲基胞嘧啶 [3]。在植物体内,5′-CpNpG-3′ 和 5′-CpNpN-3′ 处也会发生胞嘧啶甲基化,其中的 N 代表除鸟嘌呤之外的任意核苷酸。甲基化分析中的另一种重要成分是 CpG 岛。 CpG 岛是一个长度 500–2,000 bp,富含 GC 的DNA 区域,通常见于基因的启动子和第一个外显子。由于 CpG 岛的甲基化状态可能会影响基因转录的失活和激活,因而成为了频繁研究的对象。

在诸多研究 DNA 甲基化状态的方法中,限制性内切酶因其可用性和易用性而成为了热门工具。部分限制性内切酶的识别位点含有 CpG 序列,而这些酶对甲基化底物可能表现出不同的敏感度(例如,不受影响,被损坏、阻断或存在依赖性;另请参见限制性内切酶关键注意事项)。研究人员充分利用这一性质,广泛使用限制性内切酶作为位点特异性甲基化分析的基本工具。一些较为知名的方法包括: 结合重亚硫酸盐限制性内切酶分析(COBRA),限制性酶切后进行qPCR (又称实时荧光定量 PCR 法 DNA 甲基化分析,简称 qAMP)。

结合重亚硫酸盐限制性内切酶分析(COBRA)

COBRA 是最热门的位点特异性 CpG 甲基化分析方法之一。其实验流程包括: 通过重亚硫酸盐处理实现胞嘧啶的化学转化,PCR 扩增经重亚硫酸盐处理的 DNA, PCR 产物的酶切消化,最后查看限制性酶切图谱,检验目标位点的胞嘧啶甲基化[4,5]

图 4阐释了 COBRA 检测的步骤。重亚硫酸盐处理 DNA 样本会将未甲基化的胞嘧啶转化成尿嘧啶,而甲基化的胞嘧啶(5-甲基化胞嘧啶)则不受影响。在之后的 PCR 过程中,引物在指定的位点扩增 CpG 岛。经 PCR 形成新链过程中,尿嘧啶作为胸腺嘧啶复制,而5-甲基化胞嘧啶则作为胞嘧啶复制。随后使用可识别扩增区域内CpG位点的限制性内切酶消化PCR 产物。如果原位点序列未甲基化,由于 PCR 扩增后酶切位点的胞嘧啶已被胸腺嘧啶取代,则不会发生酶切。如果原始序列上的酶切位点含有 5-甲基化胞嘧啶,则由于 PCR 后未修饰识别位点,限制性内切酶会在此处酶切 DNA。通过 PCR 产物的酶切图谱,可以判定原始位点序列的甲基化状态。

进行 COBRA 分析各个步骤时,需要考虑若干注意事项。重亚硫酸盐处理时,由于任何残留的未甲基化胞嘧啶都会造成假阳性结果,所以胞嘧啶的转化效率尤为关键。但重亚硫酸盐对 DNA 作用剧烈,为避免 DNA 损伤,处理时间不可超过所需时长。请遵照试剂盒制造商建议的重亚硫酸盐转化处理时长,或在处理后根据经验判定转化效率。重亚硫酸盐处理后,由于 DNA 序列在未甲基化的胞嘧啶位置含有尿嘧啶,在 PCR 过程中,DNA 聚合酶必须能够读取含尿嘧啶的 DNA 模板(例如,Taq DNA 聚合酶)。最后,在酶切步骤,选择的限制性内切酶必须能够有效酶切 PCR 产物,以便获得可靠的甲基化分析酶切图谱。 妥善解决这些问题后,COBRA 即可成为出色的甲基化分析方法。

使用限制性内切酶和实时荧光定量 PCR 进行 DNA 甲基化定量分析

另一分析位点特异性 DNA 甲基化的常用方法是:直接酶切 DNA 模板,然后进行实时 PCR 或定量 PCR (qPCR)。此方法需要使用一组具有不同甲基化敏感度的同裂酶或异裂酶,从而检测特定位点的胞嘧啶甲基化状态。由于避开了重亚硫酸盐转化 DNA(参见 COBRA 分析)步骤,这一方法所需的起始 DNA 量更少,避免了重亚硫酸盐处理可能带来的 DNA 损伤,简化了实验流程。此外,与 COBRA 分析相比,此方法的 qPCR 还可对样本的甲基化状态进行定量检测[6,7]

选择不同甲基化敏感度的同裂酶或异裂酶的依据标准包括:目标位点(例如,CpG 岛或基因 体)以及可选的限制性内切酶。CpG 甲基化研究常用的一对内切酶是 MspI 和 HpaII,二者具有相同的识别位点 5′-CCGG-3′。靶标位点的胞嘧啶甲基化会完全阻断 HpaII 酶切,而 MspI 活性则不受影响。此外,为研究基因体(指基因被转录的序列)或低 GC 含量基因组区域的甲基化,您可改选其它同裂酶,如含有相同识别序列 5′-TCGA-3′ 的 HpyF30I 和 TaqI。如果序列中的胞嘧啶被甲基化,HpyF30I 的酶切被阻断,而 TaqI 则不受影响。为了更彻底地鉴定位点特异性甲基化,除了对甲基化敏感的同裂酶/异裂酶外,还可使用只会酶切含甲基化胞嘧啶序列的限制性内切酶(图 5A)

经限制性酶切后,可以直接将 DNA 样本进行凝胶电泳,定量分析甲基化。请注意,酶切的 DNA 可能出现拖尾或多个较小的条带。使用凝胶电泳法时,根据此检测方法的灵敏度,可能需要加入更多量的 DNA 才能观察到片段(图 5B)

进行甲基化定量分析时,酶切的 DNA 样本要进行 qPCR。PCR 引物经设计位于目标位点侧翼,从而使未酶切的底物继续作为 PCR 模板。剩余的未酶切 DNA 的水平取决于所用限制性内切酶的甲基化敏感度,如图 5A 所示。DNA 的完整性水平越高,可供PCR 扩增的 DNA 模板就越多,在实时荧光定量 PCR 中就越早检测到 DNA 扩增(即,Ct 值越低)。根据这一原理,依据 PCR 分析即可测定位点的甲基化状态(图 5C)

仅供科研使用,不可用于诊断目的。