实验设计的目的是以较小的工作量和成本高效地获得充足的数据,从中得出科学和统计学意义上有效的结论。了解实验目标、过程以及实验变异性的大小和来源对于设计成功的 siRNA 实验而言均十分重要。本文将描述不同的变异来源以及如何确定您所进行的实验的理想重复样本数量。

变异来源

所有实验数据均具有来自多种来源的变异性。了解这些来源有助于改进实验设计和结果。

生物学变异。生物学变异取决于所研究群体的特征。例如,测量一组随机人群的身高将比仅限于同一年龄或性别的人群的研究具有更大的变异性。此外,对于人类基因表达,变异系数范围为 20% 至 100%。

过程变异。
过程变异是指当同一样本独立运行多次时所表现出的数据变异性。过程变异由以下因素引起:

随机(或常见原因)变异
这些变异包括不可预测的和自然产生的变异,可能影响部分(但不是所有)样本(例如,移取误差)。应努力识别并减少此类变异,但永远不能完全消除此类变异。尽可能准确地测量并认真遵循实验方案或标准操作规程 (SOP) 也是控制随机变异的一部分。

系统性(或特殊)变异

系统性变异影响实验过程,因此样本可能存在偏倚。系统性变异的示例包括超出校准范围从而导致偏倚的设备、实验期间的非预期温度变化或相对于正常时间发生延迟导致实验程序发生变更并影响样本、过程和结果。另一个示例是行效应 [1] 大到足以掩盖或扭曲生物效应的细胞培养板。科学家可能意识到也可能没有意识到过程变异。

系统变异。系统变异来自测量所用仪器。测量系统的变异性会导致过程变异性,这可能是常见原因,也可能是特殊原因。

标准标尺是测量系统的一个示例。准确度通常是最小刻度标记的一半(例如,如果标尺的刻度标记为 1 mm,则为 ±0.5 mm)。这基于以下假设得出:估计任意两个刻度之间的中点相对容易,但更小的分数则无法通过眼睛准确估计。其他隐含的假设包括:进行测量的人员视力良好,且标尺刻度准确。如果标尺生产商标记标尺时刻度有误,则标尺会产生偏倚。

实验变异。实验变异是实验中观察到的总变异,来自过程和生物学群体变异性。

siRNA 实验中的变异性

在技术资料 14.3 中,我们解释了准确度和精度是实验变异性的组成部分,但彼此之间不相关 [2]。对于 siRNA 实验,科学家通常会运行重复样本以帮助确定准确度和精度。其定义请参见边栏 准确度与精度。重复样本有两种类型:

生物学重复样本是经过相同处理的不同生物样本。示例包括采用同一方案处理的动物、组织、部分器官或细胞培养板孔。

技术重复样本是来自同一来源的多份等份试液,在整个过程中独立运行。

技术重复样本可说明过程的变异性。生物学重复样本可说明群体的变异性,但也受过程变异性的影响。

重复样本的数量是多少?

实验目标是所需重复样本数量和类型的首要决定因素。可以提出的问题包括:

  • 这是一项研究检测、筛选检测还是释放检测?
  • 该程序将多次运行还是很少运行?
  • 已完成多少验证?

收集数据的原因决定了所需数据的质量。额外的技术重复样本将提供关于过程变异性的信息,但不提供关于群体变异性的更多信息。如果样本群体未知或变异性较大,则需要更多生物学重复样本。对于变异性较大的过程或经验不太丰富的技术员而言,增加技术重复样本可能十分重要。多级过程可能需要不同类型的技术重复样本。

例如,siRNA 程序涉及 96 孔板内细胞培养物的转染、细胞裂解和 RNA 分离、cDNA 合成以及最终 RT-PCR 检测以测量特定基因的沉默。生物学重复样本来自 96 孔板的不同孔中相同 siRNA 的转染。技术重复样本可以在 RNA 分离阶段、cDNA 生成阶段或 RT-PCR 程序中获得。在该过程中添加技术重复样本的时间越早,增加的工作量越多、对样本处理量的影响越大、实验成本越高。限制重复样本数量的一种方法是仅在该过程中变异性较大的步骤中添加技术重复样本。对于大多数生物检测,较大的变异性来自样本群体,生物学重复样本的数量通常是较大且较重要的因素。


图 1.4 个代表性群体。群体 A 和 B 的系统和群体变异性较小,样本平均值之间的倍数差异较大。与群体 A 和 B 相比,群体 C 和 D 的数据在平均值周围的分散程度较大,平均值之间的倍数差异较小。


平均值之间的倍数变化越大,所需的生物学重复样本越少。群体变异性越分散,所需的生物学重复样本越多。图 2 根据实验精度和预期生物学差异,给出了所需样本数量的估计值。以下是两个理论示例:

对于图 1 中所述的群体,大约 3 份重复样本即足以检查群体 A 和 B,而需要 7 至 18 份重复样本才能检查群体 C 和 D。

当靶向同一 mRNA 的两个 siRNA 得到的基因表达敲低与基线相差 10 倍且实验变异较低(例如,25%)时,仅需要 3 份生物学重复样本即可获得可靠数字来检测表达的变化。相比之下,如果基因表达敲低与基线仅相差 1.5 倍且实验变异较高(例如,75%),则需要 38 份生物学重复样本来检测表达的变化。


图 2.估计要使用的生物学重复样本的数量。倍数差异是您想要区分的两个群体的平均值之间的差异,实验变异是标准差/平均值 X 100 (%CV)。这些数字基于单侧 t 检验得出,该检验将 α 在正方向上的所有区域关联起来。CV = 变异系数。


在无实验精度或群体变异历史的情况下,应运行至少三份生物学重复样本加两份或三份技术重复样本。随着群体变异性和实验过程的精度变得更加明确,可调整技术和生物学重复样本的数量,以达到所需的数据质量。

了解实验的目的和程序的能力有助于以更低的成本获得更准确的结果。这样做可以使科学家能够更好地确定如何平衡生物学或技术重复样本的数量与增加任一类型重复样本的成本。同时也可提升对数据准确度的信心,并且可确定影响检测精度的因素。

科学参与人员
Ann Hartman • Applied Biosystems, Austin, TX
John Pfeifer • Applied Biosystems, Houston, TX