如何让你的 SCI 文章 MIQE 起来-7- 大数跨境

首页

如何让你的 SCI 文章 MIQE 起来-7

广州市昊洋贸易有限公司

2023-12-15

我们在《如何使用 qPCR 技术成功的开展基因表达分析实验-上》中提到实验设计所需要考虑功效分析和反应板布局策略。接下来，小编将带领大家深入探讨一下。

◆ ◆ ◆ ◆

一、功效分析

科研人员经常会遇到的一个情况是，因为样本太少，无法证明实验中观察到的差异表达具有显著性。使用统计学上分析不足够的样本量可能会导致科学研究结果不充分，并造成时间损失、成本增加。事实上，科学研究中样本量的计算是关系到研究结论的关键问题之一，样本量对实验假设和研究设计有着至关重要的影响。

生物体本身固有的变异性可能与组间的实验差异相当，甚至超过后者。尤其是使用许多生物学重复来提高实验的统计学重要性时，这种变化就变得显而易见。虽然生物重复间的差异可能很大，但是足够数量的样本可以减少实验差异性。许多因素会导致实验变异，从而影响到达统计所需的生物重复的数量。

那么理想的研究样本量是多少？

这个问题的答案并不简单。从研究中获得统计学相关所需的样本量既取决于样本间差异、引入的技术差异，也取决于研究旨在显示的预期差异程度。如果要在生物变异较小的同质样本类型中寻找非常大的差异（如处理与未处理细胞培养的10倍变化），可能不需要很大的数据集就能显示出既有生物相关性又有统计学意义的差异。然而，当在一个异质性很强的样本集中寻找微小差异时，预计会有很大的生物学方差（如疾病状态之间的2倍变化，在来自不同人类个体的具有复杂细胞含量的组织类型，如病理组织切片），可能需要在每组中获得大量样本，以便获得生物相关差异的统计学意义。

因此，需要采用功效分析(power analysis)有助于确定有效可靠结论所需的样本数，它可用来评估得出有意义和统计学意义的结果所需的生物样本数量。

有时候超过10个的样本数量并不能保证最后能得到有显著表达量差异的结果（假如表达有显著差异是真实存在的），不到10个的样本数量在表达量差异很大的情况下也是足够的，这涉及到统计中的 power calculation，需要提供被比较的两个组表达量比值、标准差和设定的 α 和 β 水平，这样就可以计算出所需要的最少的样本数量。表达量比值和标准差等信息往往不能提前预知，需要查阅之前相似实验的数据，或者通过小规模的实验来获得粗略的信息。一般也可通过估算来得到所需的样本数量，如下图，可提供一定的参考意义。

在 power 一定的情况检测不同表达量差异所需的最少的样本数量[2]

另外功效分析可以通过简单的方法进行，例如使用专门的分析软件（如 G*Power），或使用🔗免费在线工具、下面分别简要介绍2种工具：

1. G*Power

G*Power 是一款为多种不同的 t 检验、F 检验、χ² 检验、z 检验和一些精确检验计算统计功率分析的工具。G*Power 还可用于计算效应大小，并以图形方式显示功效分析的结果，是多个文献所推荐的首推的计算样本大小（sample size）的工具。

具体操作可参考《🔗马庄实验室 G-power 学习教程》

2. Sample Size Calculators

一个免费且便捷的在线评估工具是由 benchmark 6 Sigma 开发的 Sample Size Calculators，采用不同的数学模型和公式，包含11个在线工具，此外还有其他丰富的功能以及使用指导，各位看官有兴趣可以一试。

比如下图的工具，使用 Mann Whitney Test 计算样本量，使用该 Calculator 可确定比较两个群体中位数所需的样本数。

“

小结：

建立大型实验可能既费钱又费时。如果已经知道研究中的变异来源和变异程度，前面提到的功效分析（Power Analysis）可以帮助计算所需的样本和重复次数。但是，如果不具备这方面的知识，那么进行一项规模较小的试验研究来确定这些因素可能会有所帮助，或者参考类似的文献，由此可以决定进行哪些重复，以及每组需要多少生物样本。

因此如果了解研究中预期的生物学和技术变异，进行功效分析是评估所需样本数量的一个非常有用的工具。

二、选择适当的反应板布局策略

我们上次讲到在 RT-qPCR 研究中，可以采用两种不同的反应板布局，下面再来温习一遍：

1、样本最大化方法

样本最大化方法，即在同一次运行中分析尽可能多的样本，在同一个反应板中涵盖尽可能多的同一种靶标基因，这意味着，如果没有足够的空余反应孔来在同一次运行中分析不同的基因，则应在不同的批次中分析不同的基因。

基因最大化方法

基因最大化方法则是在同一批次中分析多个基因，即相同样本中的多个基因放在同一个反应板上进行实验，并根据需要将样本分散到不同的批次中。在样本最大化方法不可行时，如果要比较不同批次运行中的样品，则需要考虑到板间校准。

在相对定量研究中，实验者通常对比较不同样本间特定基因的表达水平感兴趣，因此，强烈推荐使用样本最大化方法，因为它不会受到样本间由于技术差异、批次间差异（通常被低估）的影响

但实际操作中基因最大化方法也很常用，例如

无法在同一反应板上获得同一基因的所有样本时

初次实验数周或数月后再进行额外实验时

当然，qPCR 仪器上的不同批次运行之间也可能存在差异，比如：

qPCR 仪的加热模块温度不均匀

qPCR 光源过滤器和信号检测器的性能随时间推移而略有下降

qPCR 仪器上的数据分析设置（基准校正和阈值）可能略有不同

试剂（引物、聚合酶、荧光基团、buffer）的扩增效率不同

塑料耗材的光学特性不同

最重要的是，定量 Cq 值和相对表达量之间的关系取决于每个批次中的不同样品扩增情况，因此无论采用哪种板布局，只要不是所有的样品都在同一次运行中进行分析，就需要进行板间校准，以校正批次间可能存在的差异。为此，实验人员需要分析所谓的批次间校准（Inter-Run Calibration, 简称 IRC），它其实是在两个批次中设置相同样品，通过测量两次运行中 IRC 之间的 Cq 或归一化后相对量的差异，就可以计算出校正或校准因子，以消除批次间的差异，并像在同一次运行中分析所有样品一样进行分析。

基因最大化的具体布板示例如下图，可以看出在4个不同反应板（批次）都有一组相同的 IRC，即每次都运行相同的样本、检测相同的基因，本例中的 IRC 含有4种基因，每个基因3个重复，共12个样本。Bio-Rad CFX Maestro 软件中相对定量模型就采用了这种更准确的批间校准，具备自动识别和计算 IRC 的功能。

接下来让我们在学习一下 Jo Vandesompele 在2007发表的文章来具体比较一下2种布板方式，以及如何在实际中应用 IRC[3]。

基因最大化和样本最大化两种实验布板。使用样本最大化的方法，用2块板对11个样本的6个基因进行分析（右）。在基因最大化的情况下（左），需要设置 IRC（S1、S2、S3），以便将 S5-S7（板1）与 S8-S11（板2、板3）进行比较，因此需额外两块板。run2 中的 IRC 是在相同的 cDNA 稀释液上测量的，而run3 中的 IRC 是用来自相同 RNA 的新制备的 cDNA 上进行测量。

在基因最大化的情况下，11个样本分布在 run1 和 run2 上。样本1到3出现在两次 run 中，因此可以用作IRC。run5 包含样本最大化布板中的所有11个样本。当比较 run1 和 run2 之间的 IRC 的 Cq 值时，很明显 run2 中的 Cq 值系统性地较高（0.77个 cycles）。在将 Cq 值转换为 NRQs（考虑到3个内参基因的 Cq 差异）之后，样本1到3的 NRQ 值平均相差72%。基于来自不同 cDNA 制备的 IRCs 在 run1 和 run3 之间的校准结果，与通过样本最大化或者通过相cDNA 的批次间校准而获得的表达模式相同。

这些只是例子，尽管在精心设计和控制的实验中，这些差异可以最小化，但实际情况中它们可以大得多，而且通常是不可预测的。

样本和基因最大化的实验数据比较。将样本最大化方法（run5）与基因最大化方法（run1 和2以及 run1 和3）进行比较。对于 Cq 值，IRCs 之间的 Cq 值差异为0.77，NRQ 值之间的差异为72%，都可以在批间校准后消除。同一显示图中的灰色和白色表示数据来自不同的 run。

“

小结：

无论如何，通过进行适当的批间校准，这些产生于 PCR 批次运行间的差异可以得到纠正，由此产生的表达图谱（通过校准基因最大化的布板获得）与样本最大化方法（在没有 run间变异的情况下）高度相似。

建议使用多个 IRCs，比如使用2或更多个 IRC，则其中一个失败则不会影响整个实验结果。用多个 IRCs 进行校准，可以获得更精确的结果，误差更小。批次间校准的过程非常类似于均一化。均一化可消除样本特定的非生物学变化，而批次间校准消除了不同 runs 样本间的技术多样性差异。

“

最后提问大家一个问题，结合上面学到的知识，仔细想想下面阅读量1万+文章中的布板属于哪种类型，是否合理，欢迎文末留言交流~

布板方式

以图示96孔板为例，分实验组和对照组两组，检测 A，B，C，D 共4个基因，有两种布板方式可参考，其余情况依此类推。

每组3个生物学重复，每个生物学重复设置4个复孔，每个生物学重复按红色箭头所示加4个复孔，共3列，每列为1个生物学重复。

每组4个生物学重复，每个生物学重复设置3个复孔，每个生物学重复按蓝色箭头所示加3个复孔，共4行，每行为1个生物学重复。

作者认为按照此方法可最大程度避免加样误差，同时提醒请勿生搬硬套，仅供参考。

https://mp.weixin.qq.com/s/vg6EiQccXj1hoO7qZkNG0Q

未完待续

敬请关注“如何让你的 SCI 文章 MIQE 起来”系列文章，教会您如何在 MIQE 的指导下开展 qPCR（RT-PCR）实验，获得可靠的实验结果。

下期预告：

《如何设置正确的 qRT-PCR 对照》，敬请期待~

参

考

资

料

[1]Serdar CC, Cihan M, Yücel D, Serdar MA. Sample size, power and effect size revisited: simplified and practical approaches in pre-clinical, clinical and laboratory studies. Biochem Med (Zagreb). 2021;31:010502

[2]Dorak, M. Tevfik,ed. Real-time PCR. Taylor & Francis, 2007.

[3]Hellemans, J., Mortier, G., De Paepe, A. et al. qBase relative quantification framework and software for management and automated analysis of real-time quantitative PCR data. Genome Biol 8, R19 (2007). https://doi.org/10.1186/gb-2007-8-2-r19

* BIO-RAD是BIO-RAD LABORATORIES, INC. 在特定区域的商标。

* 本产品仅用于科研用途，不用于临床诊断。

【声明】内容源于网络

广州市昊洋贸易有限公司

生物科学信息交流，品牌宣传，产品推广，资源共享

内容 0

粉丝 0

广州市昊洋贸易有限公司生物科学信息交流，品牌宣传，产品推广，资源共享

总阅读0

粉丝0

内容0