
还在为做不到实验而烦恼吗?今天小记者为小伙伴们又找到一篇16+的纯生信的TOP,让小伙伴们远离无实验的烦恼,轻松拿高分文章!让我们快来瞅瞅作者是怎么做到的吧!
作者利用DNA甲基化+生物标志物+公共数据库的思路,开发了一种新的高通量检测方法,并利用大量的公共数据库将DNA甲基化和游离DNA数据结合起来。(ps:作者检索了大量的公共数据库,要是有小伙伴们觉得有挑战的话,欢迎各位来麻烦小记者,生信日报为小伙伴们提供各种生信分析思路,扫码联系小记者哦)为了证明其标志物的准确性和可靠性,作者又运用公共数据库进行了大量的比较和验证,证明了其在肝癌诊断和治疗中的潜在应用价值,使文章的质量进一步得到了升华,这篇1区的top实至名归!

题目:高通量测试能够特异性检测肝细胞癌
杂志:Nature Communications
影响因子:IF=16.6
发表时间:2023年7月
后台回复“999”获取原文,文献编号240107
研究背景
这篇文章的研究背景是肝癌的早期诊断和治疗。肝癌是全球范围内最常见的癌症之一,也是最致命的癌症之一。然而,由于肝癌早期症状不明显,大多数患者在确诊时已经处于晚期,治疗效果较差。因此,早期诊断和治疗对于提高肝癌患者的生存率和预后至关重要。本文旨在通过分析DNA甲基化数据和游离DNA数据,探索肝癌早期诊断的新方法和新标志物,以提高肝癌的早期诊断率和治疗效果。同时,该研究还试图将这些新的肿瘤标志物与现有的肝癌标志物进行比较和验证,以确定其在肝癌诊断和治疗中的潜在应用价值。
数据来源
Data Set DNA origin |
Description |
Platform |
Public Availability |
N |
|
Non-cancer liver samples |
|
|
|
341 |
|
1 |
Liver |
Non-HCC- Diseases |
450 K |
GSE61258 |
79 |
2 |
Liver |
Liver Cirrhosis |
450 K |
GSE157973 |
130 |
3 |
Liver |
Healthy liver tissue |
450 K |
GSE69852 |
6 |
4 |
Liver |
Healthy liver tissue |
450 K |
GSE76269 |
10 |
5 |
Liver |
Adjacent non- tumor tissues |
450 K |
TCGA |
50 |
6 |
Liver |
Adjacent non- tumor tissues |
450 K |
GSE54503 |
66 |
Non-cancer non-liver samples |
|
|
909 |
||
7 |
Various tissues |
Adjacent non- tumor tissues |
450 K |
TCGA |
677 |
8 |
Lung |
Normal |
450 K |
GSE63704 |
26 |
9 |
Ovaries |
Normal |
450 K |
GSE65821 |
6 |
10 |
Stomach |
Normal |
450 K |
GSE85464 |
19 |
11 |
Airway epi- thelial cells |
Normal |
450 K |
GSE85566 |
115 |
12 |
Breast tissue |
Mamoplastic reduction |
450 K |
GSE60185 |
15 |
13 |
Pancreas |
Normal |
450 K |
GSE53051 |
12 |
14 |
Kidney, prostate, bladder |
Normal |
450 K |
GSE52955 |
16 |
15 |
Colon |
Normal |
450 K |
GSE42752 |
19 |
16 |
17 somatic tissues |
Normal |
450 K |
GSE50192 |
4 |
BLOOD |
|
|
|
|
968 |
17 |
Blood |
Healthy |
450 K |
GSE40279 |
656 |
18 |
Blood |
Healthy |
450 K |
GSE61496 |
312 |
Liver Cancer samples |
|
|
739 |
||
19 |
Liver |
Liver Cancer |
450 K |
TCGA |
380 |
20 |
Liver |
Liver Cancer |
450 K |
GSE76269 |
227 |
21 |
Liver |
Liver Cancer |
450 K |
GSE75041 |
66 |
22 |
Liver |
Liver Cancer |
450 K |
GSE54503 |
66 |
Non-liver Cancer samples |
|
|
8961 |
||
23 |
Nonliver cancer tissues |
31 types of non- HCC Cancers |
450 K |
TCGA |
8961 |
Plasma samples |
|
|
737 |
||
24 |
Plasma |
cfDNA |
MCTA-Seq |
GSE63775 |
183 |
25 |
Plasma |
cfDNA |
MiSeq |
This study |
554 |
研究思路
作者通过液体活检中肝细胞癌检测的 DNA 甲基化特征,与正常组织和血液特征的不同开发了一个分类器。利用高通量技术来确定最小数量的CpG位点,在仅使用四个CpG位点的甲基化信息,使得肝细胞癌检测具有100%的特异性,并在 TCGA HCC 数据中进行了验证。从单个 F12 基因 CpG 位点可有效区分 HCC 样本与 TCGA 和 GEO 数据存储库中的其他血液样本、正常组织和非 HCC 肿瘤,这些标记物在来自 HCC 患者和对照的单独血浆样本数据集中进行了验证。作者通过新一代测序和多重技术设计了一种高通量检测方法,分析了 554 名临床研究参与者的血浆样本,其中包括 HCC 患者、非 HCC 癌症、慢性乙型肝炎和健康对照。结果显示该方法的HCC 检测对高危个体实施这种检测可以显着降低 HCC 发病率和死亡率。
主要结果
1. 描绘血液和正常组织中普遍存在的抗甲基化 CpG 位点
作者首先通过分析公开可用的DNA甲基化数据集,确定了一些在所有正常组织和血液中都不甲基化的CpG位点,然后筛选出了一些在肝细胞癌(HCC)中高度甲基化的CpG位点,作为HCC检测的候选标记物。他们最终选定了四个CpG位点,分别位于CHFR、VASH2、CCNJ和GRID2IP基因附近,构成了一个称为“HCC-detect”的多基因甲基化评分,可以有效地区分HCC样本和正常样本(图1A-C)
2. “HCC- detect”的发现和验证
作者进一步通过比较HCC和其他31种癌症的DNA甲基化数据集,发现了一个位于F12基因内的CpG位点,可以作为HCC特异性的标记物。他们称之为“HCC-spec”,并建立了一个基于该位点的甲基化评分,可以高度准确地鉴别HCC和其他癌症(图2A-F)
作者使用了DNA甲基化450K芯片数据,对739个HCC样本、116个邻近非肿瘤组织(NATs)样本、16个健康肝脏样本和968个血液样本进行了“HCC-detect”标记物的验证(图1D)。作者根据方法部分的描述,计算了公开数据中11718个样本的“HCC-detect”评分,并发现它可以显著地区分HCC和其他所有组别(图1E)。图1E显示了不同组别的“HCC-detect”评分的散点图。作者还进行了不同比较的受试者工作特征曲线(ROC)分析,显示了“HCC-detect”标记物的优异的生物标志物特性。“HCC-detect”评分可以检测到早期和晚期的HCC样本(图1I)。当给每个CpG位点赋予相同的权重,假设任何一个CpG位点的甲基化都足以将一个样本归类为HCC时,得到了类似的AUC值,尽管某些CpG位点在更高比例的HCC样本中甲基化(>20%)比其他位点更多,但可以高度准确地鉴别HCC和其他癌症。

图1:“HCC-检测”DNA 甲基化标记集的训练和验证
3. “HCC-spec”的发现和验证
作者首先通过分析TCGA数据库中包含31种癌症的DNA甲基化数据集,发现“HCC-detect”评分可以优先检测出HCC,但也会检测出其他癌症,降低了区分HCC和其他肿瘤的特异性和敏感性(图1H)。他们随机选取了230个来自TCGA的DNA甲基化样本,包括17种不同的癌症(210个样本)、10个HCC样本和10个健康血液样本,筛选出了7个可以区分HCC和其他来源肿瘤的CpG位点(图2B);其中位于F12基因内的cg14126493具有最大的效应,被命名为“HCC-spec”。他们根据线性回归方程,计算了F12的加权甲基化评分,可以在240个样本的混合物中正确地分类所有HCC样本。受试者工作特征曲线(ROC)分析显示,HCC与其他所有样本的AUC为0.9973(图2C)。
作者进一步通过比较HCC和其他31种肿瘤、非恶性组织和HCC样本的DNA甲基化数据集,验证了“HCC-spec”评分的有效性和优势(图2D)。“HCC-spec”评分在HCC和健康血液、健康组织、邻近非肿瘤组织(NATs)和其他癌症之间有显著差异,但在HCC和健康肝脏组织以及肝脏疾病样本之间没有显著差异(图2E)。HCC与所有其他癌症的AUC为0.988(图2F),与正常血液的AUC为0.981(图2G),与健康组织的AUC为1。HCC与非恶性肝脏DNA的AUC明显降低;对于健康肝脏组织,AUC为86%,对于肝脏疾病组织,AUC为0.84。
“HCC-detect”和“HCC-spec”评分的组合对于区分HCC和所有其他样本的AUC为0.9862(图2G)。根据这个ROC计算出的阈值,其他肝脏组织和肝脏疾病DNA将以50%的比率被检测出来。一个更高的阈值可以区分HCC和其他肝脏疾病。“HCC-detect”可以将胆管癌样本分类为癌症,ICC与健康血液的AUC为0.9875,但是“HCC-spec”不能区分ICC和血液,AUC为0.5436,并且在将“ICC与NATs”进行分类时敏感性较低,AUC为0.833。在TCGA的HCC数据集中,“HCC-detect”和“HCC-spec”评分在白人、亚洲人和黑人或非洲裔美国人之间没有显著差异。

图2: “HCC-spec”DNA 甲基化标记集的培训和验证
“HCC-detect”和“HCC-spec”包含的基因在另一个不同的验证集中表现出显著的甲基化差异,该验证集包含了HCC的血浆游离DNA和肿瘤样本,与肝硬化和正常肝脏进行比较(图3A、B、D、E),除了GRID2IP,在HCC组织样本中表现出显著的甲基化差异(图3C),但在血浆中没有达到显著水平,因为血清样本中的读数较低(图3C)。重要的是,无论是肿瘤还是血浆中的肝硬化样本都没有甲基化。
作者将“HCC-spec”和“HCC-detect”DNA甲基化标记物(图4A)与报道的两个具有很高潜力的HCC生物标志物进行了比较(图4B、C),使用了来自上述11701个样本的Illumina 450K芯片的DNA甲基化值。图4的热图表明,尽管之前发表的标记物在HCC和HCC-NAT样本之间显示出甲基化的显著差异,但在其他癌症和正常组织中也存在高水平的DNA甲基化。这里描述的“HCC-detect”和“HCC-spec”的组合标记物显示出一种明显的差异,即HCC中高度甲基化,而其他组织和大多数癌症中则明显低甲基化。虽然“HCC-detect”标记物中的两个位点在几种癌症中也有不同程度的甲基化(图4A、B),但F12“HCC-spec”则只在HCC和肝脏疾病样本中甲基化,而在其他癌症、正常组织或血液中则不甲基化(图4D)。

图3: 验证 GSE63775 数据集中“HCC-spec”和“HCC-detect”CpG 位点的差异甲基化

图4: “HCC-检测和规范”组合与之前发布的两种生物标志物的癌症类型特异性的比较
4. 在血浆 cfDNA 临床研究中验证“HCC- detect”和“HCC-spec”DNA 甲基化
作者首先分析了来自HCC患者、健康人和慢性乙型肝炎患者的血浆游离DNA中“HCC-detect”和“HCC-spec”标记物所在基因的甲基化模式,发现除了CCNJ之外,其他基因在HCC患者中都表现出高度甲基化,而在对照组和慢性乙型肝炎患者中则几乎没有甲基化(图5A)。甚至在早期HCC阶段,也观察到了高度甲基化,与TCGA的HCC数据集中得到的结果一致(图1I)。他们还注意到,“HCC-detect”和“HCC-spec”包含的CpG位点与靶向序列中相邻的CpG位点之间有很高的甲基化水平一致性。

图5: 验证达卡临床研究血浆样本中的“HCC-检测”和“HCC-spec”以及来自 InnovativeTM Research 的健康血浆
计算了“HCC-detect”和“HCC-spec”的加权甲基化评分,发现它们可以显著地区分HCC组和健康对照组或慢性乙型肝炎组(图5C、E),但在慢性乙型肝炎组和两个健康对照组之间没有显著差异。重要的是,无论是“HCC-detect”评分还是“HCC-spec”评分,在早期和晚期HCC阶段都与对照组和慢性乙型肝炎组有显著差异(图5D、F),但在HCC阶段之间没有显著差异。“HCC-detect”评分的AUC为0.93(图6A)。他们使用1000次自助法重复计算了“HCC-detect”和“HCC-spec”的95%置信区间,并根据健康对照组和A期、B期、C期和D期进行了比较。使用从三个随机抽样的训练数据集得到的模型进行交叉验证,显示“HCC-detect”和“HCC-spec”的预测在HCC组和健康对照组或慢性乙型肝炎组之间有显著差异。
使用逻辑回归模型将“HCC-detect”评分作为HCC概率的预测因子(图6B),并使用逻辑回归方程为每个人计算了一个预测概率(图6C)。HCC样本聚集在概率为1的附近,少数CHB样本被预测为概率为1,而大多数健康和CHB样本的中位数则在预测概率为0.5左右。“HCC-spec”评分的AUC为0.89,特异性为91%,敏感性为67%(图6D)。他们计算了“HCC-spec”评分的逻辑回归方程(图6E)和每个人的预测概率(图6F)。

图6: “HCC-检测”和“HCC-spec”Mscore 的生物标志物特征
作者计算了46个健康对照组和302个HCC患者的“HCC-detect”和“HCC-spec”评分的组合概率的ROC曲线,将其命名为“epiLiver”(图7A)。计算得到的AUC为0.94。包括早期阶段在内的每个HCC阶段的中位数评分彼此没有差异(图7B、C)。他们根据AUC曲线计算出一个阈值组合概率(1.62),并用它将样本分为HCC(1)或非HCC(0)(图7D)。这个阈值可以准确地分类93.5%的对照样本,71%的A期样本,86%的B期样本,82%的C期样本和92%的D期样本(图7E)。使用这个阈值,12%的慢性乙型肝炎(CHB)样本被分类为HCC,而对照组中只有5%。

图7:通过组合的“HCC-检测”和“HCC-spec”概率评分(“epiLiver”)对 HCC 进行分类
5. 比较 EpiLiver 标志物、AFP 及其组合作为 HCC 预测因子
作者比较了“epiLiver”标记物、α-胎儿蛋白(AFP)和它们的组合作为HCC预测因子的性能。他们发现“epiLiver”标记物比AFP具有更高的敏感性和特异性,尤其是在早期HCC阶段。而且,“epiLiver”标记物和AFP的组合可以进一步提高对HCC的预测准确度(图8A-F)

图8:用AFP和epiLiver预测HCC
文章小结
这篇文章的思路和方法具有很强的创新性。首先,该研究发现了一种新的DNA甲基化生物标志物,可以将肝癌与其他组织和疾病进行区分。其次,该研究将DNA甲基化和游离DNA数据结合起来,开发了一种新的高通量检测方法,可以在肝癌早期阶段进行检测,并且具有高度的检测准确性。最后,该研究还与现有的肝癌标志物进行了比较和验证,证明了其在肝癌诊断和治疗中的潜在应用价值。这些创新性的思路和方法为肝癌早期诊断和治疗提供了新的思路。感兴趣的朋友,赶快行动起来吧!
小记者话生信
如果您的时间和精力有限或者缺乏相关经验,并且对生信分析和期刊推荐有所需要的话,“生信日报”非常乐意为您提供如下服务:免费思路评估、付费生信分析和方案设计以及付费选刊等,有意向的小伙伴欢迎咨询小记者哦!
生信分析
思路设计
扫码咨询小记者
1、注意!这个8分+『NHANES数据库分析友好期刊』On hold了!可能会被踢出SCI ···
2、7分+生信友好Nature子刊,质量过硬,影响因子看涨,但审稿速度拉垮,急稿建议绕行~
3、4分+中医药方向期刊,大量接收网络药理学!国人友好,审稿速度快,投稿看过来~
END

