大数跨境
0
0

[论文分享]跟着Nature Methods学绘图多指标基线范围评估图

[论文分享]跟着Nature Methods学绘图多指标基线范围评估图 R语言数据分析指南
2025-03-16
2

欢迎关注R语言数据分析指南

本节继续来分享nature methods上一篇论文中一张案例图,使用ggplot2来绘制多指标基线图。此次来介绍Figure_2,论文作者提供了对应的代码及数据仔细阅读论文均可找到相应文件,小编根据个人对代码的理解进行了些许修改,更多关于该图的详细内容请查看论文内详细介绍。

论文信息

Feature selection methods affect the performance of scRNA-seq data integration and querying

论文图

代码获取

https://github.com/theislab/atlas-feature-selection-benchmark

基线图介绍

基线图(Baseline Plot)是一种用于 展示不同基线方法的表现和数据分布 的可视化工具。它的主要目的是在不同的算法或方法之间进行比较,尤其是在 基准测试 和 性能评估 过程中,帮助研究人员和工程师选择最适合的模型或算法。基线图通常通过图形方式呈现方法的 基准表现,从而帮助识别哪些方法超越了基准水平,哪些则表现较差。

基线图的关键特征

1.基线范围(Baseline Range):
•图中的基线范围通常以 阴影区域或区间 来表示。这些范围表示某个特定基准方法或评估指标的 表现区间,通常包括 最大值、最小值和中位数。
•基线范围帮助比较不同方法的表现是否超出了这个区间,判断哪些方法有显著优势。
2.基线方法(Baseline Methods):
•基线方法是已经存在的标准方法,通常是一个参考点。图中可能通过 不同形状的点、线或颜色 来表示每种基线方法的表现。
•这些方法可能是 随机方法、传统算法 或 默认设置,也可能是 领域中公认的最佳方法。
3.评估指标(Evaluation Metrics):
•图中展示的指标可以是多种不同的衡量标准,诸如 分类准确率(Classification Accuracy)、F1 值(F1 Score)、误差率(Error Rate)、一致性(Consistency)、映射准确度(Mapping Accuracy) 等。
•这些指标可以衡量算法在特定任务(如分类、聚类、回归等)中的效果。
4.数据集(Datasets):
•基线图通常涉及多个数据集,用以评估算法在不同场景下的表现。每个数据集代表了一个不同的 任务、数据类型或应用场景。

代码展示

library(tidyverse)
# 读取数据
baseline_ranges <- read_tsv("baseline_ranges.tsv")
baselines <- read_tsv("baselines.tsv")
# 定义主题
theme_features <- function(...) {
  ggplot2::theme_minimal(...) +
    ggplot2::theme(
      panel.border = ggplot2::element_rect(fill = NA),
      strip.text = ggplot2::element_text(colour = "white"),
      strip.background = ggplot2::element_rect(fill = "black")
    )
}

数据可视化

ggplot(baseline_ranges,aes(y = fct_rev(Dataset))) +
  geom_linerange(
    aes(xmin = Lower, xmax = Upper, colour = Type),
    linewidth = 2, alpha = 0.5
  ) +
  geom_point(
    data = baselines,
    aes(x = MeanValue, shape = Method, fill = Method),
    size = 1, colour = "white"
  ) +
  scale_x_continuous(
    limits = c(01),
    breaks = c(00.250.50.751.0),
    labels = c(00.250.500.751)
  ) +
  scale_shape_manual(
    values = c(
      "circle filled",
      "diamond filled",
      "square filled",
      "triangle filled"
    ),
    name = "Baseline method"
  ) +
  scale_colour_brewer(palette = "Set1") +
  scale_fill_brewer(palette = "Dark2") +
  labs(
    x = "Metric value (higher is better)",
    fill = "Baseline method",
    colour = "Metric type"
  ) +
  facet_wrap(~ Metric) +
  theme_features() +
  theme(
    legend.position  = "bottom"
    legend.box       = "vertical",
    legend.margin    = margin(0000),
    legend.spacing.y = unit(0"cm"),
    axis.title.y     = element_blank(),
  )

关注下方公众号下回更新不迷路

购买介绍

本节介绍到此结束,有需要学习R数据可视化的朋友欢迎到淘宝店铺:R语言数据分析指南,购买小编的R语言可视化文档,2025年购买将获取2025年更新的内容,同时将赠送2024年的绘图文档内容

更新的绘图内容包含数据+代码+注释文档+文档清单,小编只分享案例文档,不额外回答问题,无答疑服务,更新截止2025年12月31日结束,零基础不推荐买。

案例特点

所选案例图绝大部份属于个性化分析图表,数据案例多来自已经发表的高分论文,并会汇总整理分享一些论文中公开的分析代码。
2025年起提供更加专业的html文档,更加的直观易学。文档累计上千人次购买拥有良好的社群交流体验,R代码结构清晰易懂.

目录大纲展示

群友精彩评论

淘宝店铺

2025年更新案例图展示

2024年案例图展示


【声明】内容源于网络
0
0
R语言数据分析指南
R语言重症爱好者,喜欢绘制各种精美的图表,喜欢的小伙伴可以关注我,跟我一起学习
内容 1180
粉丝 0
R语言数据分析指南 R语言重症爱好者,喜欢绘制各种精美的图表,喜欢的小伙伴可以关注我,跟我一起学习
总阅读222
粉丝0
内容1.2k