欢迎关注R语言数据分析指南
❝本节继续来分享nature methods上一篇论文中一张案例图,使用ggplot2来绘制多指标基线图。此次来介绍Figure_2,论文作者提供了对应的代码及数据仔细阅读论文均可找到相应文件,小编根据个人对代码的理解进行了些许修改,更多关于该图的详细内容请查看论文内详细介绍。
论文信息
Feature selection methods affect the performance of scRNA-seq data integration and querying
论文图
代码获取
https://github.com/theislab/atlas-feature-selection-benchmark
基线图介绍
❝基线图(Baseline Plot)是一种用于 展示不同基线方法的表现和数据分布 的可视化工具。它的主要目的是在不同的算法或方法之间进行比较,尤其是在 基准测试 和 性能评估 过程中,帮助研究人员和工程师选择最适合的模型或算法。基线图通常通过图形方式呈现方法的 基准表现,从而帮助识别哪些方法超越了基准水平,哪些则表现较差。
基线图的关键特征
1.基线范围(Baseline Range):
•图中的基线范围通常以 阴影区域或区间 来表示。这些范围表示某个特定基准方法或评估指标的 表现区间,通常包括 最大值、最小值和中位数。
•基线范围帮助比较不同方法的表现是否超出了这个区间,判断哪些方法有显著优势。
2.基线方法(Baseline Methods):
•基线方法是已经存在的标准方法,通常是一个参考点。图中可能通过 不同形状的点、线或颜色 来表示每种基线方法的表现。
•这些方法可能是 随机方法、传统算法 或 默认设置,也可能是 领域中公认的最佳方法。
3.评估指标(Evaluation Metrics):
•图中展示的指标可以是多种不同的衡量标准,诸如 分类准确率(Classification Accuracy)、F1 值(F1 Score)、误差率(Error Rate)、一致性(Consistency)、映射准确度(Mapping Accuracy) 等。
•这些指标可以衡量算法在特定任务(如分类、聚类、回归等)中的效果。
4.数据集(Datasets):
•基线图通常涉及多个数据集,用以评估算法在不同场景下的表现。每个数据集代表了一个不同的 任务、数据类型或应用场景。
代码展示
library(tidyverse)
# 读取数据
baseline_ranges <- read_tsv("baseline_ranges.tsv")
baselines <- read_tsv("baselines.tsv")
# 定义主题
theme_features <- function(...) {
ggplot2::theme_minimal(...) +
ggplot2::theme(
panel.border = ggplot2::element_rect(fill = NA),
strip.text = ggplot2::element_text(colour = "white"),
strip.background = ggplot2::element_rect(fill = "black")
)
}
数据可视化
ggplot(baseline_ranges,aes(y = fct_rev(Dataset))) +
geom_linerange(
aes(xmin = Lower, xmax = Upper, colour = Type),
linewidth = 2, alpha = 0.5
) +
geom_point(
data = baselines,
aes(x = MeanValue, shape = Method, fill = Method),
size = 1, colour = "white"
) +
scale_x_continuous(
limits = c(0, 1),
breaks = c(0, 0.25, 0.5, 0.75, 1.0),
labels = c(0, 0.25, 0.50, 0.75, 1)
) +
scale_shape_manual(
values = c(
"circle filled",
"diamond filled",
"square filled",
"triangle filled"
),
name = "Baseline method"
) +
scale_colour_brewer(palette = "Set1") +
scale_fill_brewer(palette = "Dark2") +
labs(
x = "Metric value (higher is better)",
fill = "Baseline method",
colour = "Metric type"
) +
facet_wrap(~ Metric) +
theme_features() +
theme(
legend.position = "bottom",
legend.box = "vertical",
legend.margin = margin(0, 0, 0, 0),
legend.spacing.y = unit(0, "cm"),
axis.title.y = element_blank(),
)
关注下方公众号下回更新不迷路
购买介绍
❝本节介绍到此结束,有需要学习R数据可视化的朋友欢迎到淘宝店铺:R语言数据分析指南,购买小编的R语言可视化文档,2025年购买将获取2025年更新的内容,同时将赠送2024年的绘图文档内容。
更新的绘图内容包含数据+代码+注释文档+文档清单,小编只分享案例文档,不额外回答问题,无答疑服务,更新截止2025年12月31日结束,零基础不推荐买。
案例特点
❝所选案例图绝大部份属于个性化分析图表,数据案例多来自已经发表的高分论文,并会汇总整理分享一些论文中公开的分析代码。
2025年起提供更加专业的html文档,更加的直观易学。文档累计上千人次购买拥有良好的社群交流体验,R代码结构清晰易懂.


目录大纲展示
群友精彩评论
淘宝店铺
2025年更新案例图展示




2024年案例图展示


































