大数跨境
0
0

生信分析高手必备:这6种图表你掌握了吗?

生信分析高手必备:这6种图表你掌握了吗? 派森诺基因云
2025-10-15
0
导读:让数据更优雅的说话 让图表更具审美质量

生信分析常用的图表

差异检验箱线图:直观展示组间差异;

关联热图和RDA冗余分析:揭示变量与环境驱动关系;

交互热图和网络热图:呈现复杂系统内互作关系;

韦恩图:展示共有与独有元素。


一、差异检验箱线图

每组至少3个样品,每列数据对应一个箱线图子图,其中展示了Kruskal-Wallis非参数检验获得的组间总体差异的P值、以及各组之间Dunn's test事后两两比较获得的差异显著性水平的标记(*P<0.05;**P<0.01;***,P<0.001)。

图表颜色

可切换不同的色卡,运用在图表

面板设置

设置每个分组的面板的宽度


二、关联热图

关联热图:用于对物种丰度和生化指标或影响因子之间的相关性分析。单元格样式多样化,参数设置可调整项非常丰富。

单元格样式

circle、color、ellipse、number、pie、shade、square

参数调整

1、相关性算法:
①Spearman等级相关系数:非参数统计方法,适用于非正态分布的数据,比如微生物数据,基本都是非正态分布数据,默认推荐spearman算法进行相关性分析;
②Pearson相关性系数:适用于符合正态分布的变量;
③Kendall秩相关系数:适用于有序分类变量。

2、pearson、kendall、spearman

3、显示星标:调整星标水平、大小、颜色

4、p值筛选:1、0.05、0.01、0.001

5、R值筛选:根据提供的范围输入数值

6、物种数目:根据提供的范围输入数值

7、未鉴定物种:删除、不删除


三、RDA冗余分析

RDA是一种约束排序方法。它的核心目的是解释一组解释变量(通常是环境因子)如何影响一组响应变量(通常是物种多度数据)的变异。

1. 样本点:每个点代表一个样本,不同颜色的点属于不同分组,两点之间的距离越接近,说明两个样本的菌群组成/功能相似度越高。

2. 环境因子箭头:

  • 蓝色箭头代表不同的环境影响因子。

  • 箭头间的夹角:表征环境因子之间的相关性。

  • 锐角:正相关;直角:不相关;钝角:负相关

  • 箭头长度:代表该因子对菌群分布的影响程度。射线越长,表明该因素的影响力越大。

3. 环境因子与排序轴的关系:

  • 箭头与坐标轴的夹角大小,代表该因子与此排序轴的相关性。夹角越小,相关性越高。

4. 环境因子与样本的关系:

  • 将样本点垂直投影到某个环境箭头的延长线上,投影点的位置可近似反映该环境因子在此样本中的数值大小。

5.  坐标轴括号中的百分比,表示该坐标轴能够解释的菌群组成或功能总差异的比例。

图表类型

散点图、按组连线、置信椭圆

参数调整

1、椭圆置信度:0.95、0.95、0.95

2、数据标准化:none、total、max、frequency等8种

3、得分缩放:none、sites、species、symmetric

4、样品名/物种:是否显示

5、排序方法:goodness、abundance

6、物种数量:输入数值进行控制

7、对应因子:勾选图表中因子进行展示

8、对应分组:勾选图表中展示的分组


四、交互热图

展示多个样品之间的关系或相关性。如下图所示,颜色(红正 / 蓝负)越红表示正相关越强,越蓝表示负相关越强,可快速识别样品间的相似性与差异性。

单元格样式

正方形、颜色、椭圆、数字

聚类显示

可对行列、仅行、仅列进行聚类,也可选择不聚类。

名称显示

与聚类显示类似,可灵活设置行列、仅行、仅列的名称显示,或选择不显示。

单元格宽高设置

根据合理需求调整单元格的宽高


五、韦恩图

通过圆形的重叠关系展示有限集合(通常为2–5个)之间的逻辑关系及共同元素数量。

图表类型

经典韦恩图、齿轮韦恩图

图表颜色

支持按分组自定义配色


六、网络热图

图形由热图和网络图组成,热图展示组学内的相关性,网络图展示组学间的关联性。以微生物矩阵与环境因子矩阵关联关系为例:

热图:展示各环境因子之间的相关性。

1. 相关性大小:以颜色梯度(红正 / 蓝负)与格子大小双重映射相关性值,颜色为红色且格子大,表明相关性绝对值大;反之则小。颜色趋近红色正相关强,趋近蓝色负相关强。

2. 相关性标注:热图格子内数值为环境因子相关性值,星号表示显著性大小。

网络图:展示微生物矩阵与环境因子矩阵之间的关联关系。

1. 节点构成:微生物矩阵包含node、node1、node2三类节点。

2. 关联呈现:

  • 粗细:节点与环境因子连线粗细反映相关性,越粗相关性越强。

  • 颜色:连线颜色体现显著性,红色代表P值<0.01,即节点与环境因子相关性统计显著。

丰度数据

添加Node节点,其实就是添加更多网络线

距离算法:bray、manhattan、euclidean、canberra、bray等10种方法

检验方法:mantel、mantel.randtest、mantel.rtest、mantel.partial

因子数据

标准化:是否标准化

距离算法:跟丰度数据的距离算法一致

相关性算法:pearson、spearman、kendall

热图图表

可设置热图位置,并通过格子大小、颜色等方式表示相关性。


百度搜索“派森诺基因云”,或直接访问官方网站 https://www.genescloud.cn/home,点击进入“云图汇”,通过输入“ 对应图表名称 ”关键词,开启您的个性化体验之旅。温馨提示:平台现已正式接入DeepSeek-R1满血版,您可以根据需求切换不同模型进行体验。在绘图过程中,如果遇到常见问题,建议先使用PAI绘图小助手进行自助解决;若有个性化需求或遇到无法解决的问题,欢迎通过【工单中心】与平台联系,提出您的需求或建议。派森诺基因云始终秉持“持续创新,不断升级”的理念,未来将推出更多精美的可视化图表与实用的分析工具,期待您的使用与反馈!



供稿  | 大数据研发部

编辑  | 市场部


1

END

1


派森诺基因云,由国内外精英硕博团队倾力打造,凭借阿里云的强大的计算与存储优势,致力于为全球科研与医疗领域提供生物信息大数据分析与可视化解决方案。我们整合微生物组、转录组、基因组学、代谢组学、单细胞组学,以及多组学联合等多领域的分析研究,通过个性化定制服务和“一键式”简单操作,降低数据分析的复杂度,加速科研创新的步伐。

我们精心打磨百余款可视化工具矩阵,让复杂科研数据一目了然。此外,我们还结合的先进AI技术,推出PAI智能问答助手与绘图助手,高效为客户提供绘图指南。派森诺基因云将持续深化多组学技术应用与探索,为生命科学突破贡献力量,携手全球用户共启生物信息时代新篇章。

【声明】内容源于网络
0
0
派森诺基因云
内容 783
粉丝 0
派森诺基因云
总阅读47
粉丝0
内容783