宏基因组云分析的数据管理系统,系统核心包含五大功能模块:分为命名分组管理、理化因子创建、Reads数据集创建、Genes数据集创建、一键式分析创建。这些模块紧密衔接,共同支撑从样本管理、数据预处理到最终分析的完整工作流。
一、样本命名分组管理
通过上传文件,实现样本的分组方案和命名方案创建,解决繁琐的创建工作,为大规模样本提供批量快捷创建方式,简化操作流程。
二、理化因子创建与运用
理化因子创建
支持自定义上传因子文件,对已上传的因子文件,可对其中的因子进行配置:设定数据类型(数值型或分类型),并可编辑因子的分组名称。
理化因子应用
因子文件上传完成后,即可在微生物-理化联合分析章节去分析,以“多重共线性分析”为例,在分析设置的“因子数据设置”中,选择您上传的因子文件,点击运行。分析完成后,在图表上方切换“分析记录”以查看图表。
三、数据集创建与运用
Reads数据集创建
首先录入基础信息,在物种过滤页面,搜索分类单元勾选参数进行分析。
Genes数据集创建
首先录入基础信息,然后根据页面提供的三种过滤方式来新建流程,最后根据选择的过滤方式,来进行对应的参数分析。另外创建成功的数据集,必须要在“数据集管理列表”中点击运行按钮去运行,运行成功之后,在对应的页面可查看创建成功的数据集。
|
过滤方式 |
新建流程 |
配置流程 |
|
基因过滤 |
无参数 |
1.代表基因长度、代表基因序列要求完整 |
|
2.以及来源:Virus、Plasmid、Provirus、Chromosome |
||
|
物种过滤 |
无参数 |
支持按照层级来搜索分类单元 |
|
功能过滤 |
可选择27种不同的数据库进行分析,如KEGG、MetaCyc、GO、CARD、eggNOG、ARDB等 |
1.选择功能过滤方式:多数据库交集(默认)、多数据库并集 |
|
2.根据新建流程选择的数据库,来选择分类单元 |
数据集应用
运行成功的数据集,以组成分析 / (物种) 组成分析为例子,在图表的右侧分析设置找到“数据集模块”,下拉找到创建的数据集,然后去运行。分析完成后,在图表上方切换数据集,切换即可展示对应的结果。
四、一键式分析创建与运用
数据集生成的结果是进行一键式分析的基础。正常分析流程,我们需要逐一手动配置并运行每个分析章节。而“一键分析”功能则能批量生成多章节的分析结果,极大提升了分析效率。
一键式分析创建
创建一键式分析时,首先需选定数据集类型。系统提供“Genes集”与“Reads集”两种选项,创建成功的相应数据集将呈现于下拉框中,作为后续分析的基础。
创建Genes集
|
基础信息配置 |
选择数据集、分析记录名称、分组方案、命名方案等; |
|
分析章节 |
系统提供物种 / 功能水平章节;如组成分析、Alpha多样性分析、Beta多样性分析、关键物种分析等; |
|
物种参数设置 |
系统提供默认参数以及通用参数设置;如丰度单位、分类水平、未注释处理、距离算法、差异分析方法等; |
|
功能参数设置 |
系统提供默认参数以及通用参数设置;如丰度单位、数据库、功能水平、距离算法、差异分析方法等; |
|
配色方案 |
可以使用系统预设图表颜色去分析,也可以自定义离散色和渐变色。 |
创建Reads集
Reads集的一键式创建流程与Genes集基本一致,但在分析章节方面存在差异,Reads集仅涉及物种水平章节。
一键式分析运用
以Alpha多样性指数章节为例子,运行成功的数据集及其对应的一键式分析记录,可在图表上方的分析记录或左侧分析设置中查看和切换。
百度搜索“派森诺基因云”或直接访问官方网站https://www.genescloud.cn/home进入平台。登录后,点击“云分析”功能模块,通过搜索关键词宏基因组分析,快速找到所需的产品。温馨提示:平台现已正式接入DeepSeek-R1满血版,您可以根据需求切换不同模型进行体验。在绘图过程中,如果遇到常见问题,建议先使用PAI绘图小助手进行自助解决;若有个性化需求或遇到无法解决的问题,欢迎通过【工单中心】与平台联系,提出您的需求或建议。派森诺基因云始终秉持“持续创新,不断升级”的理念,未来将推出更多精美的可视化图表与实用的分析工具,期待您的使用与反馈!
供稿 | 大数据研发部
编辑 | 市场部
1
END
1

