WGCNA介绍
WGCNA(Weighted Gene Co-expression Network Analysis,加权基因共表达网络分析)是一种用于挖掘高维基因表达数据的系统生物学方法。它主要用于构建基因共表达网络,并识别与特定表型或生物学过程相关的基因模块和关键基因(Hub基因),能帮助研究者从全局视角探索基因间的相互作用及其潜在功能。百易汇能新上线“WGCNA”分析小工具,可以帮助广大科研工作者挖掘核心基因。
WGCNA分析绘图指南
一、检索云工具
1. 进入云工具网址:https://cloud.bioyigene.com/tool/index
2. 在搜索框中搜索“WGCNA”,点击进入。
进入云工具“基因共表达网络WGCNA分析”后的界面如下:
中间的区域为结果展示的区域,右边的区域是参数设置的区域。
参数设置的区域包括三部分,第一部分为图表说明,其中包含的工具的介绍,输入文件的格式和内容说明,参数调整的说明,结果文件的说明,以及常见的报错处理方式,建议详细阅读;第二部分为通用参数,可以上传文件,设置基本参数;第三部分是高级参数,用来对结果图片做进一步调整。
二、文件准备
可根据图表说明文档中的说明或示例文件进行准备。
示例文件获取方式如下:
输入文件可在excel中编辑好,然后另存为"文本文件(制表符分隔)(*.txt)"。需要注意的是,文件名以及文件中的内容只包含数字、字母、下划线,不能含有中文状态下的标点符号,特殊字符等。
基因共表达网络WGCNA分析的输入文件有2个,分别是基因的表达量文件(输入文件参数)和表型文件(表型文件参数),其中表型文件是可选参数,可以不输入,即不进行模块与表型的关联分析。
1. 基因的表达量文件:
第一列为基因ID,后续列为样本对应的表达量,基因数应小于10000个,如果大于10000个,将选取前10000个基因进行分析,因此建议挑选差异较大的基因进行分析。建议样本数应大于等于15个,少于15个样本的相关性将对网络的生物学意义产生较大噪音。如果可能,建议至少20个样本;样本数越多得到的结果的可靠性和准确度越高。如下所示:
2. 输入表型文件:
第一列为样本名,后续列为对应表型的值,列名为表型名称(使用字母+数字组合,不要使用中文和特殊字符),为数值,如果是质量性状,可输入1或0。必须注意的是表型文件中的样本名顺序需要与表达量文件中的顺序一致。如下所示:
三、运行
准备好输入文件后,按以下步骤上传准备好的输入文件并运行。
1. 首先上传输入文件,点击通用参数-选择文件
2. 进入文件列表窗口,点击上传文件,点击上传文件的按钮,在弹出的对话框中选择准备好的文件。
3. 上传成功后会跳转到文件列表窗口,点击选择对应的文件(上传后的文件保存在这里,如果之前上传过该工具的文件,可以直接选择之前上传的文件)。
4. 如果有表型文件,再按照上述步骤上传表型文件,最后点击“运行”即可。
5. 运行成功!点击“选择下载文件”即可进行下载。(如果输入的基因和样本数目较多,运行时间会变长,请耐心等待)。
更多参数设置请到云工具中进行调整!!
分析结果展示
视频讲解



