大数跨境

知否知否应是GSEA——转录组数据分析看过来(二)

知否知否应是GSEA——转录组数据分析看过来(二) 基因快讯
2019-03-19
0
导读:升级后的网页版GSEA,对每个基因集又做了一次转录因子富集分析,激酶-底物富集分析,再结合差异表达基因和蛋白质网络互作, 绘制出Arc Diagram。它更全面、灵活、便捷的方式帮助用户在基因集而不是


2019

一年之计在于春,2019春玩转GSEA,

一年实验不用愁,2020发文章

春暖

花开

上期小编给大家介绍了GSEA的基础原理,阐述了为什么要做GSEA,以及我司的优化的GSEA的亮点,接着一段视频欣赏重磅升级的GSEA网页版的效果!



升级的GSEA

亮点一

1.GSEA所有图形的分辨率都是出版级别, 适用于任何高影响因子的杂志。

亮点二

我司GSEA图相比Broad Institute图增加了阴影区域标示零假设分布,这样更容易比较看出p-value的显著性,便于用户更直观比较数据结果的准确性。

亮点三

结合GSEA检出的差异功能集,后续还可以进行其它数据分析,进一步解读转录组下游功能,如在差异基因集中做转录因子分析;并提取转录因子显著富集结果进行激酶底物富集分析,汇总推测得到的Kinase(激酶), TF(转录因子), DEG(差异基因)之间的关系, 以及DEG之间的PPI调控关系, 并把它们之间的关系以Arc Diagram图展示(如下图)。

亮点四

我们的结果都以html网页版的形式展出,输出为出版级别的矢量图(svg),结合第三方矢量图编辑软件(inkscape等),用户可以把各组样本灵活组合成图,修改样本名称,以及在总的热图中挑选自己关注的基因组合成新的热图,并保存为不同的图片格式。



一觉醒来春已到

最后对GSEA中几个关键的概念做个介绍:

ES

富集得分 (ES, enrichment score). 它反应基因集成员s在排序列表L的两端富集的程度,它反映的是将全部芯片数据或测序数据按表达量大小排序后,在此序列的前部或后部一个功能基因集富集的程度。当 ES 值为正,表示某一功能基因集富集在排序序列的前方,当 ES 值为负,表示某一功能基因集富集在排序序列的后方。

计算方式是,从基因集L的第一个基因开始,计算一个累计统计值。当遇到一个落在s里面的基因,则增加统计值。遇到一个不在s里面的基因,则降低统计值。每一步统计值增加或减少的幅度与基因的表达变化程度(更严格的是与基因和表型的关联度)是相关的。

NES

ES标准化处理的值,为什么要做标准化处理:因为各个功能基因集中所包含的基因数不同,而且不同的功能基因集与要分析的目标基因列表也不同,因此在比较数据集在不同功能基因集中的富集程度时,需要对ES进行标准化处理。


LEADING EDGE

LEADING EDGE:领头亚集。领头亚集中的基因是指对ES 值贡献最大的基因集合。当 ES 为正值时,领头亚集位于 ES值对应排序序列之前,反之,则位于 ES 值对应排序序列之后。领头亚集的出现可说明这些基因在通路中有富集,且这些基因在通路中有共同的表达趋势。


2019

对RNA-Seq的用户只需一个样本测序的费用就可以享受一组GSEA

对贝晶表达谱芯片服务用户,GSEA免费体验!



【声明】内容源于网络
0
0
基因快讯
基因生物技术国际贸易(上海)有限公司拥有仪器,试剂,市场与技术支持,售后等各部门组成的完整体系,是国内生命科学领域主要供应商之一,代理国际一流的高科技产品。积极利用公众号,进行最新资讯的共享,希望得到您的关注和支持。
内容 874
粉丝 0
基因快讯 基因生物技术国际贸易(上海)有限公司拥有仪器,试剂,市场与技术支持,售后等各部门组成的完整体系,是国内生命科学领域主要供应商之一,代理国际一流的高科技产品。积极利用公众号,进行最新资讯的共享,希望得到您的关注和支持。
总阅读445
粉丝0
内容874