TCGA&GEO生信高通量数据
挖掘分析研讨会
背景简介:
(医药加ZOOM网络会议室 2020.6.25-27)
●
2019年度国家自然基金医学科学部共批资助10138项目,批助金额总计441310万元。其中面上项目数量占45%,金额占57%;青年科学基金项目数量占43%,金额占20%。
初步统计,这些项目中大部分都与编码基因有直接或间接的关联。其中,与通路(pathway)关联的有1349项,金额4.89亿;与miRNA相关的有630项,金额2.3亿;与lncRNA相关的有395项,金额1.45亿;
如何获得有创新意义的疾病靶标基因(mRNA,Protein,lncRNA,circRNA,miRNA,Mutation等)是项目申请及文章写作时最常见的问题。基于这个目的,我们开展了该培训班:TCGA&GEO高通量数据挖掘。癌症是临床医学中非常重要的疾病方向。TCGA数据库中包含了常见了40种癌症方向(含30000个样本)的高通量数据及临床信息。大家对TCGA数据库的使用近几年也在逐渐增加!另外,其他疾病的研究可以通过GEO数据库进行。
通过三天的学习,我们了解生信分析思路对项目及文章的帮助,以及实操常见的数据库、在线工具和本地软件。使得学员可以自己完成一个完整的分析报告并获得疾病相关的靶标基因。
主办方:上海遐永医药科技有限公司
培训时间:2020年6月25-27日(三天)
上课时间:上午8:30-12:00,下午1:30-6:00
培训地点: 医药加ZOOM网络会议室
收费标准:会务费:30000元每位
划
重
点
宋伟博士
成果:参与完成了近百篇软件著作权和发明专利的撰写和申请;肺癌、胰腺癌、骨肉瘤、胃癌等数据库的分析和构建;完成个体基因检测流程和无创唐筛流程的开发。
研究方向:有近十年的生信分析经验,擅长方向有转录组测序分析、芯片数据分析、疾病机理研究分析、疾病预后与基因关联分析、项目分析思路设计以及个性化分析等,精通perl、R等编程语言。
培训经历:在上海、北京、广州、沈阳、南京等城市举办过几十场培训班。
1.提前确认报名及转账的,可以提前拿到学习材料
2.三人组团报名,每人优惠100元
3.四人组团报名,每人优惠200元,
4.六人组团报名缴费,可免1人参会费!
可以开正规会务发票,纸质邀请函(盖红章)。
注意事项:必须使用win7以上系统的电脑,现场不得录音录像。上课软件为Cytoscape,Heml,GSEA,R和Rstudio。
另外需安装ZOOM会议软件。
通过本次学习,您可以学会以下作图(包括但不限于)

▲示例图 通路富集分析结果图


▲示例图 网络图

▲示例图 pathway map图

▲示例图 聚类热图分析

▲示例图关键基因的KM生存曲线

▲示例图 柱状图与venn图

▲示例图 venn图
TCGA&GEO高通量数据挖掘分析实操强化研讨会 |
|||
时间安排 |
课程表 |
介绍 |
|
第一天 |
9:00~10:30 |
生信简介 |
生物信息介绍 |
高通量:测序及芯片介绍——不同组学:转录组学、基因组学、表观组学、顺反组学、宏基因组学等。 |
|||
经典生信SCI文章的解读,了解TCGA数据库、GEO 数据库这些公共数据的挖掘获得创新结论并发文章的思路。 |
|||
10:45-12:00 |
TCGA数据库 NCBI GEO数据库
|
TCGA数据库:最全的癌症高通量数据公共库(简介) |
|
TCGA数据库的介绍和使用(包含了转录组、基因组、表观组和临床信息数据) |
|||
GEO数据库介绍: 数据量最大的高通量公共数据库。 |
|||
GEO数据库的高通量芯片数据查找、筛选、探针转换、差异分析等。 |
|||
12:00-13:30 |
午餐及午休 |
||
13:30~15:00 |
R语言学习 |
R软件与Rstudio软件下载、安装、界面。 R语言基础:元素、向量、矩阵、数组 R语言函数:计算函数、统计函数等 R语言路径确认及修改 R语言文件(图、表)的导入和导出 |
|
15:20~17:00 |
R语言学习 |
R语言包:包的下载安装 R语言:差异分析limma包使用、火山图制作 |
|
第二天 |
8:30~10:00 |
TCGA相关的下载工具 |
TCGA数据库癌症数据下载:RNA-seq数据、miRNA-seq数据、甲基化数据、基因组数据及临床信息数据的下载TCGA数据书库癌症数据的处理,获得关键mRNA、miRNA的表达谱矩阵。 |
10:20~12:00 |
TCGA相关的分析工具 |
TCGA数据分析——突变分析、差异分析、关联分析、生存分析、miRNA调控靶基因分析等。Cbioportal数据库学习R语言做生存曲线KM图(批量) |
|
12:00-13:30 |
午餐及午休 |
||
13:30~17:00
|
数据的后续高级分析工具实战 |
DAVID功能富集分析——GO富集和KEGG pathway富集分析 |
|
通路map图构建 |
|||
聚类热图制作 R语言pheatmap包做聚类热图 |
|||
蛋白与蛋白互作分析(PPI)——STRING数据库
|
|||
第三天 |
8:30~12:00 |
数据的后续高级分析工具实战 |
cytoscape软件(上):网络图构建与美化 |
cytoscape软件(下):插件使用 |
|||
GSEA软件的实操:全基因集富集分析 |
|||
12:00-13:30 |
午餐及午休 |
||
13:30~16:00 |
思路讨论 |
基于GEO数据库多套数据整合(meta)分析思路演练 |
|
基于TCGA的lncRNA-miRNA-mRNA全转录组整合分析思路演练 |
|||
基于TCGA的甲基化与转录组整合分析思路演练 |
|||
基于TCGA的基因组与转录组整合分析思路演练 |
|||
串讲 |
思路大串讲 |
||
备注:讲师使用windows10系统讲解,建议携带同样系统的电脑 |
|||
上课软件为:Cytoscape,Heml,GSEA,R和Rstudio |
|||
介绍结束
TCGA&GEO

