对临床医生而言,临床工作与科研的双重压力日益加剧:既要完成繁重的临床任务,又面临晋升所需的科研产出要求。UK Biobank作为全球领先的大规模生物医学数据库,目的是探求一些特定基因、生活方式和健康状况之间的关系,提高对一些遗传类疾病致病基因的理解,包括癌症、心脏病、糖尿病和一些特定的精神疾病,为临床医生提供了突破时间和资源限制的独特机会。
UK Biobank数据库包含50万名40-69岁参与者的深度数据,收集了遗传、身体和健康数据,包括基因信息和血液样本、生活方式及环境暴露数据,并已对10万参与者进行了全身影像扫描,每人产生超过12,000张影像。这一前所未有的开放获取数据库使大量与健康相关的研究成为可能。
UK Biobank数据库资源规模空前
50万参与者的深度基因型数据与表型数据
全基因组测序数据覆盖所有参与者
15万参与者的全身多模态MRI扫描数据
长期随访数据包括住院、癌症登记、死亡登记等
10万样本的血浆蛋白质组学数据
5万样本的血浆代谢组学数据
01
培训目标
1,掌握UK Biobank数据库申请全流程,有效规避申请过程中的典型错误。
2,通过临床科研真实案例,帮助学员高效获取并分析UK Biobank与临床实践紧密关联的数据。
3,将临床问题转化为可研究的数据科学问题,搭建从临床思维到研究实践的桥梁。
4,完成一项可直接应用于研究课题的项目方案,实现“学即能用”。
5,理解如何将UK Biobank数据与自有临床数据结合
02
培训时间
2025年11月21日— 2025年11月24日 远程在线培训
(第一天数据及操作软件调试,共授课三天)
03
主讲专家
来自清华大学、上海交通大学、中国科学院等高校医学生物信息学学科带头人、擅长各类型医学数据统计分析、生物医学大数据挖掘。发表数十篇专业领域内学术论文及SCI论文,主编或参与编写多部著作。参与多家三甲医院临床生物信息学的研究合作,科研及授课经验很丰富。
04
参加对象
各省市、自治区从事临床医学、基础医学、生物医学工程等科室主任医师、副主任医师、住院医师等临床科研工作者相关人员;国内各重点大学、科研院所相关研究领域的博士、硕士相关研究生和学者等:
05
课程大纲
一、UK Biobank基础与临床研究思路
|
1,UK Biobank简介与优势
UK Biobank资源概述:50万参与者、全基因组测序、多维数据
临床医生利用公共数据库发文的成功案例剖析
2,UK Biobank数据结构深度解析
健康相关结构数据:生活方式、环境暴露、个人与家族病史
基因数据:全基因组测序、芯片数据、功能注释
影像数据:全身MRI、心脏脑部成像、DEXA扫描
实验室数据:血液、尿液生物标志物
3,数据申请流程详解与技巧
分步演示数据申请流程
如何撰写高质量的研究计划提高申请成功率
常见申请被拒原因及避免方法
|
二、Research Analysis Platform(RAP)的使用及写作
|
1,生存分析数据的准备
发病时间的确定,生存状态的确定
2,协变量的准备
协变量的提取
协变量的处理(类型的变换、缺失值的处理)
3,构建比例风险模型
训练集和测试集数据生成
模型的训练、验证
结果可视化(三线表、森林图、热图)
敏感性分析的原则
敏感性分析的一般方法
4,组学数据的分析(以蛋白组学为例)
对缺失值进行多重插补
Lasso进行蛋白筛选
利用筛选蛋白进行模型构建(预测模型)
蛋白功能查询与注释
蛋白功能网络的构建
5,论文复现深度解析,案例论文拆解
研究问题的确定
数据选择与分析策略
6,论文写作技巧
方法描述、结果呈现与讨论框架
UKB 数据的伦理申明
UKB 数据的数据使用权限申明
|
三、UK Biobank研究方法与案例实操
|
1,临床研究设计实战
基于UK Biobank的常见研究设计:队列研究、病例对照研究、全表型关联分析
临床变量选择与定义:ICD编码、自我报告、死亡登记数据
混杂因素识别与控制策略
2,背痛研究案例实操
案例背景:身体活动与背痛风险的关系——一项近期发表在Spine Journal的研究
实加速度计数据处理+ Cox模型构建
剂量反应分析+ 多基因风险评分分层
3,睡眠模式与2型糖尿病发病风险
基于加速度计的睡眠质量评估
时间序列分析与多变量调整
识别最佳睡眠时长与糖尿病预防的关联
|
四、UK Biobank高级专题与个性化方案制定
|
1,晚发性精神分裂症可改变风险因素研究
案例背景:利用UK Biobank识别晚发性精神分裂症的109个可改变风险因素
分析方法:
暴露范围关联分析(ExWAS)方法
多变量Cox模型构建
人群归因分数计算
领域特异性风险评分
临床意义:展示如何通过改变风险因素预防高达89%的晚发性精神分裂症
2,肥胖新分类与死亡率研究
案例背景:基于新提出的肥胖分类系统分析不同肥胖类别与死亡率
分析方法:
临床肥胖与preclinical 肥胖定义
死亡率数据关联
多变量调整与竞争风险模型
临床启示:超越BMI的肥胖评估在临床实践中的应用
3,AI与多组学在临床研究中的应用
UK Biobank中AI应用的典型案例
多组学数据整合分析策略
从单基因到通路分析的进阶方法
4,个人研究方案开发与指导
学员提出自己的研究想法
导师一对一指导完善研究设计
制定个人UK Biobank研究时间表与路线图
|
五、R语言临床医学应用实战
|
1,R语言分析肿瘤性疾病示例
TCGA数据下载
TCGA差异分析
功能富集分析
蛋白质互作网络分析
表达分析
生存分析
单因素cox回归分析
多因素cox回归分析
免疫分析
药敏分析
2,R语言分析非肿瘤性疾病示例
GEO数据下载
GEO差异分析
功能富集分析
蛋白质互作网络分析
表达分析
lasso回归分析
logistic回归
预后风险预测
|
六、辅助课程
|
1.学后交流、微信群、QQ群建立。
2.咨询、合作,技术团队深入探讨。
3.专题定制化内训。
|
06
国内外学者已见刊文章
1,糖尿病和贫血之间的关联:来自NHANES和英国生物库的证据

2,共有490640名英国生物库参与者的全基因组测序

3,每日总体力活动量和强度、步数和癌症事件风险。来自英国生物库的证据

4,UKB-MDRMF:基于英国生物库数据的多疾病风险和多发病率框架。

5,肠易激综合征与全因和特定原因死亡率之间的时间依赖性关联:英国生物库内的一项前瞻性队列研究

6,心房颤动会增加全因性痴呆、阿尔茨海默病和脉管系统疾病的风险:英国生物库373415名参与者的队列研究

07
联系方式
联系人: 毛泽璇(老师)
手机(微信同号):13311241619
电话:010-56129268


