
这泼天的富贵给到中国数据库 CLHLS!清大团队用它拿下【自然医学】82.9分超高水平期刊!
最近这项针对老年参与者的全国代表性前瞻性队列研究 CLHLS也算是小小火了一把,小记者也不禁感叹一下我们研究可选的数据库越来越多了,中国人群数据库频频现身高分文章也表明我们国家的话语权越来越重了!
今天分享清大团队与华盛顿大学合作发表的一篇82.9分nature大子刊,发表难度极高。该研究除了使用CLHLS数据库以外,对于选题和方法的创新度也非常高,一起来看一下吧!(对该数据库感兴趣的小伙伴们,我们可能发不了这么高分的文章,但是做好选题的创新和数据的挖掘也是能得到不错的成果的,欢迎来撩小记者哦!)

后台回复“999”获取原文献,文献编号240423

题目:与中国65岁以上成年人热浪死亡相关的危险因素
杂志:nature medicine
影响因子:IF=82.9
发表时间:2024年3月
读文献第一步,选题是什么:
由于生理因素和合并症,老龄化人口很容易遭受与高温相关的死亡。然而,对老龄化人口中个体脆弱性的理解并不完整,作者研究调查了与中国65岁以上成年人热浪死亡相关的危险因素。
(近年极端天气增多,小记者还记得去年的高温也非常恐怖,这大概是作者选题的灵感来源之一吧。)
然后我们看一下作者选取的数据(数据可以说是最重要的一环,巧妇难为无米之炊啊!):
CLHLS 的地理代表性覆盖中国 31 个省份中的 23 个省份的农村和城市地区。该研究在随机选择的 631 个城市和县(约占中国人口的 85%)中进行了多阶段、分层整群调查。
1. 样本选取:
研究基于中国纵向健康长寿调查(CLHLS),涵盖了2008至2018年间的数据。
初始队列包含16,954名个体。
2. 排除标准:
排除了379名65岁以下的个体。
排除了105名关键变量数据缺失的个体,包括教育、职业、婚姻状况和日常生活活动(ADL)状态,部分个体有多个缺失值。
另外排除了2,931名在首次调查后失访的个体,这些个体没有为研究贡献更多的时间。
3. 最终分析样本:
纳入最终分析的样本共有13,527名参与者。
研究期间,这些参与者累计有62,984.2人年的观察数据。
4. 调查人群结局
至研究结束时,有2,341名参与者仍然健在。
在后续调查中失去联系的1,806名参与者在失访前已经贡献了一定的观察时间。
夏季月份(5月至9月)有3,249例死亡记录。
非夏季月份记录了6,131例死亡。
既然要研究与热浪相关的危险因素,还有一个研究难点,高温相关的数据怎么搞,有了数据后又如何评估呢?很多朋友想到好点子之后也往往会在这一步白给,我们看看作者的思路吧:
每日最高温度:使用欧洲中期天气预报中心(ECMWF)ERA5 Land Reanalysis数据集,研究者获取了每小时的气候暴露数据,并基于这些初始小时气温数据计算出了每日的最高空气温度。
相对湿度(RH):定义为水汽分压与给定温度下饱和水汽压的比率。通过ERA5-Land数据集中的每小时空气温度和露点温度数据,利用Clausius-Clapeyron方程计算得出相对湿度。
热指数(Heat Index, HI):考虑了实际空气温度和大气中湿度水平,用于测量表观温度,即通常所说的“感觉像”温度。当湿度高时,由于空气中水分饱和,汗液蒸发(人体的自然冷却机制)效果降低,导致散热减少,从而增强了对热的不适感。热指数使用NOAA国家气象局采用的Rothfusz回归公式计算。
热浪识别:研究中使用了中国气象局(CMA)、世界气象组织(WMO)和美国国家海洋和大气管理局(NOAA)提供的不同的热浪定义标准,构建了十种热浪定义。这些定义基于绝对温度、历史温度百分位数或热指数(HI)的计算,以及超过特定阈值的持续天数。
文章细节很多,具体的公式方法还是需要大家在原文中找,这里就不放啦。
最后我们看一下作者用了哪些统计分析方法呢?
时间依赖的Cox比例风险模型:这是一种用于分析生存数据的统计技术,它可以处理时间变化的协变量。该模型允许研究者评估热浪对老年人死亡率的影响,同时考虑了随时间变化的环境协变量。
敏感性分析:为了确保研究结果的稳定性和可靠性,作者进行了多种敏感性分析,包括:
使用不同的时间限制对非夏季死亡进行右删失处理。
对死亡时间不做限制的分析。
调整了额外的环境协变量,如每日PM2.5水平、每日相对湿度和每月归一化植被指数(NDVI)。
主成分分析(PCA):用于分析潜在变量之间的相关性,并构建相关矩阵。这有助于揭示隐藏的、潜在变量与观察到的二元变量之间的关系。
Tetrachoric相关性分析:这是一种统计技术,用于估计两组二元数据之间的相关系数。
人群归因风险(Population Attributable Fraction, PAF)的计算:这是一种用来估计在人群中去除或减少某一风险因素所能够带来的健康改善程度的统计方法。
R软件:用于数据管理和统计分析,特别是执行Cox比例风险模型和其他统计测试。
Google Earth Engine:用于计算个体水平上的环境暴露数据。
主要结果
1.使用CMA、WMO和NOAA定义的热浪对研究人群的HRs

图1HR效应估计来自饱和模型,该模型调整了以下因素:人口统计因素(年龄、性别、城乡居住、共同居住和婚姻状况);社会经济地位(教育和职业);吸烟和饮酒状况;身体功能能力(ADL和IADL状态);认知功能(MMSE状态)。分层的Cox模型允许为居住省份设置单独的基线风险函数。每个点代表HR的点估计。垂直虚线代表HR等于1,这表明没有影响。误差条代表95% CI的下限和上限。连接误差条的每条线说明了HR值的范围。研究人群的总样本量为13,527人。
2.根据功能性衰老特征分层的热浪脆弱性分析

图2a–c,整体ADL (a)、IADL (b) 和MMSE (c) 状态。使用时变Cox模型来评估与热浪相关的增加的死亡风险。该分析涉及双尾检验,未对多重比较进行调整。根据功能性衰老特征进行的分层分析已根据年龄和性别进行了调整。分层Cox模型允许为居住省份设置单独的基线风险函数
3.根据ADL子量表分层的热浪脆弱性分析


图 3 a–f,作者使用了时变Cox模型来评估与热浪相关的增加的死亡风险,这些风险涉及洗澡(a)、控制排泄(b)、穿衣(c)、进食(d)、室内转移(e)和如厕(f)。该分析进行了双尾检验,并且没有对多重比较进行调整。根据ADL子量表进行的分层分析已根据年龄和性别进行了调整。分层Cox模型允许为居住省份设置不同的基线风险函数
4. 根据IADL子量表分层的热浪脆弱性分析


图 4 a–h,使用了时变Cox模型来评估与热浪相关的增加的死亡风险,这些风险根据IADL子量表包括搬运5公斤重物(a)、做饭(b)、蹲下并站起三次(c)、洗衣服(d)、购物(e)、乘坐公共交通(f)、拜访邻居(g)和连续行走1公里(h)。该分析进行了双尾检验,并未对多重比较进行调整。根据IADL子量表进行的分层分析已根据年龄和性别进行了调整。分层Cox模型允许为居住省份设置不同的基线风险函数。
5.根据MMSE子量表分层的热浪脆弱性分析

图 5 a–e,使用了时变Cox模型来评估与热浪相关的增加的死亡风险,这些风险根据注意力和计算(a)、语言(b)、定向(c)、回忆(d)和注册(e)的MMSE子量表进行评估。该分析进行了双尾检验,并且没有对多重比较进行调整。根据MMSE进行的分层分析已根据年龄和性别进行了调整。分层Cox模型允许为居住省份设置不同的基线风险函数
文章小结
看完大佬的文章是否感慨良多?该研究结果表明,根据相对温度,热浪期间的死亡风险大约翻了一番。对于行动能力下降、日常生活活动依赖性、认知障碍以及在困难时无人求助的社会孤立个体,热浪死亡风险增加。与当前理解相反,考虑到个体功能衰退后,年龄较大的老年人并不预示着热浪死亡风险;根据性别没有检测到统计差异。除了年龄作为风险因素外,作者的发现强调功能性衰老是提高热浪韧性的一个潜在因素。评估功能衰退和实施护理策略对于针对性预防热浪期间的死亡至关重要。
当然,即便如此高分的文章也并非没有局限性:
1.研究将5月至9月发生的死亡视为结果,并将该时间窗口之外的死亡视为右删失可能引入了偏差。
2.对于城市热岛分析,使用10公里缓冲区的环境暴露数据可能不够精细。
3.需要在其他队列研究和环境中进一步验证研究的全球普遍性和内部有效性。
4.研究主要集中在中国,可能需要更广泛的地理位置和文化背景来增强结论的普适性。
不要被它的影响因子吓到了,我们要吸取文章的精华,小记者认为该研究的亮眼之处就在于选题,以及各公开数据的灵活运用。全球性的数据+CLHLS数据库竟然可以达到这么惊艳的效果,这个思路,或者说这种破局的方式都可以学起来呀!对临床数据挖掘感兴趣的小伙伴欢迎来找小记者哟,打造专属于你的个性化方案和分析~
小记者话生信
如果您的时间和精力有限或者缺乏相关经验,并且对生信分析和期刊推荐有所需要的话,“生信日报”非常乐意为您提供如下服务:免费思路评估、付费生信分析和方案设计以及付费选刊等,有意向的小伙伴欢迎咨询小记者哦!
生信分析
思路设计
服务器租赁
扫码咨询小记者
1、超高分sci!将近50分你还有不看的理由?德国学者真是把机器学习玩出花了,直接构建一个新生信分析方法,还不快看!
2、国自然出品就是牛!复旦大学施思&虞先濬团队:借公共数据库+RNA-seq+湿实验研究癌症成纤维,IF近9分属实佩服!
3、MDPI期刊再爆丑闻!23本期刊存在“审稿人工厂”问题!

