NHANES数据库怎么发高分?上海交大医学院汪一心团队11分+横断面研究,6种分析方法聚焦环境污染,0实验稳稳拿下!
生信日报 
欢迎大家来到云生信!最近呀,小记者老是听到有些小伙伴们跟小记者吐槽,说最近生信分析发文难、竞争大,就算有数据库也很难找到好的选题方向和行文思路。欸,这不,今天小记者就发现了这样一篇高分文章,作者仅仅通过一个数据库——NHANES ,借助于纯粹的横断面数据分析方法,凭借4张图就轻松拿下11分+,那么这其中究竟有哪些妙处呢?快跟小记者一起来看看这篇文章里有哪些精彩思路吧。
其实呀,这篇文章的精彩之处还真不少,首先,不得不提到的就是作者的选题角度就非常具有新意,将问题的出发点瞄准在了环境污染物上,将大热的骨密度指标与环境污染结合起来,保证了文章的创新性和公共卫生意义。
此外,这篇文章对于想要利用NHANES数据库进行数据分析的同学非常具有借鉴意义,因为作者在文中进行了大量细致的统计分析,包括简单回归分析、多重回归、非线性回归、交互作用检验和分层分析等等,文章中关于研究对象筛选的描述也是非常严谨细致,其逻辑之缜密不禁让小记者拍手叫好呀!内容如此丰富,思路如此严谨的生信分析,绝对学到就是赚到!对公共数据库挖掘感兴趣的小伙伴赶紧码住学习!
想要公共数据库挖掘思路的小伙伴赶快来学习啦,这个思路复现出来你也可以轻松拿高分,需要复现/设计思路或定制生信分析的朋友,欢迎扫码联系小记者哦~
题目:美国青少年接触三卤甲烷与骨矿物质密度:一项横断面研究(NHANES)
杂志:Environmental Science &Technology
发表时间:2023年12月
青春期的骨密度 (BMD) 对于建立足够的骨量以支持骨骼健康、保护内脏器官和在以后的生活中储存钙至关重要。消毒副产物(DBPs)是水消毒过程中,通过化学消毒剂(如氯)与原水中的有机物反应间接产生的一类污染物。鉴于三卤甲烷 (THM) 在消毒水中 600 多种已确定的 DBP 中所占比例最高,因此,本研究探讨来自美国 (US) 的全国代表性样本中血液和自来水中 THM 浓度与青少年 BMD 之间的关联。

本研究选择了 2497 名 12-19 岁的青少年,来自 4 个 NHANES 周期(2005-2006、2007-2008、2009-2010 和 2011-2012),他们测量了血液 THM 浓度。在检查过程中收集了单个血液和家庭水样。采用固相微萃取气相色谱法和质谱法测定血液和自来水中氯仿(TCM)、溴二氯甲烷(BDCM)、二溴氯甲烷(DBCM)和溴仿(TBM)的浓度。
本研究是一篇以NHANES数据库为主要数据来源的横断面分析,研究的目的是检查血液和自来水中 THM 浓度与青少年 BMD 之间的关联。作者首先进行描述性统计分析以描述青少年的人口统计信息、生活方式、用水活动和 THM 测定。初步了解血液和水THM浓度之间的相关性,继而纳入更多的协变量对潜在的混杂因素进行调整。此外,作者还将部分暴露因素根据浓度划分为等级资料以探索潜在的剂量反应关系,通过限制性立方样条模型检查非线性关联,利用分层分析评估混杂因素改变的潜在影响,利用似然比检验来检验交互作用等。
作者根据腰椎BMD和全身(TBLH)BMD 测量结果纳入分析的青少年人群特征基本相似。男性和女性青少年的比例几乎相等,大多数为非西班牙裔白人,不吸烟,不运动,每天食用一次或更多乳制品,24 小时内不使用游泳池/热水浴缸/蒸汽房。(表1)
为了初步了解THM 与 BMD的关联关系,作者首先通过绘制散点图可视化血液和水中THM浓度之间的相关性,继而通过决定系数(R2)使用Pearson的相关性分析评估水THMs的预测能力。血液THM浓度与自来水中测得的THM浓度之间的相关性为低至中等,R2值范围从 0.22 到 0.48(图 1)。
作者进一步通过进行多变量线性回归模型以评估血液和水中THM浓度与BMD z评分的关联,并对先前文献中发现的潜在混杂因素进行调整。在考虑年龄、性别、种族/民族和调查周期的部分调整模型中,作者观察到血液中药、DBCM、Cl-THMs和TTHMS的连续浓度与腰椎BMD z评分之间以及血液BDCM、DBCM和Cl-THMs的连续浓度与TBLH BMD z评分之间的负相关(模型1)。当额外调整 BMI z 分数、家庭收入贫困比、吸烟状况、身体活动和奶制品消费量时,这些关联仍然存在(模型 2),在完全调整的模型中,血液中草药、二溴氯丙烷、Cl-THMs 和 TTHMs 浓度增加 2.7 倍与腰椎 BMD z 评分降低有关。(表2)
表2 三卤甲烷暴露类别与腰椎 BMD z 值之间关系的调整回归系数和 95% 置信区间
最后,作者进行了分层分析,以评估性别、BMI、身体活动、奶制品消费和吸烟状况的潜在影响改变。作者通过对THMs和效应修饰因子的产物项进行似然比检验来检验交互作用,通过排除过去 24 小时内使用热水浴缸、游泳池或蒸汽浴室的青少年来探索近期水上活动的潜在影响,通过额外调整从CDC儿童和青少年生长图表得出的年龄别身高Z分数来测试身材的影响。分析均通过SAS版本9.4的PROC SURVEY程序进行。由于血液Cl-THM浓度与腰椎和TBLH BMD密切相关,因此作者对Cl-THMs进行了分层分析、相互作用分析和非线性剂量反应分析。结果显示没有发现Cl-THM暴露与性别、体力活动、奶制品消费和吸烟状况之间有任何相互作用(图2)。然而,在超重或肥胖青少年中,血液Cl-THM浓度与TBLH BMD-z评分的相关性更强(图2)。限制性立方样条模型说明了血液 Cl-THM 浓度和 BMD z 评分之间的单调性剂量-反应关系(图 3)。
图2 青少年血液 Cl-THM 浓度每增加 2.7 倍的腰椎 BMD z 评分和 TBLH BMD z 评分的回归系数和 95% 置信区间,按亚组分层
图3 限制性立方样条模型
在这项研究中,作者通过大规模的横断面研究,调查了THM暴露与BMD之间可能存在的关联关系。其中用到的简单回归分析、多重回归、非线性回归、交互作用检验和分层分析等非常值得我们学习。对于选题角度的把握也更值得我们从中吸取经验。随着临床公共数据库的不断完善与发展,纯数据挖掘类文章在生信分析领域已经越来越火爆,需要进行思路设计的朋友记得扫码联系小记者,只要思路选的好,你也可以轻松发高分!
