LASSO,全称Least absolute shrinkage and selection operator,是一种数据挖掘方法,即在常用的多元线性回归中,添加惩罚函数,不断压缩系数,从而达到精简模型的目的,以避免共线性和过拟合。当系数为0时,同时达到筛选变量的效果。(以下是一个不严谨的示意图)所以,LASSO回归高效解决了筛选变量的难题:区别于传统的逐步回归stepwise前进、后退变量筛选方法,LASSO回归可以利用较少样本量,高效筛选较多变量。比如在基因组学、影像学、以及其他小样本分析中,LASSO回归都可以派上大用场。
2.LASSO在SCI文章中的应用
说了这么多,下面我们通过一篇4.6分的SCI文章,了解LASSO回归的实际应用吧。
文章标题:A prognostic nomogram based on LASSO Cox regression in patients with alpha-fetoprotein-negative hepatocellular carcinoma (AFP-NHCC) following non-surgical therapy翻译成中文:基于LASSO cox回归的非手术治疗后甲胎蛋白阴性肝癌患者的预测列线图。本研究的目的是应用一种新的方法来建立和验证一种新的预测AFP-NHCC患者预测的模型。下面我们用PICOS原则来拆解文章:P 558例AFP阴性的肝癌患者。I &C 患者基线或治疗相关的指标。O 从诊断为肝癌到最后一次随访或死亡的时间。S 队列研究,生存分析类型文章。文章的主要结论是:基于LASSO Cox回归的nomogram对于非手术治疗肝癌患者的预后预测更加准确和有用。该模型可以帮助肝癌患者在非手术治疗后进行个性化的预后评估。接下来看文章相关图表,下面就是LASSO模型会输出的两张图,这两张图展示了LASSO是如何工作的。图A:23个危险因素的LASSO系数路径图。图B:交叉验证曲线。