点击上方蓝字“谁说菜鸟不会数据分析”
关注➕星标公众号
更多干货不错过!
本文转载自:知乎胡保强,百度百科
大家好!最近我在后台收到小伙伴的留言,关于主成分分析与因子分析,觉得二者总是分不清。今天我们就来说说这两个方法的差异和共同点。
主成分分析(Principal Component Analysis,PCA), 是一种统计方法。也是数学上处理降维的一种方法。通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的变量叫主成分。
在很多情况下,变量之间是有一定的相关关系的,当两个变量之间有一定相关关系时,可以解释为这两个变量所代表的特征有一定的重叠。所以,主成分分析是对于原先提出的所有变量,将重复的变量(关系紧密的变量)删去多余,建立尽可能少的新变量,使得这些新变量是两两不相关的,而且这些新变量在反映课题的信息方面尽可能保持原有的信息。
在spss结果里,主成分分析的一个结果是主成分得分矩阵。其实就是主成分载荷矩阵除以主成分特征根后得到的矩阵。根据主成分得分矩阵的得分系数,就可以计算每个个案在新变量(主成分)上的数值。可以将新变量值用于综合评分和回归。
但是,主成分分析通常没法解释每个主成分代表的意思。每个原始变量在主成分中一般都占有一定的分量,这些分量(载荷)之间的大小分布没有清晰的分界线,这就造成无法明确表述哪个主成分代表哪些原始变量,也就是说提取出来的主成分无法清晰的解释其代表的含义。
因子分析是指研究从变量群中提取共性因子的统计技术。最早由英国心理学家C.E.斯皮尔曼提出。他发现学生的各科成绩之间存在着一定的相关性,一科成绩好的学生,往往其他各科成绩也比较好,从而推想是否存在某些潜在的共性因子,或称某些一般智力条件影响着学生的学习成绩。因子分析可在许多变量中找出隐藏的具有代表性的因子。将相同本质的变量归入一个因子,可减少变量的数目,还可检验变量间关系的假设。
因子分析对主成分分析进行了扩展。因子分析解决主成分分析解释障碍的方法是通过因子轴旋转。因子轴旋转可以使原始变量在公因子(主成分)上的载荷重新分布,从而使原始变量在公因子上的载荷两级分化,这样公因子(主成分)就能够用哪些载荷大的原始变量来解释。以上过程就解决了主成分分析的现实含义解释障碍。
以上就是今天想跟大家分享的内容,觉得有帮助的小伙伴别忘了点击右下角“在看”哦!

