本文共计1800字(多图),建议阅读时间2分钟
目录
-
一元线性回归分析 -
建立模型——参数估计 -
图表法 -
函数法 -
工具法 -
回归分析工具 -
线性规划工具 分析模型——参数检验
应用模型——变量预测
-
多元线性回归分析
然后重点放在第二节,也就是多元线性回归模型的优化上。
这是多元线性回归跟一元线性回归需要多做一步的工作。
探究公众号文章的推荐占比与文章的质量指标之间的关系,想知道哪几个因素能带来“平台推荐流量”,一定程度上解开“流量密码”。
建立模型
函数法
而且不仅可以得到参数,还能顺便把模型的偏回归系数的参数检验也做了。
只不过第一次接触的话,用起来会比较难以理解,因为这个函数的输出是一个数组。
LINEST 函数可通过使用最小二乘法计算与现有数据最佳拟合的直线,来计算某直线的统计值,然后返回描述此直线的数组。也可以将 LINEST 与其他函数结合使用来计算未知参数中其他类型的线性模型的统计值,包括多项式、对数、指数和幂级数。因为此函数返回数值数组,所以它必须以数组公式的形式输入。请按照本文中的示例使用此函数。
直线的公式为:
y = mx + b
- 或 -
y = m1x1 + m2x2 + ... + b
如果有多个区域的 x 值,其中因变量 y 值是自变量 x 值的函数。m 值是与每个 x 值相对应的系数,b 为常量。注意,y、x 和 m 可以是向量。 LINEST 函数返回的数组为 {mn,mn-1,...,m1,b}。 LINEST 函数还可返回附加回归统计值。
返回的回归统计值数组顺序如下:
同一个颜色色块的指标名称和数值是对应的。若是四个数值则与四个自变量一一对应的。
=LINEST(Y数组,X数组,TRUE,TRUE)
即可,Excel会根据样本数量,自动溢出为N行N列的数组。留出足够空间即可。
回归工具
规划求解
其实就是用数值计算的方式来解N元一次方程组。
分析模型——模型显著性检验&优化
对于多个自变量与因变量的整体显著性进行检验,通过F检验来实现;
以及对于每个自变量对因变量影响的显著性(即回归系数显著性)进行检验,通过T检验或F检验来实现。
整体显著性检验


这里我们保留X4(阅读关注率)、X1(送达阅读率)和X3(阅读完成率),剔除X2(首次分享率)。
了解更多数据分析知识、与更多优秀的人一起进群交流请扫码


