-
高效+高阶:AutoCross 可高效构建高阶组合特征,进一步提高学习性能; -
易用:AutoCross 具有高度的简单性和最小化的超参数。提出了连续的小批量梯度下降和多粒度离散化,提高了特征组合的效率和有效性,同时避免了繁琐的超参数设置; -
通用性:AutoCross 生成的特征可用于传统机器学习模型或深度模型; -
分布式计算:AutoCross 充分利用分布计算能力,提高特征组合的效率,并降低计算、传输和存储成本; -
快速推断:AutoCross 可以大幅提高线性模型的效果,并且保留其推断速度快的优势; -
可解释性:AutoCross 采用显式特征组合的方法,相比于隐式特征组合,具有高度的可解释性。
,并将其划分为训练集
和验证集
。我们可以用一个特征集合 S 来表示
,并用学习算法 L 训练一个模型
。之后,用验证集和同一个特征集合 S 计算一个需要被最大化的指标
。特征组合搜索问题可以定义为搜索一个最优子特征集的问题:
的原始特征集合,
包含 F 所有原始特征以及基于 F 可生成的所有组合特征。
,搜索空间巨大。为了提高搜索效率,AutoCross 将搜索最优子特征集的问题转换为用贪婪策略逐步构建较优解的问题。首先,AutoCross 考虑一个树结构的搜索空间
(图 3),其中每一个节点表示一个子特征集。之后,用集束搜索策略在
上搜索较优解。通过这种方法,AutoCross 只需要访问
个候选解,极大地提高了搜索效率。AutoCross 的整体算法如算法 1 所示。
中一个节点的子节点时,不改变该节点包含特征对应的权重(weight),仅训练子节点新增特征的权重。
-
AC+LR:AutoCross 的特征加对数几率回归模型; -
AC+W&D:AutoCross 的特征作为 wide&deep 模型 wide 部分的特征; -
LR:基础的对数几率回归模型; -
CMI+LR:[3] 中方法生成的特征加对数几率回归模型; -
Deep:基础的深度学习模型; -
xDeepFM:[1] 提出的模型,是该论文投稿时最先进的基于深度学习的方法。
[2] K. Jamieson and A. Talwalkar. 2016. Non-stochastic best arm identification and hyperparameter optimization. In Artificial Intelligence and Statistics. 240–248.
[3] O. Chapelle, E. Manavoglu, and R. Rosales. 2015. Simple and scalable response prediction for display advertising. ACM Transactions on Intelligent Systems and Technology (TIST) 5, 4 (2015), 61.

