关注我们,一起学习
标题:Contrastive Learning for Conversion Rate Prediction 地址:https://arxiv.org/pdf/2307.05974.pdf 代码:https://github.com/DongRuiHust/CL4CVR 会议:SIGIR 2023 公司:阿里
1.导读
-
基于对比学习的思想,作者采用embedding mask(EM),而不是特征mask,通过mask来创建视图,从而构建对比学习任务。 -
提出了一个false negative eliminate(FNE)组件来消除与锚点样本具有相同特征的样本,以说明用户行为数据中的自然属性。 -
提出监督正样本包含(SPI)组件,为每个锚样本包含额外的正样本,以充分利用稀疏但宝贵的用户转化事件。
2.方法
2.1 embedding mask(EM)

2.2 编码器和对比损失
2.3 False Negative Eliminate

2.4 有监督正样本包含(SPI)

2.5 损失函数
3.结果
4.总结
-
采用emb mask而不是特征mask, 特征的emb中的元素进行mask 得到增广后的样本进行对比学习 -
假阴性样本排除, 由于用户行为存在不确定性, 同一用户点击了同一item也不一定每次都会转化, 而这类样本如果直接用到对比学习中则会影响表征的学习, 因此需要去掉 -
额外正样本的补充, 使用同样转化的样本作为当前转化的锚点样本的正样本补充

