机器学习在DSP中的应用与价值
DSP系统中机器学习的关键作用及实现方式
Morketing曾在“勾搭机器学习”系列中对机器学习在DSP(Demand-Side Platform,需求方平台)中的运用进行了描述。在数字广告程序化购买时代,各家DSP对于算法的应用有着不同的理解和实践。
以品友互动为例,其早在2013年就发起了全球RTB(实时竞价)算法大赛,吸引了众多在校学生和工程师参与,掀起了一股算法研究热潮[1]。该比赛的核心是一个数据算法评估平台,将DSP优化问题直接交给参赛者,在真实的RTB广告投放环境中探索算法的商业价值。
DSP本质上是一个“撮合”系统,用于实现受众与广告主的精准匹配。这一过程高度依赖算法,尤其是机器学习技术。
Morketing:如何通俗地解释“机器学习”?
沈学华:机器学习是从数据中学习(Learning from Data)。例如,我们通过已知条件X1、X2、X3等得出的结果构建一个F(X)函数,这个函数可以预测未知条件Y下的结果。在DSP系统中,机器学习可用于预测用户的点击率(CTR),即通过收集和整合大量用户特征数据,为新用户提供精准的CTR预测。
Morketing:哪些算法在机器学习中最为常用?
沈学华:线性回归(Linear Regression)和逻辑回归(Logistic Regression)是使用最广泛的两种算法。
线性回归适用于简单的直线型预测问题,在工业时代的六七十年代得到了广泛应用。随着云计算的发展,海量数据处理能力增强,使得逻辑回归在解决概率问题(如竞价预估)方面更具优势。
Morketing:机器学习在DSP中发挥的具体价值是什么?
沈学华:机器学习在DSP中的价值主要体现在以下几个方面:
- Bidding Function(竞价函数)优化:利用机器学习进行点击率预测(CTR)。
- 防作弊:判断曝光是否真实。
- 流量分配:通过跨流量分析实现高效资源分配。
此外,CTR预测虽然是基础,但结合博弈论后可进一步优化竞价策略,从而提升广告效率。
Morketing:机器学习的基础是数据,品友的人群数据来源有哪些?
沈学华:品友获取人群数据的方式主要包括以下三种:
- 广告主的第一方数据。
- Exchange交易平台每日80亿次竞价请求中提取的信息。
- 第三方数据提供商的数据,如秒针、AdMaster等。
Morketing:不断优化算法是否可以理解为对自然人行为的推测?
沈学华:算法优化主要从三个维度展开:自然人行为、广告主需求和媒体环境。通过这三者的匹配,实现广告主需求与用户兴趣的最佳契合。
Morketing:品友的算法团队规模有多大?
沈学华:品友的数据算法团队约为30人,精干且专业。举办全球RTB算法大赛的目的包括:
- 推动计算广告学和机器学习领域的发展。
- 构建开放的DSP系统平台,支持第三方工具接入。
- 测试平台的可扩展性。
总结来看,广告主需求、受众偏好以及广告技术都在不断发展,因此没有绝对的最佳算法。


