用户生成内容(UGC)是数字时代的重要现象。最初,UGC是无偿的,但近年来,许多平台已允许创作者通过内容获利。
UGC免费增值模式(freemium model)让创作者在提供免费内容的同时,也能推出收费内容,并自主定价。例如,Facebook于2019年推出了付费直播功能。尽管这一模式日益普及,相关研究仍有限,且多集中于创作者是否选择收费内容(如Cong等,2021),而对他们如何管理免费内容贡献几乎未涉及。然而,这一点对理解平台生态至关重要:免费与付费内容相互影响,可能产生溢出效应。一方面,为了获得收入,创作者可能更专注于付费内容,从而减少免费内容供给,削弱平台活跃度;另一方面,个人创作者为推广付费内容,可能积极维持甚至提升其免费内容贡献(Gong, 2021)。
本研究以中国平台知乎为例,分析其Live收费功能的推出如何影响用户行为。结果显示,Live参与者在公告发布后打破了原有下降趋势,免费内容贡献趋于稳定,而非参与者的贡献持续减少。双重差分分析表明,该模式显著提高了回答数量,说明免费增值机制能激励创作者持续活跃。
知乎live
知乎于 2011 年 1 月作为一个问答社区开始的,用户自愿提出问题并提供答案。每个问题通常由一个标题和多个主题标签组成,并且可能会收到多个答案。2016 年 5 月 14 日,知乎推出了知乎Live计划,使参与者能够通过举办独家付费观看活动来将他们的专业知识货币化。典型的 Live 活动是针对特定主题的 1 到 2 小时的会议。每个事件都属于 17 个主题中的 1 个,例如 Internet、Education 和 Travel。
图1-知乎界面介绍
典型 Live 事件的时间线。要发起Live活动,主持人必须提交有关活动的初步详细信息,包括活动的开始时间、主题类别和门票价格。获得批准后,活动将在预定开始时间前一到两周正式创建并上架供购买。
知乎Live的平均治疗效果
一、数据描述
知乎为本研究提供了两个关键数据集。第一个数据集涵盖了2011年至2017年6月30日所有注册用户在免费问答社区的完整行为记录,包括提问、回答、投票、订阅及关注行为。第二个数据集记录了2016年5月14日至2017年6月30日期间,1,550名知乎Live项目参与者主持的3,663场Live活动的详细信息,包括创建者、主题、时间及交易记录。为了评估Live项目的影响,我们选取了该项目启动前后共58周的时间窗口,构建了用户层面的周度面板数据,以每周回答数(Answer_it)为主要因变量。
1.实验组:包括1,153名Live参与者,筛选标准为:(1)在2017年6月30日前至少举办一次Live;(2)研究期间至少回答一个问题;(3)在项目启动前已是知乎用户。平均每人举办2.67场,共3,081场。
2.控制组:从未举办Live的用户中筛选出49,808名非参与者,要求(1)研究期间至少回答一个问题;(2)项目启动前已注册;(3)在公告前在问答社区拥有至少100名关注者(我们也尝试50、150和200名粉丝作为替代标准,结果一致)。
我们将一周作为时间单位构建面板数据,因为用户多为周度活跃。表1展示了关键统计特征。因变量Answer_it的方差高于均值,说明其分布偏态显著。
图2-选定用户的汇总统计信息
二、无模型证据
我们绘制了参与者和非参与者在程序发布前后回答数量的时间序列图。可以看到,在程序发布之前,参与者和非参与者的回答趋势非常相似。特别是,从第-18周开始,两组用户的回答数量都呈下降趋势,说明用户对内容贡献的动机随时间推移在减弱。然而,在程序发布之后,两组趋势开始分化。参与者的回答下降趋势在发布后立即发生逆转,并稳定在与发布前相似的水平;而非参与者的回答数量则持续下降。
图3-与计划公告周相关的周数
三、理论模型
我们接下来采用回归模型的方法,来检测参与者相对于非参与者在回答贡献上的变化,控制时间固定效应与用户固定效应。鉴于我们的因变量(即用户 i 在第 t 周发布的回答数量 Answer_it)是偏态的计数变量,我们使用了固定效应的泊松伪极大似然估计法(Fixed-effects Poisson Pseudo-Maximum Likelihood, PPML)。具体而言,我们估计如下的泊松回归模型,其形式为对数链接(log-link):
图4-公式一
其中:
1.EP_i 是一个哑变量,如果用户 i 最终参与了知乎 Live 项目,则为 1,否则为 0;
2.After_t 是一个哑变量,如果第 t 周在项目发布(即 2016 年 5 月 14 日)之后,则为 1,否则为 0;
3.γᵢ 是用户固定效应(控制个体差异);
4.η_t 是时间固定效应(控制每一周的变化);
5.ε_it 是误差项;
我们将误差项在用户层面聚类,以获得稳健的标准误(参见 Bertrand 等,2004)。由于 After_t 和 EP_i 的主效应与时间和个体固定效应高度共线,因此它们会在模型中被自动排除。
我们还可以使用另一种方式来定义“处理变量”,即以每个参与者首次加入 Live 项目的时间为界限。具体地说,我们定义一个个体特定的处理变量 After_it,如果用户 i 是最终参与者且在第 t 周已经创建了第一场Live,则为 1,否则为 0。由于确切的加入时间不可得,我们用其首次 Live 的创建时间作为近似。相比之下,项目公告时间较为“外生”,因为知乎在开发过程中对外保密。因此,我们在主要分析中仍以公告时间作为处理前后的分界线。但作为稳健性检验,我们也会使用替代的“按用户首次参与时间”的方式来估计模型。
图5-知乎Live对回答贡献的平均治疗效果
表2的第 1 列报告了我们在公式 (1) 中主模型设定的回归结果。估计结果显示,知乎Live 项目对回答数量的影响是正向的(系数为0.631),并且在统计上显著(p < 0.01)。这相当于参与者相比非参与者,其回答量提高了 87.9%,计算方式为 exp(0.631)−1。表 2 的第 2 列报告了对处理变量替代定义后的估计结果。具体来说,我们使用了After_it替代公式(1)中的After_t ,并重新运行回归。此时交互项 的系数为 0.661,也同样显著(p < 0.01)。
四、验证DiD模型
使用相对时间模型(relative time model)和虚假检验(falsification test)来检验关键的“处理前趋势相同(common pretreatment trends)”假设。
1.相对时间模型(Relative Time Model):方程(1)中DiD方法的有效性依赖于平行趋势假设,即在项目宣布前两组的贡献趋势是平行的。我们使用预处理期的相对时间模型来检验共同趋势假设。根据现有文献(Chu等,2021,Zhang等,2022),我们通过引入一系列预处理周虚拟变量及其与EPi的交互项重新估计方程(1)。具体来说,我们将预处理周虚拟变量表示为After_ts,其中 s∈{−16+,-15,...,−10,...,−1}。为了汇总所有效应,我们将项目宣布前16周及以上的时期合并为一个虚拟变量。被省略的类别是项目宣布前的一周。感兴趣的系数是EPi与After_ts之间交互项的系数。如果这些交互项的系数不是正且显著,则共同趋势假设得到验证。
2.虚假处理检验(Falsification Exercise):我们还进行了一个虚假检验,以缓解人们对干预前趋势差异的担忧。具体来说,我们重新估计主回归模型,看看在没有任何付费功能推出的时间段(即 2016 年 5 月 14 日之前),是否会出现所谓的“安慰剂效应(placebo effect)”。做法如下:我们只用干预前的数据,并以2015年10月31日(也就是项目正式宣布的前 29 周)作为一个虚拟的“安慰剂干预时间点”,把数据分为“前后两段”,像真正在做一个DID分析一样。然后回归,看看这个“虚假处理”有没有显著效应。为了结果稳健,我们还用了另外 4 个安慰剂时间点(10月17日、24日,11月7日、14日),分别对应正式干预前的第 27、28、30、31 周。
图6-检验平行趋势假设
结果显示,所有处理前的交互项都没有显著为正的系数,这表明在项目发布前,参与者的回答数量并没有高于非参与者。
3. 倾向得分匹配(PSM)方法:由于用户是否参与 Live 项目并非随机分配,处理组与对照组之间可能存在系统性差异。为控制选择偏误,我们采用倾向得分匹配(Rosenbaum 和 Rubin,1983;Rosenbaum,2002),基于用户的可观测特征进行匹配。匹配变量包括六项反映准入标准的虚拟变量(教育背景、其他平台账号、创业者身份、专业资质、职业经历、内容变现行为),以及用户性别、是否提供邮箱/手机号等基本信息。此外,我们还引入公告发布前的历史行为特征,如注册时间、关注关系、内容发布与互动行为等。在匹配样本上重新估计的主要分析、相对时间模型及虚假处理检验结果依然稳健,尽管效应量有所变化。
4. 对不可观测变量的敏感性分析:PSM 方法假设选择偏误可由可观测变量解释,但若存在影响处理分配与结果的未观测因素,则可能导致隐藏偏差。为检验稳健性,我们采用 Rosenbaum 边界法进行敏感性分析。结果表明,只有当未观测因素使选择概率增加至少 80% 时,才会推翻对答案贡献的积极处理效应。这一结果与现有文献(如孙和朱,2013;张等,2022)相符,表明我们的估计在面对潜在隐藏偏差时仍具稳健性。
机制
我们认为,知乎Live参与者可能通过发布免费回答来传达信息、吸引潜在用户,从而推广其付费内容。在我们的研究情境中,回答问题是一种合适的战略性沟通方式。为验证这一机制,我们进行了三项分析:1)异质性效应分析:调整DiD模型,考察Live项目对不同参与者的影响。已有研究指出,声誉较低或面临更强竞争的用户更可能采取战略性沟通;2)行为随时间的变化:如果免费内容用于推广,我们应能观察到在接近Live活动时间点前后,回答行为出现明显波动;3)内容贡献的效果:检验免费回答是否有助于提升声誉(如点赞数)及Live活动表现(如观看人数、好评等)。分析使用与主DiD模型相同的数据,考察两个核心因变量:参与者每周回答数(Answer_it)和每个回答的平均点赞数(Upvote_it),分别衡量贡献的数量和质量。此外,我们还考虑了话题类别带来的竞争差异。参考文献区分“软话题”(如娱乐、生活)和“硬话题”(如科技、法律),认为软话题进入门槛低,竞争更激烈。我们将17个Live话题划分为软硬两类,定义变量Hard_i和Soft_i,表示用户所属话题类型。
一、知乎Live对回答贡献的异质性影响。
综合来看,这些结果说明:高声誉的参与者可能在免费内容上投入较少努力,这可能是因为他们将更多资源用于制作付费内容。这凸显了在UGC(用户生成内容)“免费+付费”模式中,内容创作者在资源分配上的张力。
图7-知乎Live对不同用户群体回答贡献和点赞的异质性影响
二、参与者回答行为随时间距离变化的情况。
在这些图示证据的基础上,我们进一步通过回归模型正式检验参与者回答行为随时间距离变化的情况。具体而言,我们估计了如下形式的泊松回归模型(Poisson Regression):其中,Y_it即回答数量、回答获得的点赞数,以及回答内容与有偿活动主题的一致程度。自变量AbsDistance_it∈{1,2,3,4}表示当前时间 t 与该参与者最近一次 Live 活动“创建时间”之间的周数。为了便于解释,我们使用了“时间距离的绝对值”。因此,如果β1为负数,则说明离活动创建越近,因变量越高。其他符号的定义与公式 (1) 中相同。结果表明,“免费内容+付费活动”的模式促使用户在活动前后更专注于自己擅长领域的内容,而不是像广告收益模式那样只追求最大化受众关注。
图8-公式2
图9-回答时间距离对Live事件的影响
三、回答贡献的促销效果。
进一步分析:这些回答贡献是否真的帮助了参与者实现他们的目标。如果是,我们应当看到回答数量与声誉建立和与活动相关的结果之间存在正向关系。
图10-公式3
其中,Y_ij={△Follwer_ij ,△Newfollwer_ij,△Premium_ij}。向量X_ij包含可能影响结果的 Live 活动与创作者特征变量,包括:该参与者上一场活动的评分,参与者的“年龄”(即平台入驻时长,单位为周),对数转换后的粉丝总数,截至活动公告前的累计回答数(同样取对数)。这些变量用于控制参与者在活动开始前已有的声誉与专业能力。此外,我们还加入了话题固定效应(topic fixed effects),用于控制不同活动分类之间的差异。因为所有因变量都是连续型的对数变量,因此我们使用普通最小二乘法(OLS)来估计这个模型。
图11-免费内容贡献与声誉建设和事件相关结果之间的关系
本文基于一个大型知识分享平台的准实验,实证评估了UGC Freemium模式对创作者免费内容贡献行为的影响。该平台最初是一个问答社区,后来推出了一项允许用户举办付费活动的计划。我们发现,在该计划发布后,参与者的内容贡献行为被重新激发,而非参与者的活跃度则持续下降。这种激励效应在声誉尚未建立的参与者和面临激烈竞争的参与者中更为显著。此外,参与者还会根据其付费活动的时间安排和话题内容,有策略地调整他们的免费内容贡献。这些发现表明,创作者利用免费内容来建立声誉,并为其付费内容吸引关注。
尽管本研究聚焦于一个特定的中文知识分享平台,但由于UGC Freemium 模式已在全球多个平台广泛应用,我们的发现具有更广泛的启示意义。例如,美国的Facebook和Quora,英国的OnlyFans等。这些平台通常面临用户参与度低或下滑的问题。同时,当前平台经济中“赢者通吃”的格局,也使得平台面临巨大压力,需要通过鼓励内容生产来扩大流量、吸引注意力。我们的研究结果表明,引入UGC Freemium 模式可以有效激励用户在特定专业领域的内容生产。但同时也提示平台方应关注创作者群体的构成,并设计额外激励机制以激发高声誉创作者的积极性。
本研究也存在若干局限性:
1)我们使用的数据来自中国的一个知识平台。未来研究可以拓展到其他类型的平台,并探讨 Freemium 模式在不同社区结构或文化背景下的效果差异。
2)本文未直接测量内容质量。后续研究可以开发衡量方法,考察 Freemium 模式对内容质量和用户福利的影响。
3)本研究基于观察性数据,无法进行因果推断。如果有条件,未来可以通过随机对照试验(RCT)来探究免费内容与付费内容成效之间的因果关系。
4)我们的发现指出了一个关键问题:创作者如何在免费与付费内容之间进行精力分配。这个问题对平台和创作者的管理实践都有重要启示,是值得深入探索的方向。


