一.
研究内容
价值不断提升的政府网站内容数据不仅可以描绘政策注意力,也为中央政策向地方层级扩散的测量与评估提供了新的机遇.在我国多层级政府组织治理模式下,地方政府对中央政策的贯彻落地是政策生效的前提条件.对纵向政策扩散的有效测量和评估将有助于理解政策扩散机制,提升政策落地效果。
本文选取全国省、市两级政府门户网站 300 余天的每日更新内容数据,共超过170 万篇,10 亿级文字量的文本数据.通过潜在狄利克雷分配( Latent Dirichlet Allocation,LDA)概率主题建模方法建构政府网站内容的主题概率矩阵.在描绘政府对不同主题的注意力分配差异的基础上,构建函数测量“政策扩散速度”与政策扩散程度”两个变量,以了解中央政策在地方层级的响应和执行情况,基于多政策主题的混合回归估计.探究短时间周期和快速响应的情景下政策扩散的影响因素.并结合机器学习分类算法进行了鲁棒性检验.研究试图通过测度构建突破“中间层”.从而将政府网站内容数据的挖掘解释与政策扩散效果的评估相连接,贡献深层次公共管理决策知识,基于政策信息学提升公共政策评估研究与实践的方法水平。
二.
模型设定
(一)数据准备
论文研究数据来自全国省、市级政府门户网站每日更新的170 万余条门户网页文本数据.数据抓取单位为政府门户网站每一个页面的内容信息.包括页面 URL 地址、标题、发布时间、文章发布单位或转载来源、关键词、作者、摘要、具体内容等.数据入库前,还通过元素提取(如网页名称、大小、日期标题、文字内容等)、数据排重和信息过滤(广告过滤、URL 过滤等)等前期处理工作.数据处理路径见下图:


然后,本文使用 120 作为建模主题数对1708735条政府门户网页文本数据进行 LDA 主题建模。下图为主题含义和概率占比情况(即图中面积大小)。

(三)扩散速度与扩散程度计算





下图展示了 2018 年地级市对中央 13 项政策的回应扩散速度情况.曲线越扁平,地级市政府扩散响应时间越短.层级扩散速度越快.
可以看出,地级市政府回应最快的是医疗卫生监管主题,平均扩散时间为 12.07 天,最慢的是土地使用权主题.达25.11 天。

下图展示了13项中央政策在245个地级市扩散程度的分位数统计量.从 0.5分位数来看社会保障”、“改革与发展”“乡村振兴战略”等主题在中央政策激励产生后,超过一半的城市对这些政策扩散程度高于均值0.56.表示这几个政策主题为2018年度地方政府有限注意力中回应较多的几个中央政策主题.

(四)影响因素分析
从回归结果来看.内部经济与行政因素中仅各地人均经济水平对扩散速度和扩散程度具有显著影响,影响系数在不同模型中保持稳健地方经济水平越高.中央政策的扩散速度越慢扩散程度也越低.外部扩散机制中,扩散速度受同级扩散速度和上级扩散程度的影响,扩散程度既受到上级和同级扩散速度的影响,也受到上级和同级扩散程度的影响.对领导人特征的检验中,市委书记的年龄和任期对中央政策扩散速度和扩散程度影响的回归系数均为负值但并不显著.市长的个人特征检验中,仅任期与中央政策扩散速度之间呈显著的倒 U型关系控制变量中,仅中央政策类型对扩散程度有显著影响,地方政府对社会政策的扩散程度高于经济政策.中央政策级别和地方政府网站信息公开建设水平对中央政策扩散无显著性影响。


三.
总结

Paper数据分析公众号
资源分享、科研辅导、数据分析等干货基地


