大数跨境
0
0

顶刊|政府网站内容数据中的知识发现:政策扩散速度与扩散程度计算

顶刊|政府网站内容数据中的知识发现:政策扩散速度与扩散程度计算 Paper数据分析
2023-10-21
1
导读:一.研究内容 价值不断提升的政府网站内容数据不仅可以描绘政策注意力,也为中央政策向地方层级扩散的测量与

一.

研究内容

    价值不断提升的政府网站内容数据不仅可以描绘政策注意力,也为中央政策向地方层级扩散的测量与评估提供了新的机遇.在我国多层级政府组织治理模式下,地方政府对中央政策的贯彻落地是政策生效的前提条件.对纵向政策扩散的有效测量和评估将有助于理解政策扩散机制,提升政策落地效果。

    本文选取全国省、市两级政府门户网站 300 余天的每日更新内容数据,共超过170 万篇,10 亿级文字量的文本数据.通过潜在狄利克雷分配( Latent Dirichlet Allocation,LDA)概率主题建模方法建构政府网站内容的主题概率矩阵.在描绘政府对不同主题的注意力分配差异的基础上,构建函数测量“政策扩散速度”与政策扩散程度”两个变量,以了解中央政策在地方层级的响应和执行情况,基于多政策主题的混合回归估计.探究短时间周期和快速响应的情景下政策扩散的影响因素.并结合机器学习分类算法进行了鲁棒性检验.研究试图通过测度构建突破“中间层”.从而将政府网站内容数据的挖掘解释与政策扩散效果的评估相连接,贡献深层次公共管理决策知识,基于政策信息学提升公共政策评估研究与实践的方法水平。



二.

模型设定

(一)数据准备

    论文研究数据来自全国省、市级政府门户网站每日更新的170 万余条门户网页文本数据.数据抓取单位为政府门户网站每一个页面的内容信息.包括页面 URL 地址、标题、发布时间、文章发布单位或转载来源、关键词、作者、摘要、具体内容等.数据入库前,还通过元素提取(如网页名称、大小、日期标题、文字内容等)、数据排重和信息过滤(广告过滤、URL 过滤等)等前期处理工作.数据处理路径见下图:

(二)LDA 概率主题建模

LDA 是由 Blei 等在 2003 年提出的一种概率主题模型,可以给出文档集里面每篇文档讨论的不同主题的概率分布值,是一种量化文本内容的无监督学习算法.
首先,使用自然语言处理领域常用于判断语言模型优劣的平均困感度(average perplexity)作为 LDA 建模效果衡量指标,本文通过交叉验证方式计算不同主题数的平均困感度值,综合考虑困惑度与可解释主题占比等因素,本文选取 120 为建模主题数。

    然后,本文使用 120 作为建模主题数对1708735条政府门户网页文本数据进行 LDA 主题建模。下图为主题含义和概率占比情况(即图中面积大小)。

(三)扩散速度与扩散程度计算

    需要进一步和外生中央政策激励关联,以明确该政策议题是否由中央政策激励引起,提升概率主题和外生中央政策匹配的精确度.经筛选,共 13 个政策主题满足分析要求。

下图展示了 2018 年地级市对中央 13 项政策的回应扩散速度情况.曲线越扁平,地级市政府扩散响应时间越短.层级扩散速度越快.

可以看出,地级市政府回应最快的是医疗卫生监管主题,平均扩散时间为 12.07 天,最慢的是土地使用权主题.达25.11 天。

    下图展示了13项中央政策在245个地级市扩散程度的分位数统计量.从 0.5分位数来看社会保障”、“改革与发展”“乡村振兴战略”等主题在中央政策激励产生后,超过一半的城市对这些政策扩散程度高于均值0.56.表示这几个政策主题为2018年度地方政府有限注意力中回应较多的几个中央政策主题.

(四)影响因素分析

    从回归结果来看.内部经济与行政因素中仅各地人均经济水平对扩散速度和扩散程度具有显著影响,影响系数在不同模型中保持稳健地方经济水平越高.中央政策的扩散速度越慢扩散程度也越低.外部扩散机制中,扩散速度受同级扩散速度和上级扩散程度的影响,扩散程度既受到上级和同级扩散速度的影响,也受到上级和同级扩散程度的影响.对领导人特征的检验中,市委书记的年龄和任期对中央政策扩散速度和扩散程度影响的回归系数均为负值但并不显著.市长的个人特征检验中,仅任期与中央政策扩散速度之间呈显著的倒 U型关系控制变量中,仅中央政策类型对扩散程度有显著影响,地方政府对社会政策的扩散程度高于经济政策.中央政策级别和地方政府网站信息公开建设水平对中央政策扩散无显著性影响。

三.

总结

本文讨论了测度建构的原理和细节,并引入机器学习方法进行鲁棒性检验,通过多政策主题扩散的混合回归分析了影响短周期政策层级扩散的因素。研究以测度建构为突破口打通文本数据挖掘到有价值公共管理知识的“中间层”,对政策信息学在政策扩散及评估监测中的应用前景进行了初步探索.

参考文献:
张楠,黄梅银,罗亚,马宝君.全国政府网站内容数据中的知识发现:从注意力分配到政策层级扩散[J].管理科学学报,2023,26(05):154-173.



本公众号资源来自网络搜集与创作,版权归原作者。如有不妥,请联系小编修改。
如有以下需求请直接点击红字链接
数据资源
学术指导
开通会员
爬虫服务
长按二维码关注Paper数据分析

Paper数据分析公众号

资源分享、科研辅导、数据分析等干货基地



更多资源,点击下方阅读原文

【声明】内容源于网络
0
0
Paper数据分析
资源分享、科研辅导、数据分析等干货基地
内容 136
粉丝 0
Paper数据分析 资源分享、科研辅导、数据分析等干货基地
总阅读49
粉丝0
内容136