相信大家在相关研究或工作中,都频繁使用过政府采购数据,其作为反映政府资源配置、政策执行等多方面情况的关键信息源,重要性不言而喻。
然而,中国人民大学学者在发表于顶刊《数量经济技术经济研究》中的“数字政府建设与城市治理质量:来自公共安全部门的证据”一文中直指政府采购数据存在重大问题!
图源:“数字政府建设与城市治理质量:来自公共安全部门的证据”原文
该研究通过机器学习的方法在政府采购数据中识别筛选出公安局等公共安全部门作为采购人的订单,并构建数字化采购相关关键词词典,用以匹配获得公共安全数字化采购数据。
在该过程中,作者团队发现,该数据的主要来源“中国政府采购网”中,中标公告里的采购金额部分弊病丛生。
更要命的问题是,该数据中出现问题的样本量尚未明确,如果占总量至少一部分比例,那么带来的负面影响不容小觑,不仅严重干扰基于政府采购数据的学术研究,还为政策制定与执行效果评估增添阻碍。错误或缺失的数据可能导致对政府支出规模、资源配置方向的误判,进而影响学术研究的科学性与精准性。
这也让我们不得不警惕着之前用未修正版数据做的研究可能都存在一些问题!
1.合同金额与单位不匹配,42805183.61元被误标为万元单位
2.696000.00元,不是696000.000000万元
3.合同金额被错标为负数,在另外的平台上找到正确的标记
4.总金额标的是单价
5.合同金额显示失误,被后退4位数
6. 合同金额价格错误
购买后附赠数据处理

