大数跨境
0
0

中国工业环境数据库(1998-2015)

中国工业环境数据库(1998-2015) 数据皮皮侠
2025-02-27
2

1641

中国工业环境数据库(1998-2015)

数据简介

参考文章China industrial environmental database 1998–2015(2022)的做法,该文章的核心数据计算方法主要通过自下而上(bottom-up)和自上而下(top-down)的方法相结合,再利用交叉熵方法来平衡每年的二维数据,最终构建了中国工业环境数据库(CIED)。


第一步,利用企业层面的环境数据计算每个地区和每个部门的污染物排放和去除量

自下而上的方法(Bottom-Up Method)

  • 数据来自中国环境统计数据库(CESD),这个数据库是由中国环境保护部(现为生态环境部)编制的,包含了主要的工业排放源数据

  • 使用工业企业层面数据来计算各地区和各部门的污染物排放和去除量(化学需氧量(COD)、二氧化硫(SO2)、氨氮(NH3N)和氮氧化物(NOₓ))。

  • 在数据清洗过程中,针对异常数据记录(如缺失值和测量误差)进行了人工检查和修正。  

  • 缺失值处理:如果一个水污染企业在所有年份都有COD和NH₃-N排放数据,但某一年缺失NH₃-N数据,那么就使用插值法来补全缺失的数据。  

  • 测量误差修正:如果企业报告的数据使用了错误的单位(使用克而不是千克),导致数据比真实值高1000倍,那么就会将数据调整到合理的水平。

1.数据聚合

计算各地区和各部门的污染物排放和去除量是通过将所有企业的排放和去除数据进行加总得出的。具体公式如下:

2.缺失数据估算:

第二步,利用自上而下的方法收集每个地区或每个部门的污染物总排放量和去除量。

自上而下的方法(Top-Down Method)

数据来自《中国环境统计年鉴》和《中国环境年鉴》,这些年鉴中的数据是基于中国环境统计系统(ESS)编制的。

1. 宏观数据的收集:

从《中国环境统计年鉴》(2001年至2015年)和《中国环境年鉴》(1998年至2000年)中收集地区或部门的污染物排放和去除总量数据;年鉴数据是基于微观环境统计数据(CESD)汇总的,通常只包括主要污染源的数据。

2. 数据不一致处理:

环境统计系统(ESS)在研究期间经历了四次调整,这导致不同时期的数据包含不同的污染物(如NH3N和NOₓ在不同的五年计划中开始被纳入统计)以及不同的部门分类方式不同。在2003至2010年期间,火电厂的统计数据单独收集,因此这部分数据不包含在数据库中。


第三步,采用交叉熵方法来平衡每年的二维矩阵

数据平衡与调整(Cross-Entropy Method)

使用自下而上的微观环境数据(企业级数据聚合)和自上而下的宏观环境数据(年鉴数据)。

计算步骤:

1. 第一步调整(基于区域的比例调整)

2. 第二步调整(交叉熵方法平衡二维数据矩阵)

最后一步,数据验证与比较

  • 将构建的数据库数据与浙江省的部门级环境数据进行比较,以验证数据的准确性。结果显示,构建的数据与官方统计数据高度一致,证明了其可靠性。

  • 与国家汇总数据的比较显示,修正后的数据更为平滑,异常值得到了校正。

数据来源

数据来自历年《中国环境统计年鉴》(2001年至2015年)和《中国环境年鉴》(1998年至2000年),数据由数据皮皮侠团队人工整理,全部内容真实有效。

时间跨度

1998-2015

数据范围

中国省级层面数据

数据展示

一共有八个子数据集,包含cod_discharge、cod_removal、so2_discharge、so2_removal、nh3n_discharge、nh3n_removal、nox_discharge、nox_removal




图4.部分数据展示

参考文献

Qian, H., Ren, F., Gong, Y., Ma, R., Wei, W., & Wu, L. (2022). China industrial environmental database 1998–2015. Scientific Data, 9(1), 259.

声明:本数据由数据皮皮侠团队整理,仅用于学术研究

皮皮侠数据库引用声明

请您在任何基于“数据皮皮侠”数据库所产生的中文研究成果(含学术论文、公开发表的研究报告等)均包括以下表述或类似表述声明:

本研究使用的数据来自“数据皮皮侠”数据库。

同时以电子文献形式进行引用标注,形式如下:

数据皮皮侠团队. 区县行政区划变更数据库[EB/OL]. [2023-1-1]. http://www.ppmandata.cn/.

其中,“2023-1-1”应当替换成实际引用日期,“区县行政区划变更数据库”替换成实际使用的数据库名称。


请您在任何基于“数据皮皮侠”数据库所产生的英文研究成果(含学术论文、公开发表的研究报告等)均包括以下表述或类似表述声明:

The data used in this study is from the PPman Database organized and managed by PPman Data Team.

同时以电子文献形式进行引用标注,形式如下:

PPman Data Team. Database of Point of Interest[EB/OL]. [2023-1-1]. http://www.ppmandata.cn/.

其中,“2023-1-1”应当替换成实际引用日期,“Database of Point of Interest”替换成实际使用的数据库名称。

资源获取方式


 数据编号  1641


高级会员或永久会员 可在官网搜索对应编号免费下载

官方网站:www.ppmandata.cn


非高级会员或永久会员 可进入官网

搜索对应编号后在网页右上角通过数据元购买

以1533为示例:

往期热门数据推荐

1、1541 国家自然科学基金标书大全(2002-2024)

2、1592 人工智能顶刊-文章+数据+代码合集(2020-2024)

3、1619 全国各省市AI算力(2000-2024)

4、1583 数据交易平台试点城市DID数据(2009-2023)

5、1586 环境政策DID大全1.0


【声明】内容源于网络
0
0
数据皮皮侠
社科数据综合服务中心,立志服务百千万社科学者
内容 2137
粉丝 0
数据皮皮侠 社科数据综合服务中心,立志服务百千万社科学者
总阅读2.6k
粉丝0
内容2.1k