

统计计量|你不可不知的断点回归方法综述

数据皮皮侠

2020-12-15

导读：一文带你了解断电回归方法……

本文转载自公众号计量经济学服务中心

来源：《新“拟随机实验”方法的兴起——断点回归及其在经济学中的应用》

作者：余静文、王春超等

断点回归( Regression Discontinuity，RD)作为一种类似于随机受控试验的准实验方法，能够有效利用现实约束条件来分析变量之间的因果关系，其主要思想是:当个体的某一关键变量大于某一临界值时，个体就接受政策干预，反之，若该变量小于临界值，个体则不接受政策干预。

一般情况下，个体如果受政策干预，那么就无法观测到其没有接受政策干预的情况。而在断点回归中，小于临界值的个体则可作为一个很好的控组来反映个体未接受政策干预的情况，特别是当变量连续时，临界值附近样本之间存在的差别能够很好地反映政策效应与经济变量之间的因果联系，进而可以计算出政策效应变量。

断点回归最早是由美国心理学家 Campbell于1958年设计而成，其后Thistlethwaite和 Campbell(1960)正式发表了关于断点回归的首篇论文，提出RD是一种可有效处理非实验情况下处置效应的方法。Campbell和 Stanley(1963)更加清晰地阐释了断点回归的概念，但并未作出统计上的证明，所以，断点回归并未得到推广。Sacks和 Ylvisaker(1978)提出了断点回归估计方法，并在理论上进行了粗略证明; Trochim(1984)综合之前关于断点回归的理论、方法，将其分为两类，即确定型的断点回归和模糊性的断点回归；Hahn等（2001)地分析了的断点回归模型的识别、估计问题，至此之后，断点回归才在经济研究领域崭露头角，时至今日，其已经在劳动与教育经济学、发展经济学、政治经济学、公共经济学、环境经济学等领域得到广泛应用。

1.断点回归在劳动和教育经济学领域的应用

由于政府在劳动市场和教育部门制定的法规、政策种类比较多，所以断点回归在该领域的应用十分广泛。Angrist和Lavy(1999)根据以色列教育制对班级规模的规定，即班级人数必须保持在40人以内，超过40人的班级必须分为两班，利用断点回归估计了班级规模对学生成绩以及教育质量的影响，研究发现，班级规模越小，学生考试成绩就越好;

其后， Hoxby(2000)利用同样的规定，并考虑入学年龄可能引起不同年级人数有所差别，进而影响班级规模这一机制，采用断点回归考察了班级规模对教育质量的影响，所得结论并未支持 Angrist和Lay(199)的结果;Chiang(2009)根据英国中学自治的规定，即必须获得学生家长一定份额的票数通过才能进行自治，采用断点回归研究学校是否自治对教学质量的影响，实证发现，拥有自治权的学校学生的考试通过率会更高。

Lalive(2007、2008)利用断点回归估计了奥地利延长失业工人补贴时限会对劳动力市场产生何种影响。由于奥地利政府对于50岁以上和50岁以下的失业人员的补贴时限不一致，所以，通过分析50岁上下失业人员的情况，可发现失业补贴时限的不一致会影响失业时间以及新找工作的待遇、类型，此外，由于该项政策的实施还存在地域差别，所以通过对地区间临界线两侧的样本进行研究，发现补贴的时限越长，工人失业的时间也会越长;雷晓燕等(2010)依据中国政府对退年龄的规定，通过利用断点回归方法估计了退休对健康的影响，结果显示，退体会对男性健康具有显著的负效应，而对女性健康基本无影响;邹红和喻开志(2015)基于中国国家统计局城镇住户调查的家庭数据，利用断点回归估计了退休对消费的影响作用，发现退休使城镇家庭的非耐用消费支出、与工作相关的支出、食物支出和文化娱乐支出分别下降9％、25.1％、7.4％和18.6％;张川川(2015)以中国健康与养老追踪调查数据为样本，利用断点回归分析了新型农村社会养老保险对农村老年劳动负担的影响，研究表明，新农保会使老年人工作的概率下降25％-39％，有助于减轻农村老年人的劳动负担。

2、断点回归在发展经济学领域中的应用

断点回归在发展经济学领域中的应用主要利用了各个地区行政区域划分的特点。Dell (2008) 利用断点回归的方法研究了历史制度对区域经济影响的持久性, 并考察了历史制度影响当前经济绩效的渠道。玻利维亚和秘鲁的执政者在16世纪西班牙殖民地时期, 均在波托西 (Potosi) 银矿和万卡维利卡 (Huancavelica) 水银矿地区实行了名为Mita的征收劳工制度, 即执政者要求征用各个地区男性人口的七分之一用于开采银矿和水银矿, 如果一个地区与矿产的距离较远, 那么来回运输和监督成本就会很高, 因此, 出于对经济利益的考虑, 一个地区是否实行了Mita制度在很大程度上取决于该地区与矿产距离的远近, 通过比较Mita制度实行区域与未实行区域之间临界线两侧的样本, Dell发现Mita制度的实施减少了当前地区消费的32%, 并且Mita制度主要通过影响产权界定和公共物品的提供两个渠道影响了当前的地区经济绩效。余静文和赵大利 (2010) 、余静文和王春超 (2010) 也利用了城市圈形成依赖于中心城市的辐射涓滴作用这一特性。如果一个地区距离中心城市较远, 那么通过产业对接、产业互补和资源的重新配置发挥中心城市带动周边地区经济发展的辐射效应就会有所减弱, 因此城市圈的划分与一个地区距离中心城市的远近相关, 通过比较城市圈临界线两侧的样本, 可以得到城市圈形成对地区经济绩效的影响。余静文和赵大利以京津冀、长三角和珠三角城市圈为例, 使用了断点回归方法和分位数回归方法研究了城市圈区域经济的收入差距问题, 他们发现, 城市圈的形成所产生的集聚效应、辐射效应和政府治理改变的综合影响在不同阶段表现出不同的形式, 城市圈地区收入差距也没有呈现出一致的趋势;余静文和王春超利用武汉城市圈和长株潭城市圈的数据, 使用断点回归的方法考察了城市圈形成对城市圈区域经济绩效的影响, 他们发现城市圈形成产生的辐射效应和政府治理结构转变所带来的效应之和大于中心城市产生的“以大吞小”效应, 从而促进了城市圈区域的经济发展。

黄新飞等(2014)以长三角15个城市224个市场37种农产品161个周度价格和成本数据为样本，利用断点回归考察了省级边界对价格差异的影响作用，结果表明，在控制了当地市场供给、需求的特征之后，长三角区域的省际边界效应显著存在，上海市一江苏省、浙江省和江苏省一浙江省的边界效应分别是42％、45％和32.4％。

3、断点回归在政治经济学领域的应用

在政治经济学研究领域中, 由于政党选举通常需要得到一定的选票, 而获得多少选票可以当选是由法律规章制度预先设定的, 因此, 存在一个当选与不当选的选票临界值。断点回归便是利用了这一临界值附近的样本来考察选民对政策的影响、在职者的政治优势和政府的开支等等一系列问题。

在美国众议院选举中, 一个政党如果能够获得所属选区50%以上的选票, 那么就能够赢得该选区的选举。Lee et al (2004) 利用了50%得票率是获选与否的关键决定因素这一特征考察了选民对竞选者政策选择的影响。现有理论中存在两种关于选举对政策影响的观点:第一种观点认为, 竞选者倾向于采取符合处于中位数选民偏好的政策, 即所谓的唐斯收敛效应 (Downsian Convergence Effect) ;第二种观点认为, 考虑到政治家的承诺在选举后并不能完全兑现, 选民倾向于选择当前最有利于他们权益的政策。Lee et al通过考察竞选者面临相近的选票时, 即选举的压力加大时, 是否会改变自己所提倡的政策, 其实证结果表明唐斯收敛效应并不存在。相反, 选民会在两党竞选者中选择出制定了对自己最有利政策的竞选者。

在同样的背景下, Lee (2008) 也利用了必须获得50%以上选票当选这一个规则, 使用了断点回归方法研究了美国众议院当选者是否会利用本次当选所得到的权利, 从而有利于在下一届众议院选举中再次当选这个问题, 他发现众议院的当选者赢得下一次选举的概率更大。（关于该文数据案例详见断点回归操作教程）

Albouy (2009) 以美国两党制为背景, 研究了国会 (包括参议院和众议院) 议员的党派身份对联邦政府在国会议员所属区域支出的影响, 由于一个党派在参议院和众议院获得超过50%选票便能够成为该院占多数的党派, 进而能够对议案的通过产生影响, 因此, 50%的选票便是一个临界值, 通过比较临界值附近的样本差异, 便可以得到获得国会多数席位的国会议员党派对联邦政府支出的影响, 他的研究结果表明, 在国会获得多数席位的议员党派往往能够为该党派议员所属州争取更多的政府支出, 并且对于不同的党派, 政府支出的表现形式还存在差异, 当共和党获得国会多数席位时, 其议员所属州将会得到更多的国防开支, 而当民主党获得国会多数席位时, 其议员所属州将会得到更多教育和城市发展方面的政府开支。

Ferreira&Gyourko (2009) 同样使用断点回归的方法分析了政党选举对政治经济的影响。与之前研究不同的是, 他们使用的是美国城市的数据, 考察的对象是市长的选举, 其研究结果表明, 当选者仍然能够以较大概率赢得下一任的选举, 但是国会选举所表现出来的党派政治对政策和经济的显著影响这一结论并不适用于市长选举。党派政治对市政府的规模、公共品的支出和犯罪率并没有明显的影响, 他们认为这其中的原因在于城市之间较强的同质性和城市之间的竞争使得党派政治对政策和经济的影响有所削弱, 同时也使得竞选者的承诺更为可信。

毛维准(2012)以1946--2009年国际贸易机制与国内武装冲突的数据为样本，通过断点回归分析，认为关贸总协定对国内武装冲突具有显著的降低作用。

4、断点回归在公共经济学领域的应用

国内学者还将断点回归估计应用到了公共经济学域。张川川和陈斌开(2014)

(2014)基于中国健康与养老追踪调査微观数据，利用断点回归方法探讨了新农保对农村养老模式的影响效应，研究结果显示，参与新农保的老年人获得私人转移支付的概率会下降32％-53％，新农保对那些已获得转移支付的老年人获得的转移支付数额并不存在显著影响，所以，社会养老模式能够在一定程度上替代家庭养老模式，但效果有限，仍需进一步提高农村社保水平;刘畅和马光荣(2015)将1994年国贫县的划分作为一项自然实验，利用1999-2009年县级面板数据，运用断点回归方法重新估计了财政转移支付引起的“粘蝇纸效应”，研究表明，财政转移支付确实能够产生“粘蝇纸效应”，一般性转移支付占GDP的比重和专项转移支付占GDP的比重每提高1％，财政支出占GDP的比重将分别提高1.5％和3.0％;雷根强等(2015)将西部大开发战略作为自然实验，选取20002007年中西部地区15个省份的县级数据，利用地理位置模糊断点回归分析转移支付对城乡收入差距的影响效应，发现西部地区获得的转移支付要高于中部地区，但西部地区的城乡收入差距却扩大了20％，所得结果在以不同带宽、距离或维度作为断点回归执行变量的情况下均具有稳健性。

5、断点回归在环境经济学领域的应用

在环境污染方面, 许多国家都颁布了相关的政策和法令来控制日益严重的环境问题, 这也提供了可以利用断点回归进行政策分析和研究的背景。Chay&Greenstone (2005) 使用了断点回归的方法研究了人们对避免空气污染的支付意愿, 美国政府于20世纪70年代颁布了清洁空气法案 (Clean Air Acts) , 即一个地区如果污染程度超过联邦政府所制定的临界值, 那么环保局会将该地区视为未达标地区, 从而使得该地区面临更为严格的监管。因此, 联邦政府为地区污染所制定的排放临界值便成为实证研究中的一个间断点, 通过比较超过排放临界值地区和未超过排放临界值地区的房价水平, 他们发现, 受到环保局更严格监管地区的悬浮颗粒总量会有所下降, 并且悬浮颗粒总量每下降1, 地区的房价便会提高0.4-0.5%。Davis (2008) 利用了墨西哥城于1989年实行的名为Hoy No Circula的项目, 即每周车辆将根据其牌照最后一位数字而被限行一天, 运用断点回归的方法研究了这一车辆限行政策对空气质量的影响, 他发现车辆限行政策并没有改善当地的空气质量, 相反, 车辆限行提高了未被限行车辆的使用率, 同时人们也转而使用高排放量的车辆。Greenstone&Gallagher (2008) 使用断点回归的方法研究了1980年美国国会通过的并由卡特总统签署的综合环境反应、赔偿和责任法案 (Comprehensive Environmental Response, Compensation, and Liability Act, CERCLA) 所产生的经济价值, CER-CLA要求环保局对污染物质排放超标或对公共健康和环境构成威胁的地区实行环境清洁计划的权利, 因此, 污染物质排放水平便成为关键变量, 它决定着一个地区是否实行了环境清洁计划。通过比较实行环境清洁计划地区和未实行环境清洁计划地区的房价和房屋租金, 他们发现如果一个地区实行了环境清洁计划, 那么20年后, 该地区的房屋财产价值将会增加4200万美元, 并且居住人口也会显著增加。Almond et al (2009) 研究了中国使用暖气的政策对地方环境污染的影响, 在1950-1980年间, 由于财政不足以令全国地方政府提供免费煤炭以暖气供暖, 但当时只有淮河和秦岭以北的地区能够得到免费的煤炭供暖, 这项政策的实施使得以淮河和秦岭为界的南北地区空气污染程度产生了显著的差别, 他们使用断点回归的方法对这一问题进行了细致的研究, 其研究结果表明淮河和秦岭以北的地区空气中悬浮颗粒总量明显高于淮河和秦岭以南的地区, 并且北方悬浮颗粒总量的指标是美国的5-8倍。

曹静等(2014)根据北京奥运会之后采取的“尾号限行”政策利用断点回归模型探讨了限行政策能否改善空气质量，发现限行政策对空气质量的改善并没有显著影响;席鹏辉和梁若冰(2015)基于多断点回归设计考察了空气污染对地方环保投入的影响，研究表明，空气污染程度较低会降低环保支出比重。

陈强（2017）使用华北 39 个城市从 2013 年 10 月 1 日至 2014 年5月 31日的面板数据，对冬季供暖使空气污染进行研究。断点回归显示，燃煤供暖的污染效应存在一个逐步升温加压、污染物累积的过程，并非一蹴而就。

孙坤鑫（2017）以京Ⅴ标准的实施为例，基于断点回归设计的方法，检验了机动车排放标准的提升对空气质量的改善效果。研究发现，长期京Ⅴ标准的实施使北京市大气中的PM2.5浓度均值发生显著降低，但短期内成品油质量的提升没有带来 PM2.5浓度的显著下降，京 Ⅴ 标准实施前后空气质量的改善得益于良好的气象条件和污染产业产值的下降。

【声明】内容源于网络

数据皮皮侠

社科数据综合服务中心，立志服务百千万社科学者

内容 2137

粉丝 0

数据皮皮侠社科数据综合服务中心，立志服务百千万社科学者

总阅读615

粉丝0

内容2.1k