近两年,在监管推动与资本市场需求叠加下,上市公司ESG/可持续报告的数量与篇幅显著增长。以中国强制披露主体为例,2024年度可持续相关报告披露率达到94.42%,且报告“变厚”非常明显:近一半公司的报告超过100页。同期,越来越多公司开始用交易所《指引》作为编制依据,并普遍开展重要性评估,甚至有六成左右已开展“双重重要性”分析。
再看港股市场,普华永道对香港上市公司样本的调研显示:100%的样本ESG报告篇幅超过20页,其中79%超过60页。换句话说,“披露很厚”已经成为常态。
但现实问题是:许多企业即使披露做得很“全”、报告很“长”,MSCI的字母评级(AAA-CCC)仍然可能停留在BBB/BB甚至更低。这种落差并不罕见,其根源不是“写得不努力”,而是披露数量与MSCI的评分函数并不是一一对应关系——披露更多只是“信息供给”,而评级更像是“风险管理能力与真实表现的结果判定”。
要解释这一矛盾,必须回到MSCI的底层逻辑:它要衡量的并非“你说了多少”,而是“你在财务重要的ESG风险上,暴露有多大、管理能力有多强、并且是否被争议事件证明你没管住”。
MSCI ESG评级的官方定位,是对公司管理“财务相关”ESG风险与机遇的意见,并且是行业相对的评价:同一家公司在不同行业,评级含义并不完全可比。
MSCI把评级拆成一套分层结构与计算链条:
三大支柱:环境、社会、治理。
十个主题:例如环境下有“气候变化、自然资本、污染与废弃物、环境机遇”,社会下有“人力资本、产品责任、利益相关者异议、社会机遇”,治理下有“企业治理、企业行为”。
33个ESG关键议题:每个主题下再拆成更细的关键议题(例如碳排放、隐私与数据安全、供应链劳工标准、商业道德、税务透明度等)。
MSCI在方法论文件中把核心步骤讲得很清楚(用更接近企业语言的方式复述):
第一步:确定“你这个行业最重要的ESG风险考什么”
MSCI在环境与社会领域有27个可选关键议题,而每个行业(基于GICS子行业)通常从中选2到7个来评估;治理领域则是对所有公司统一评估(六个治理关键议题跨越“企业治理/企业行为”两大主题)。
第二步:设定权重——决定“考得多少算数”
环境与社会的单个关键议题,通常占总评级的5%到30%;治理支柱的权重在支柱层面设置,且所有子行业治理权重下限为33%。
权重怎么来?MSCI用一个很典型的“外部性影响程度 × 风险出现时间”框架:影响大且短期发生的议题权重更高;影响小且长期发生的权重更低,极端情况下权重差可达3倍。
第三步:给每个关键议题打0-10分——但分数不是“披露积分”
在环境与社会领域,关键议题得分由两部分构成:风险敞口与管理能力。管理能力并不只是政策陈述,而会综合策略、计划举措、量化表现、以及争议事件。
MSCI对“满分10分”的解释直白:相对于其风险,管理措施非常强,并且在量化指标上表现优于同行、且没有争议;反之0分通常对应高风险暴露且管理很差。
治理支柱则更像“扣分制”:以10分为起点,根据所有权与控制权、董事会、薪酬、会计,以及企业行为(商业道德、税务透明度)等关键指标产生扣减。
第四步:汇总成WAKIS与IAS,再映射到AAA-CCC
MSCI先将关键议题得分按权重加权得到关键议题加权平均得分,再进行行业标准化得到行业调整得分,最后通过预设矩阵映射为AAA到CCC七档。
第五步:争议事件与阈值机制——“再厚的报告,也可能被一次严重事件拉下去”
MSCI明确指出:AAA公司必须满足最低公司治理阈值,且不能直接涉及任何仍在进行的“非常严重”争议事件。
争议事件如何判定?在MSCI的争议与全球规范方法论中,一起争议会按严重性(考量负面影响的性质与规模,并考虑加重/减轻情形)、公司角色(直接/间接)、事件状态(进行中/部分结束/结束/归档) 综合给出分数与标记。
第六步:更新节奏与“窗口期”——披露不等于立即生效
评级通常由分析师“年度”复核;MSCI力求纳入评级行动日期前三个月内发布的公司披露信息。同时,部分数据点可以周度更新,但并不一定触发评级行动。
这意味着:企业即使“补充披露”很快,但如果错过窗口、或未触发评级行动,评级结果可能短期不变。
MSCI ESG Research的数据来源本身也提示了“披露只是输入之一”:除公司披露外,还包含政府、NGO、媒体与其他公共数据源。
披露载体与框架:越来越规范,但不必然“对MSCI有效”。
在A股市场,交易所《可持续发展报告指引(试行)》已把披露框架高度制度化:对具有财务重要性的议题,围绕“治理—战略—影响/风险与机遇管理—指标与目标”四要素披露,并设置21个议题,且强制与鼓励要求并行。
同时,强制披露主体中,2024年度已有64.27%按“四要素”披露气候变化信息;温室气体排放披露率也上升,但范围3披露仍仅27.25%。
在港股市场,香港交易所的规则与指引持续强化,2024年修订后:
自2025年起,所有上市发行人强制披露范围1与范围2温室气体排放;
主板发行人还需按“不遵守就解释”基础披露气候相关要求,后续对大型成份股有更强要求。
港交所也提供了“如何编备ESG报告”的操作指南,强调董事会对重要性边界的最终责任。
从披露实践看,强制披露主体报告越来越长、指标越来越多:2024年度,58.61%的公司披露50-100个量化指标;但第三方鉴证比例仍仅27.51%。这很典型地提示一个事实:披露“更多”并不等于披露“更可信、更可比、更可用于建模”。
下面这张对照表可以帮助理解:企业披露的“常见大块内容”,哪些更容易被MSCI转化为评分输入,哪些则容易停留在“叙事层”。
企业披露常见板块 |
常见写法(披露侧) |
MSCI更可能“吃进去”的证据形态(评分侧) |
常见失分点(披露多但分不高) |
|---|---|---|---|
治理架构与职责 |
成立ESG委员会/工作组、董事会声明 |
治理结构是否有效、关键治理指标是否触发扣分、治理阈值是否满足 |
机构设置“有名无实”;独立性、问责、激励约束未体现在治理关键指标上 |
重要性/议题识别 |
重要性矩阵、双重重要性、列出议题清单 |
议题是否对应行业财务重要的关键议题;是否能支撑“风险敞口与管理”两端的数据输入 |
议题覆盖面广但“偏公益/偏形象”,与MSCI按行业选取的关键议题错位 |
战略与目标 |
“碳中和愿景”“到2030年/2060年”目标 |
目标“力度”、减排路径、达成记录、同行相对表现 |
目标不量化、不设基准年、不披露范围与边界;或没有达成记录 |
绩效数据(E/S) |
大量KPI罗列(能耗、排放、员工等) |
可比口径的强度指标、趋势、与同业相对位置;必要时会被估算模型替代 |
数据口径不一致、边界变化、缺乏鉴证;或只披露“总量”不披露强度/趋势 |
负面事件与合规 |
多以“零重大事故/零罚款”一句带过 |
争议事件的严重性、角色、状态会直接进入扣分或限制评级上限 |
披露避重就轻,但媒体/政府数据源会被MSCI捕捉;争议升级触发快速下调 |
表中最关键的一行其实是:MSCI并不把披露当作“加分项本身”,而是把披露当作“支持其判断风险敞口与管理能力的证据”。这与很多企业把ESG报告当作“展示册”的心态,本质上不在同一个坐标系。
学术证据:披露“长度”可能有关,但“覆盖面/完整性”对MSCI不一定显著。
一项基于中国上市公司2009-2021年、共10,021份可持续报告的研究,用文本计算了报告长度、可读性、语气、模板化、冗余度与完整性,并检验它们与不同机构ESG评分的关系。该研究发现:
报告长度与MSCI、FTSE、SNSI三类评级均呈显著正相关;
但报告“完整性”(以覆盖SDGs数量衡量)对FTSE与SNSI显著,对MSCI不显著。
这组结果对“披露厚但MSCI不高”非常有解释力:MSCI可能“认可更详细的信息供给”,但并不会因为你覆盖更多话题(更像“广度叙事”)就系统性提高评分。
如果把它翻译成企业可操作的语言,就是:“写得更详细”可能让MSCI更容易识别你做了什么,但“写得更广、更像百科全书”未必能让MSCI加分,因为MSCI更关注行业财务重要风险的管理能力与结果证据。
MSCI并不是唯一被用来决策的ESG评级来源。学术界对ESG评级分歧有系统讨论:一项对六家主流评级机构(含MSCI)进行比较的研究指出,评级分歧可以分解为“范围、度量、权重”三类来源,其中度量差异贡献最大,范围差异次之,权重差异相对较小。
这说明,即使企业披露同样丰富,评级机构对“指标怎么取、怎么度量、用哪些外部数据佐证”的差异,足以导致截然不同的结果。
中国学者也从本土语境提出补充解释:以上海财经大学的研究为例,其发现中外评级分歧与“隐性社会责任”认定、以及是否按照国际标准披露等因素相关,并指出海外机构可能更看重国际披露可比性。
这对“披露很厚但MSCI不高”的启示是:披露的“形式丰富”≠披露的“国际可比与可定量”。
在更聚焦气候/排放的评分场景,研究者甚至发现“分数未必反映真实排放结果”。以钢铁行业为例,一项开放获取研究分析了75家钢铁生产商的主要评级机构气候相关分数,发现:环境与排放评分没有强证据反映企业排放水平或排放强度变化,“好分数”整体上也不由可得的排放或投资数据解释。
虽然该研究讨论的是“气候相关评分”,但它与本文主题共享一个核心隐喻:当评分模型更关注“管理意图/体系/相对位置”而非直接刻画“真实影响结果”时,披露再厚,也未必能把评分推到想要的区间。
把MSCI方法论拆开看,影响评级的“硬变量”主要分为六类,它们往往比披露篇幅更能决定评级结果:
1. 行业与商业模式决定“题目”与“难度”
MSCI先按行业确定关键议题与权重,再做同业归一化。因此,“披露很厚但评级一般”的第一种情况是:企业把大量篇幅投入到非该行业的高权重关键议题之外,或投向权重很低的事项。写得再多,也很难改变总分。
2. 风险敞口是“底盘”,披露无法直接降低敞口
MSCI明确把关键议题拆成“风险敞口+风险管理”。风险敞口评估会看业务板块结构、地域结构、以及公司层面因子。很多公司披露的重点是“我们做了什么”,但MSCI的敞口模型首先问的是“你天然暴露在多大风险里”。披露本身很难改变这一底盘。
3. 管理能力评分更偏“制度+结果”,不是“口号+活动”
以碳排放关键议题方法论为例,MSCI的管理得分会综合目标、减排举措与绩效,并以同行相对表现衡量。其中甚至把“是否向CDP披露”作为输入点之一,但它只是管理维度的一个数据点,真正决定表现分的仍是强度与趋势等可比绩效。
4. 争议事件具有“负向杠杆”,可限制评级上限或触发扣分
MSCI对争议的评估并非“披露了就没事”,而是基于严重性、角色与状态综合定级。并且AAA有硬门槛:不能直接涉及仍在进行的非常严重争议。这意味着:一家公司即使报告写得很“完美”,只要现实世界发生的争议事件足够严重,评级就会出现“硬顶”。
5. 数据质量、口径与可验证性:披露“可用”比披露“可看”更重要
就温室气体而言,MSCI会从年报/CSR报告/公司网站等收集排放数据,必要时还会使用CDP数据;若披露不符合常见标准或不足,MSCI有估算模型来补齐。企业常见问题是:披露口径变化、边界不清、缺乏鉴证。以A股强制披露主体为例,2024年度聘请第三方鉴证的比例仅27.51%。当数据可信度不足时,“披露很多”不一定转化为“评分输入更优”。
6. 更新节奏与信息窗口:披露未必“及时进入模型”
评级通常年度复核,MSCI力求纳入评级行动日期前三个月的披露;部分分数可周度更新,但不保证触发评级行动。因此企业可能出现这种体验:“我们今年披露升级了,为什么评级没动?”——一个常见原因就是“信息进来了,但没到重新算评级的时点,或没触发评级行动”。
把以上机制系统化,可以形成一个更“可诊断”的框架:披露量到评级结果之间,至少有六道关口;任意一关卡住,都可能导致“披露厚但评级不高”。
议题错配——写了很多,但不是高权重关键议题。
证据形态错配——叙事多、可比数据少。
底盘错配——风险敞口高要求更高管理强度。
负面事件穿透——争议事件对总分的负向杠杆。
相对排名机制——同业都在进步,你不一定更领先。
时间窗口与数据处理——披露滞后或未触发评级行动。
用一句话概括这个框架:MSCI评级不是“披露竞赛”,而是“财务重要ESG风险的同业对标管理能力竞赛”,披露只是参赛材料之一。
如果企业的目标是更高的MSCI评级,而不只是“合规披露”,以下建议更像“从披露到得分”的工程路线图:
把报告结构对齐“MSCI高权重关键议题”,而不是只对齐“披露框架”
建议企业做两张“重要性地图”并对齐:一是面向监管/广义利益相关方的议题矩阵;二是面向MSCI同业对标的“高权重关键议题矩阵”。
从“叙事披露”升级为“可比与可核查的数据体系”
需要把数据做成“可审计的资产”:明确边界、形成连续时间序列(至少3年)、尽量披露强度与趋势、对关键指标引入鉴证或内部控制证据链。
在关键领域用“目标—行动—结果—对标”闭环,而不是只写“目标与行动”
建议每个高权重议题至少形成:量化目标(含基准年、覆盖范围、路径)、投资/改造/管理举措与里程碑、达成记录(轨迹而非一次性结果)、行业对标口径(说明为何优于/不劣于同业)。
建立“争议事件雷达”与应对机制,把负面杠杆降到最低
企业应把争议管理当作“评分防守核心”:建立跨部门的争议监测与分级机制;对重大事件形成“事实—整改—补偿—治理改进”的公开证据链;对供应链、数据安全等易爆点提前做尽调与审计。
提前规划披露节奏,避免错过MSCI信息纳入窗口
建议企业把关键披露(尤其高权重议题的量化更新)尽量前置,并保持持续更新,而不是集中在某个节点“补材料”。
参与反馈与数据核验流程,纠正“数据缺口/误读”
实践中,很多“披露厚但得分不高”的企业,问题并非“没做”,而是“MSCI没有获取到可用数据”或“业务分部/地域等敞口被默认处理”。提高可得性与可核验性,往往比增加篇幅更有效。

