本研究探讨了公司财报公告中文字披露的信息含量。通过运用大型语言模型(LLM)来捕捉文字本身及其上下文所蕴含的信息,本研究发现:收益新闻稿中包含的新闻(i) 在解释短期窗口股票回报的变动方面,其解释力是基于词典和非LLM机器学习方法的一系列文本衡量指标的三倍;(ii) 相较于使用传统回归或机器学习方法建模的一系列财务报表意外项,其解释力度(R²)提升了一倍;(iii) 在公告发布后短短五分钟内,其解释了即时价格调整的很大一部分。与收益新闻稿和财务意外项相比,利用LLM建模分析的电话会议内容进一步将解释力度(R²)提高了四分之一。当收益持续性较低以及处于总体不确定性较高的时期时,文字披露的信息含量更为丰富。大部分新闻信息源自于描述数字的文字、披露开篇部分的内容以及包含新颖信息的文本。这些发现凸显了公司文字披露在驱动股价变动中的作用,并深化了我们对投资者如何利用公司披露信息的理解。
Federico Siano (2025) The News in Earnings Announcement Disclosures: Capturing Word Context Using LLM Methods. Management Science 0(0).
导言
本课程旨在为经管社科领域的科研人员(包括硕博生、青年教师及资深研究者)提供一个全面而实用的前沿方法思路及编程体系,帮助理解并运用大语言模型(LLMs)和Python工具进行前沿学术研究。
课程将从LLMs的基本原理入手,逐步深入到高级技术和实际研究场景应用,涵盖文本挖掘、关系抽取、知识图谱构建等。我们将特别关注LLMs如何助力研究者处理和分析大规模非结构化大数据(如公司报告、财经新闻、政策文件、学术文献、关系数据等),从中提取洞见,并探索新的研究范式。
课程强调理论与实践相结合,通过《经济研究》《中国工业经济》、Review of Financial Studies、Review of Finance、《审计研究》5个TOP刊案例,以及4个前瞻性思考案例,使学员掌握将LLM应用于自身高水平研究工作的能力。
1. 课程概览
课程名称:大语言模型与顶刊前沿Python实操
课程老师:Simon博士
课程时间:2025年7月5日-7月6日 上午10:00-12:00,下午15:00-17:00(可能视情况加时)
授课方式:腾讯会议线上直播
报名方式:
扫码报名
课程特色:
(1)学术聚焦:目前国内外经管顶刊大模型方法全部总结,同时有前瞻性启发性探讨
(2)授人以渔:顶刊应用综述→大模型原理→顶刊文本挖掘应用→因果关系、网络、知识图谱等前瞻应用
(3)TOP刊方法复刻:《经济研究》《中国工业经济》、Review of Financial Studies、Review of Finance、《审计研究》案例(部分案例会替换数据集进行方法复刻)
3. 课程大纲
第一讲:大语言模型导论
1、大模型在会计金融研究的应用
2、大模型在经济学研究的应用
3、大模型在管理学研究的应用
4、大模型在社会科学研究的应用
5、大模型能力初窥:借助大模型寻找工具变量
参考文献:
Han, S., 2024, Mining Causality: AI-Assisted Search for Instrumental Variables.
第二讲:大语言模型技术简介与文本挖掘实操
1、大模型原理简介:
a)计算速度和记忆能力;注意力机制的引入;编码器和解码器的结构;Transformer的基本原理和结构
BERT模型
b)BERT的原理简介
c)实战案例:基于央行货币政策报告的情感分析
参考文献:
Jha, Manish, Hongyi Liu, and Asaf Manela. "Does finance benefit society? A language embedding approach." The Review of Financial Studies (2025): hhaf012.
2、SBERT模型:
a)SBERT与BERT的区别
b)实战案例:基于专利文本相似度的指标构建
参考文献:
黄先海,孙涌铭,陈梦涛.企业数字化转型与颠覆性技术创新——来自专利网络与SBERT模型的微观证据[J].中国工业经济,2024,(10):137-154.
3、ERNIE模型
a)ERNIE模型的优势与潜力
b)实战案例:基于上市公司年报的人工智能指标构建
参考文献:
金星晔,左从江,方明月,等.企业数字化转型的测度难题:基于大语言模型的新方法与新发现[J].经济研究,2024,59(03):34-53.
4、GPT模型
a)GPT模型简介与价值分析
b)实战案例:利用GPT模型从MD&A文本中提取关键变量
参考文献:
Jiayin Hu, Laura Xiaolei Liu, Chloe Yue Liu, Hao Qu, Yingguang Zhang, CEO turnover, sequential disclosure, and stock returns, Review of Finance, 2025;,rfaf015.
5、多模型协作完成复杂任务:
a)Fin BERT简介
b)如何正确选择不同模型的应用场景
c)实战案例:基于Fin BERT 和DeepSeek模型分析MD&A特定信息与数据标注任务
参考文献:
陆瑶,施函青,周欣怡.中国企业数字技术风险暴露对企业价值的影响——来自大语言模型的文本分析证据[J].经济研究,2025,60(02):73-89.
第三讲:大模型与关系抽取实操
1、基于大模型的因果关系提炼
a)大模型在探索因果关系与构建知识图谱的潜力
b)实战案例:基于GPT模型对中国核心经管期刊中因果主张的初步挖掘与知识表示(含《管理世界》《经济研究》《管理科学学报》《金融研究》《会计研究》《世界经济》)
参考文献:
Garg, P and T Fetzer (2025), “Causal Claims in Economics”, arXiv preprint arXiv:2501.06873.
2、基于大模型的复杂网络识别方法
a)大模型与网络分析应用前瞻
b)实战案例:LLM结合进化算法分析上市公司董事网络关键节点
参考文献:
Mao, Jinzhu, et al. "Identify critical nodes in complex network with large language models." arXiv preprint arXiv:2403.03962 (2024).
第四讲:大模型科研应用前瞻
1、利用开源的Embedding模型实现更高性能的文本向量化
a)大模型的Embedding模型相比传统向量化方法有何优势?
b)实战案例:专利相似度计算
2、利用RAG技术从长文本中获取精确指标
a)什么是RAG技术?为什么需要RAG技术?
b)实战案例:基于“提示工程+检索增强生成+超参数调整”的法律大模型构建框架
参考文献:
陈亚盛,蒋礼蔚,单敏,等.审计大模型的构建及应用研究——以员工违规经商办企业专项审计为例[J].审计研究,2024,(04):139-149.
4. 课程报名
课程价格
早鸟价:(6.10前支付)999元;
拼团价:(6.10-开课前支付)1399元;
可按照实际支付金额开具电子发票
价格包含:直播课程+录播回放+课程资料+课程答疑(仅开课前支付能进答疑群)
报名渠道
扫码报名
如有以下优惠,购买前找“学知老师”领取优惠券。
优惠一
普通用户转发本推文到朋友圈/皮皮侠数据会员,私聊学知老师可获八折优惠券。优惠二
尊享版课程会员可在直播结束后免费学习此录播课程;如需直播+答疑,尊享版课程会员可三折购买直播课;1/3/5年期课程会员可四折购买直播课。扫码购买超级课程会员
5. 课程售后
课程发票/课程通知
联系“学知老师”(扫码添加)可领取课程开课通知、结课证书等证明;可咨询发票相关问题。
课程退款
在课程未开始前,接受“7天无理由退款”,由于是知识付费,一旦直播课开始后,不接受退款。退款请联系“学知老师”。


