导言
本课程旨在为经管社科领域的科研人员(包括硕博生、青年教师及资深研究者)提供一个全面而实用的前沿方法思路及编程体系,帮助理解并运用大语言模型(LLMs)和Python工具进行前沿学术研究。
课程将从LLMs的基本原理入手,逐步深入到高级技术和实际研究场景应用,涵盖文本挖掘、关系抽取、知识图谱构建等。我们将特别关注LLMs如何助力研究者处理和分析大规模非结构化大数据(如公司报告、财经新闻、政策文件、学术文献、关系数据等),从中提取洞见,并探索新的研究范式。
课程强调理论与实践相结合,通过《经济研究》《中国工业经济》、Review of Financial Studies、Review of Finance、《审计研究》5个TOP刊案例,以及4个前瞻性思考案例,使学员掌握将LLM应用于自身高水平研究工作的能力。
1. 课程概览
课程名称:大语言模型与顶刊前沿Python实操
课程老师:Simon博士
课程时间:2025年7月5日-7月6日 上午10:00-12:00,下午15:00-17:00(可能视情况加时)
课程特色:
(1)学术聚焦:目前国内外经管顶刊大模型方法全部总结,同时有前瞻性启发性探讨
(2)授人以渔:顶刊应用综述→大模型原理→顶刊文本挖掘应用→因果关系、网络、知识图谱等前瞻应用
(3)TOP刊方法复刻:《经济研究》《中国工业经济》、Review of Financial Studies、Review of Finance、《审计研究》案例(部分案例会替换数据集进行方法复刻)
3. 课程大纲
第一讲:大语言模型导论
1、大模型在会计金融研究的应用
2、大模型在经济学研究的应用
3、大模型在管理学研究的应用
4、大模型在社会科学研究的应用
5、大模型能力初窥:借助大模型寻找工具变量
参考文献:
Han, S., 2024, Mining Causality: AI-Assisted Search for Instrumental Variables.
第二讲:大语言模型技术简介与文本挖掘实操
1、大模型原理简介:
a)计算速度和记忆能力;注意力机制的引入;编码器和解码器的结构;Transformer的基本原理和结构
BERT模型
b)BERT的原理简介
c)实战案例:基于央行货币政策报告的情感分析
参考文献:
Jha, Manish, Hongyi Liu, and Asaf Manela. "Does finance benefit society? A language embedding approach." The Review of Financial Studies (2025): hhaf012.
2、SBERT模型:
a)SBERT与BERT的区别
b)实战案例:基于专利文本相似度的指标构建
参考文献:
黄先海,孙涌铭,陈梦涛.企业数字化转型与颠覆性技术创新——来自专利网络与SBERT模型的微观证据[J].中国工业经济,2024,(10):137-154.
3、ERNIE模型
a)ERNIE模型的优势与潜力
b)实战案例:基于上市公司年报的人工智能指标构建
参考文献:
金星晔,左从江,方明月,等.企业数字化转型的测度难题:基于大语言模型的新方法与新发现[J].经济研究,2024,59(03):34-53.
4、GPT模型
a)GPT模型简介与价值分析
b)实战案例:利用GPT模型从MD&A文本中提取关键变量
参考文献:
Jiayin Hu, Laura Xiaolei Liu, Chloe Yue Liu, Hao Qu, Yingguang Zhang, CEO turnover, sequential disclosure, and stock returns, Review of Finance, 2025;,rfaf015.
5、多模型协作完成复杂任务:
a)Fin BERT简介
b)如何正确选择不同模型的应用场景
c)实战案例:基于Fin BERT 和DeepSeek模型分析MD&A特定信息与数据标注任务
参考文献:
陆瑶,施函青,周欣怡.中国企业数字技术风险暴露对企业价值的影响——来自大语言模型的文本分析证据[J].经济研究,2025,60(02):73-89.
第三讲:大模型与关系抽取实操
1、基于大模型的因果关系提炼
a)大模型在探索因果关系与构建知识图谱的潜力
b)实战案例:基于GPT模型对中国核心经管期刊中因果主张的初步挖掘与知识表示(含《管理世界》《经济研究》《管理科学学报》《金融研究》《会计研究》《世界经济》)
参考文献:
Garg, P and T Fetzer (2025), “Causal Claims in Economics”, arXiv preprint arXiv:2501.06873.
2、基于大模型的复杂网络识别方法
a)大模型与网络分析应用前瞻
b)实战案例:LLM结合进化算法分析上市公司董事网络关键节点
参考文献:
Mao, Jinzhu, et al. "Identify critical nodes in complex network with large language models." arXiv preprint arXiv:2403.03962 (2024).
第四讲:大模型科研应用前瞻
1、利用开源的Embedding模型实现更高性能的文本向量化
a)大模型的Embedding模型相比传统向量化方法有何优势?
b)实战案例:专利相似度计算
2、利用RAG技术从长文本中获取精确指标
a)什么是RAG技术?为什么需要RAG技术?
b)实战案例:基于“提示工程+检索增强生成+超参数调整”的法律大模型构建框架
参考文献:
陈亚盛,蒋礼蔚,单敏,等.审计大模型的构建及应用研究——以员工违规经商办企业专项审计为例[J].审计研究,2024,(04):139-149.
4. 课程报名
课程价格
优惠价:(6.10-开课前支付)1399元;
原价1999元
可按照实际支付金额开具电子发票
价格包含:直播课程+录播回放+课程资料+课程答疑(仅开课前支付能进答疑群)
报名渠道
扫码报名
如有以下优惠,购买前找“学知老师”领取优惠券。
优惠一
优惠二
扫码购买超级课程会员
5. 课程售后
课程发票/课程通知
联系“学知老师”(扫码添加)可领取课程开课通知、结课证书等证明;可咨询发票相关问题。
课程退款
在课程未开始前,接受“7天无理由退款”,由于是知识付费,一旦直播课开始后,不接受退款。退款请联系“学知老师”。

