····
····
····
经管文本分析与实证研究
····
····
····
一、Python基础 (3小时)
01、Python语言:语法、注解、保留字、变量
02、数据类型——数字&字符串(变量类型设置)
03、数据类型——数组(列表、元组、集合、字典)
04、条件语句、循环语句和异常处理
05、强大的匿名函数lambda 函数
06、高效迭代-推导式
07、Python数据科学:包、模块、类、函数
08、Pandas、Numpy介绍
09、重复值、缺失值、“0”值、异常值处理
10、数据表记录(行)与字段(列)处理
11、多重索引、排序、重置数据(stack、melt)
12、分组计算(groupby、transform)
13、计量常用统计量(分组均值、移动平均值、方差、标准差)
14、表格批操作(apply)
15、表格文本数据处理、匹配(extractal)
16、数据拼接、合并(匹配)
二、文本数据获取(3小时)
1、Python爬虫基础概要
3、深交所上市公司报告爬取
4、证监会官网公开报告爬取
5、上市公司企业社会责任报告爬取
6、PDF文本解析、图片识别文字
7、大量Word/txt文件自动化生成Excel面板数据
三、文本数据处理(3小时)
1、中文英文分词及词频统计原理及Python案例
Case1:基于Excel文件计算上市公司年报MD&A数字化词频2010-2020
2、主题抽取原理及Python案例
Case2:基于简历大数据提取实证指标
3、句频统计原理及Python案例
Case3:多个关键词共现句子识别统计(基于政府工作报告)
4、文本相似性原理及Python案例
Case4:上市公司年报相似度
5、文本情绪分析原理及Python案例
Case5:上市公司年报文本语调
6、词嵌入模型原理及Python案例
Case6:基于上市公司年报构建经管实证指标
四、文本分析+Stata实证(3小时)
1、文本分析经管实证应用概述
2、Stata实证简要介绍
3、文本分析实证论文复刻(Python+Stata):
复刻1:胡楠, 薛付婧, 王昊楠. 管理者短视主义影响企业长期投资吗?——基于文本分析和机器学习[J]. 管理世界, 2021, 37(5):18.
复刻2:聂兴凯,王稳华,裴璇.企业数字化转型会影响会计信息可比性吗.[J]会计研究.会计研究. 2022(05)
03
课程组织
3.1课程时间
2023年07月29-30日,课程分4个半天,2.5小时讲解+0.5小时答疑。直播完即上传录播“PPdata Academy”供长期回放(至少4月)
3.2 课程老师
邓浩然,上海财经大学博士,浙江财经大学老师,论文发表在《财经研究》、《管理工程学报》、《经济管理》等CSSCI期刊,B站17万粉up主
3.3 课程缴费
(1)课程价格
按照链接价格为准,可按照实际支付金额开具电子发票。越早购买越划算,并有如下优惠,购买前找“神奇女侠”领取优惠码。
优惠一:会员/老学员优惠(只能选择一个)
——数据皮皮侠数据会员(购买地址http://www.ppmandata.cn/)直接享受8折
——之前购买过课程的老学员,直接8折
优惠二:集赞优惠,转发本推送到朋友圈2小时(不屏蔽)积赞20;或转发到100人以上年级群,并留言“很棒的文本分析课程”,享受8折优惠,可与优惠一叠加。
优惠三:实证会员尊享四折
PPdata实证SVIP享受4折购课价!!!(不与其他优惠叠加)
(2)扫码支付
为提高学术交流效率,本次课程采取实名制报名,购买后需要给客服提供单位+姓名+校园卡/员工卡信息。

3.4 课程售后
(1)课程发票:联系“PPdata财务”(扫码添加)开具,可开具明目为“技术咨询费”、“教育咨询费”、“会议费”等。

(2)课程通知:开课前会提供加盖公章的课程通知扫描件,若有需要特殊模板,请联系“神奇女侠”(微信号ppman008)提供电子版文件进行开具。
(3)课程答疑:本课程购买后请添加“神奇女侠”(微信号ppman008),提供单位,姓名,校园卡/员工卡等身份证明后邀请您进入课程答疑群。关于项目与报名如有问题,也请咨询ppman008。
(4)课程退款:在课程未开始前,接受“7天无理由退款”,由于是知识付费,一旦直播课开始后,不接受退款。退款请联系“神奇女侠”(微信号ppman008)。


