大数跨境
0
0

经管文本分析与实证研究

经管文本分析与实证研究 数据皮皮侠
2023-07-24
1
导读:随着大数据技术的日益成熟, 社交网络类文本 、上市公司披露类文本、媒体报道类文本、 其他类文本 、网络搜索数据、P2P 网络借贷文本与分析师报告等文本数据逐渐成为经管领域的研究素材

····

····

····

经管文本分析与实证研究

····

····

····


01

课程概述

随着大数据技术的日益成熟, 社交网络类文本 、上市公司披露类文本、媒体报道类文本、 其他类文本 、网络搜索数据、P2P 网络借贷文本与分析师报告等文本数据逐渐成为经管领域的研究素材。国内外顶刊基于文本构建变量,进行实证研究的范式逐渐成熟和火热。

除了文本本身的特征、信息品质、信息披露、信息含量,其特定信息也有利于新指标新变量的刻画,如数字化转型、企业文化、企业社会责任、风险、知识、经济政策不确定性、战略短视……


因此我们专门设计了从文本数据获取到指标构建、实证研究为一体的课程:


课程对象:经管本硕博学生、教师及其他社会科学研究者


基础条件:具备使用Stata做实证研究的基础,不具备Python基础


课程目标:掌握使用Python采集、处理文本数据的方法,能够从文本数据中提取实证指标,讲故事,进行实证研究,以发表较高水平期刊论文


课程特点:原理+操作+科研案例/论文复刻


长期回放:腾讯会议直播,录播上线“PPdata Academy”供长期查看(至少4月)


02

课程内容

一、Python基础 (3小时)

01、Python语言:语法、注解、保留字、变量

02、数据类型——数字&字符串(变量类型设置)

03、数据类型——数组(列表、元组、集合、字典)

04、条件语句、循环语句和异常处理

05、强大的匿名函数lambda 函数

06、高效迭代-推导式

07、Python数据科学:包、模块、类、函数

08、Pandas、Numpy介绍

09、重复值、缺失值、“0”值、异常值处理

10、数据表记录(行)与字段(列)处理

11、多重索引、排序、重置数据(stack、melt)

12、分组计算(groupby、transform)

13、计量常用统计量(分组均值、移动平均值、方差、标准差)

14、表格批操作(apply)

15、表格文本数据处理、匹配(extractal)

16、数据拼接、合并(匹配)


二、文本数据获取(3小时)

1、Python爬虫基础概要

3、深交所上市公司报告爬取

4、证监会官网公开报告爬取

5、上市公司企业社会责任报告爬取

6、PDF文本解析、图片识别文字

7、大量Word/txt文件自动化生成Excel面板数据


三、文本数据处理(3小时)

1、中文英文分词及词频统计原理及Python案例

Case1:基于Excel文件计算上市公司年报MD&A数字化词频2010-2020

2、主题抽取原理及Python案例

Case2:基于简历大数据提取实证指标

3、句频统计原理及Python案例

Case3:多个关键词共现句子识别统计(基于政府工作报告)

4、文本相似性原理及Python案例

Case4:上市公司年报相似度

5、文本情绪分析原理及Python案例

Case5:上市公司年报文本语调

6、词嵌入模型原理及Python案例

Case6:基于上市公司年报构建经管实证指标


四、文本分析+Stata实证(3小时)

1、文本分析经管实证应用概述

2、Stata实证简要介绍

3、文本分析实证论文复刻(Python+Stata):

复刻1:胡楠, 薛付婧, 王昊楠. 管理者短视主义影响企业长期投资吗?——基于文本分析和机器学习[J]. 管理世界, 2021, 37(5):18.

复刻2:聂兴凯,王稳华,裴璇.企业数字化转型会影响会计信息可比性吗.[J]会计研究.会计研究. 2022(05)


03

课程组织

3.1课程时间

2023年07月29-30日,课程分4个半天,2.5小时讲解+0.5小时答疑。直播完即上传录播“PPdata Academy”供长期回放(至少4月)


3.2 课程老师

邓浩然,上海财经大学博士,浙江财经大学老师,论文发表在《财经研究》、《管理工程学报》、《经济管理》等CSSCI期刊,B站17万粉up主


3.3 课程缴费

(1)课程价格

按照链接价格为准,可按照实际支付金额开具电子发票。越早购买越划算,并有如下优惠,购买前找“神奇女侠”领取优惠码。

优惠一:会员/老学员优惠(只能选择一个)

——数据皮皮侠数据会员(购买地址http://www.ppmandata.cn/)直接享受8折

——之前购买过课程的老学员,直接8折


优惠二:集赞优惠,转发本推送到朋友圈2小时(不屏蔽)积赞20;或转发到100人以上年级群,并留言“很棒的文本分析课程”,享受8优惠,可与优惠一叠加。


优惠三:实证会员尊享四折

PPdata实证SVIP享受4折购课价!!!(不与其他优惠叠加)


(2)扫码支付

为提高学术交流效率,本次课程采取实名制报名,购买后需要给客服提供单位+姓名+校园卡/员工卡信息。


3.4 课程售后

(1)课程发票:联系“PPdata财务”(扫码添加)开具,可开具明目为“技术咨询费”、“教育咨询费”、“会议费”等。


(2)课程通知:开课前会提供加盖公章的课程通知扫描件,若有需要特殊模板,请联系“神奇女侠”(微信号ppman008)提供电子版文件进行开具。


(3)课程答疑:本课程购买后请添加“神奇女侠”(微信号ppman008),提供单位,姓名,校园卡/员工卡等身份证明后邀请您进入课程答疑群。关于项目与报名如有问题,也请咨询ppman008。


(4)课程退款:在课程未开始前,接受“7天无理由退款”,由于是知识付费,一旦直播课开始后,不接受退款。退款请联系“神奇女侠”(微信号ppman008)。

【声明】内容源于网络
0
0
数据皮皮侠
社科数据综合服务中心,立志服务百千万社科学者
内容 2137
粉丝 0
数据皮皮侠 社科数据综合服务中心,立志服务百千万社科学者
总阅读16
粉丝0
内容2.1k