

社会科学实证数据处理宝典

数据皮皮侠

2022-06-25

导读：►►►课程简介Python数据处理随着大数据时代的到来，非结构化、高频、多源、多模态数据已经成为社科实证数据

►►►

课程简介

Python数据处理

随着大数据时代的到来，非结构化、高频、多源、多模态数据已经成为社科实证数据的趋势，国内外顶刊发表的论文指标来源日渐丰富，掌握高效的数据处理方法，是研究者必备的基础技能，为解决研究者在处理数据时常遇到的问题及更好的匹配优质期刊的要求，特开发本课程：

1.1课程目标：掌握Python语法、利用Python构建各类实证指标、数据采集的基础知识点和数据处理思路

1.2 适合对象：适合Python 0基础以及期望数据进阶的硕博学生及高校研究者以及从事数据分析相关人士。

1.3 课程特点：

易理解：以社科学术实证需求为导向，知识点力求通俗易懂，10个案例场景和实战讲解。

可复制：提供可重复使用的代码块和案例数据（案例中各类上市公司数据、百度指数数据），利用代码进行调整即可满足大部分科研需求。

长期回放：采取腾讯会议直播形式，录播会上线“皮皮侠学院”供学员查看（至少2月，理论上是不限时回放）

全程答疑：老师会对学员课程相关的问题进行答疑。

►►►

课程内容

模块一：Python基础

01.环境配置与Anaconda Markdown语法

02.Python语言：语法、注解、保留字、变量

03.数据类型——数字&字符串（变量类型设置）

04.数据类型——布尔值&运算符

05.数据类型——数组（列表、元组、集合、字典）

06.条件语句(if else)

07.循环语句和异常处理（for & while & try except）

08.强大的匿名函数lambda 函数

09.迭代计算-列表推导式

10.Python数据科学：包、模块、类、函数

11.Python标准库re模块（正则表达式库）

12.Python标准库os模块（效率神器）

13.Python标准库csv模块

14.Case1 上市公司文本信息数据指标清洗

15.Case2 处理海量不同格式文件

模块二：多源数据采集

01.网页信息访问

02.网页数据解析

03.Case1 表格信息：获取A股上市公司财务信息

04.Case2 文本信息：淘宝商品（口红）信息

05.Case3 多媒体数据：上市公司定期报告PDF

06.Case4 综合处理：省市公众环境注意力指数2011-2022（百度指数）

模块三：面板数据构建

01.Pandas、Numpy介绍

02.重复值、缺失值、“0”值、异常值处理

03.数据表记录(行)与字段(列)处理

04.多重索引、排序、重置数据（stack、melt）

05.分组计算（groupby、transform）

06.计量常用统计量（分组均值、移动平均值、方差、标准差）

07.表格批操作（apply、agg）

08.数据透视表（pivot_table）

09.表格文本数据处理、匹配（extractal）

10.数据拼接、合并（匹配）

11.时间序列处理

12.Case1 A股上市公司年龄、距离等指标构建

13.Case2 上市公司高管团队异质性指标构建

14.Case3 高铁开通标准面板数据构建

15.Case4 城市宏观数据匹配上市公司微观数据

16.Case5 全球各国2002-2020年贸易竞争力指数构建

►►►

课程组织

课程时间

直播课程时间定于7月16日-7月17日

课程费用

6.21-6.30购买：299元

7.1之后购买：499元

会员购买可享受八折优惠（非会员转发本推送到朋友圈2小时可8折优惠），购买前请找客服获取优惠码

扫码购买课程

售后服务

在课程未开始前，接受“7天无理由退款”，由于是知识付费，一旦课程开始，不接受退款。

可按照实际支付金额开具发票，明目“技术咨询费”、“教育咨询费”等。同时接受高校客户集体报名。

答疑群

购买后请添加微信号（ppman008）邀请您进入课程答疑群，关于项目与报名如有问题，也请咨询ppman008。

【声明】内容源于网络

数据皮皮侠

社科数据综合服务中心，立志服务百千万社科学者

内容 2137

粉丝 0

数据皮皮侠社科数据综合服务中心，立志服务百千万社科学者

总阅读615

粉丝0

内容2.1k