大数跨境
0
0

从Python入门到数据采集再到数据挖掘你真的会吗?

从Python入门到数据采集再到数据挖掘你真的会吗? 数据皮皮侠
2023-05-25
0
导读:实证研究已经是社科研究的大趋势,高质量期刊也愈发青睐具有多样化数据来源的研究文章,能够结合多种数据库实现宏观
实证研究已经是社科研究的大趋势,高质量期刊也愈发青睐具有多样化数据来源的研究文章,能够结合多种数据库实现宏观、微观数据指标的匹配,成为社科实证研究者一种不可或缺的基础能力。为方便研究者从Python入门到数据采集再到数据挖掘一路顺利,皮皮侠特组合四门课程,一一条龙解决论文中数据采集、清洗、分析的问题!

“Python入门-数据采集-数据挖掘合集”组合课程包含有《经管Python实证编程》、《经管实证数据匹配技巧案例课》、《平台经济与公司金融数据采集》、《Python量化金融分析》共四门课程,价值1696元,现限时返场,拼团仅需499元,仅限前50名,若转发本推送到朋友圈并积攒30可获得8折优惠。



课程购买


1、扫码付款


2、课程退款

由于是知识付费,一旦开通,不接受退款,购买前请仔细咨询客服(微信号ppman008)。



内容介绍


一、《经管Python实证编程》课程内容

一、Python基础

01、环境配置与Anaconda Markdown语法

02、Python语言:语法、注解、保留字、变量

03、数据类型——数字&字符串(变量类型设置)

04、数据类型——布尔值&运算符

05、数据类型——数组(列表、元组、集合、字典)

06、条件语句(if else)

07、循环语句和异常处理(for & while & try except)

08、强大的匿名函数lambda 函数

09、高效迭代-推导式

10、Python数据科学:包、模块、类、函数

11、Python标准库re模块(正则表达式库)

12、Python标准库os模块(效率神器)

13、Python标准库csv模块

14、Case1 上市公司文本信息数据指标清洗

15、Case2 处理海量不同格式文件


二、面板数据构建

01、Pandas、Numpy介绍

02、重复值、缺失值、“0”值、异常值处理

03、数据表记录(行)与字段(列)处理

04、多重索引、排序、重置数据(stack、melt)

05、分组计算(groupby、transform)

06、计量常用统计量(分组均值、移动平均值、方差、标准差)

07、表格批操作(apply、agg)

08、数据透视表(pivot_table)

09、表格文本数据处理、匹配(extractal)

10、数据拼接、合并(匹配)

11、时间序列处理

12、Case1 A股上市公司年龄、距离等指标构建

13、Case2 上市公司高管团队异质性指标构建

14、Case3 高铁开通标准面板数据构建

15、Case4 城市宏观数据匹配上市公司微观数据

16、Case5 全球各国2002-2020年贸易竞争力指数构建


二、《经管实证数据匹配技巧案例课》课程内容

模块一:匹配原理 0.5小时

1、Python匹配原理机制

pd.merge等操作


模块二:实战案例 2小时

1、公司名称中英文对照匹配

根据已知的公司名称中英文对照表,与符合条件的公司中英文名称匹配

2、中国边境地区进出口额匹配

根据中国边境地区名称和各地区进出口额,匹配得到中国边境地区进出口额

3、上市公司高管信息匹配

根据两个数据库中的公司高管信息,匹配得到上市公司高管信息

4、各国双边商品贸易额匹配

根据各国的进出口贸易额与所需国家信息,匹配得到所需国家的进出口额

5、宏微观数据匹配

上市公司基础数据匹配,再与城市高铁开通数据匹配


三、《平台经济与公司金融数据采集》课程内容

模块一:爬虫原理 6小时

01.爬虫基础知识

- 请求库(request)

- 解析库(xpath、lxml、scrapy.Selector)抓包工具(fiddler)

- Selenium

- App抓包辅助工具模拟器

02.回溯增量爬取、定期更新数据方法

Case1:视频平台数据(B站弹幕为例)

Case2:京东商城运营数据

Case3:好大夫医院运营数据

Case4:百度地图POI数据

Case5:高德地图人口迁徙日度数据

Case6:中国环境监测总站空气质量发布软件


模块二:典型案例 6小时

Case1:知网期刊论文信息

论文题名、论文作者、期刊来源、发表时间、被引量、下载量、论文PDF下载链接

网址:https://www.cnki.net/

Case2:国家企业信用信息公示系统公司工商信息

公司名称、公司类型、公司地址、经营状态、开始日期、批准时间、行业类别、城市、省份、经度、纬度

网址:https://www.gsxt.gov.cn/index.html

Case3:巨潮资讯网上市公司报告

以上市公司社会责任报告为例,可以获取任何报告

网址:http://www.cninfo.com.cn/new/index

Case4:百度搜索日度指数构建公众关注度数据

以各省上市公司名称搜索量为例,可以通过百度指数构建任何关注度指标

网址:https://index.baidu.com/v2/index.html

Case5:农批数据/新农村商网

该案例是爬虫微信端口一个事实记录新农商网的农村品价格数据,可以实时获取全样本农产品的价格数据。

网址:https://nc.mofcom.gov.cn/

Case6:船讯网

该案例是通过动态爬虫技术获取全球所有船只的航行轨迹数据。

网址:http://www.shipxy.com/


四、《Python量化金融分析》课程内容

模块一、金融分析Python基础

1.经济金融数据分析概述(PPT 介绍)

2.信贷数据的计算与分析案例(Python 代码示例)

1)数据处理与读写 pandas

2)数据计算与分析 numpy

3)数据展示与报告 matplotlib

3.经济金融数据分析工具简介(Python 代码示例,并练习)

1)科学计算库 numpy

2)数据分析工具 pandas

3)其他工具介绍

4.基金策略净值评价指标的python实现案例:

1)收益类指标:年化收益、近6个月年化收益率、盈利百分比、月度胜率等;

2)风险类指标:最大回撤比率、收益率波动率、最低月回报、最长连续下跌月数、VaR、CVaR等;

3)收益-风险比指标:卡玛比率、夏普比率、索提诺比率等


模块二、Python建模实现量化资产轮动配置

1.参数检验与相关性分析(Python 代码示例)

1)T检验、卡方检验

2)方差分析、相关分析

3)线性回归、多元线性回归、格兰杰因果检验

2.Python实现wind数据读取、存储

1)Wind窗口可视化读取;

2)Python从wind接口读取数据;

3)python与mysql接口:查询、插入、删除等;

3)接口数据存入本地mysql数据库;

3.案例一:基于“因果检验”的行业轮动策略研究

4.案例二:基于“多元线性回归”的资产配置策略研究


模块三、Python建模实现股票价格预测分析

1.金融时间序列分析(Python代码示例)

1)自回归(AR)模型

2)滑动平均(MA)模型

3)自回归滑动平均(ARMA)模型

4)自回归差分滑动平均(ARIMA)模型

5)相似体合成算法(AC)

6)案例:股票价格形态与股票价格预测分析

2.基于机器学习的金融股票预测

1)Xgboost股票走势预测

2)神经网络股票走势预测

模块四、Python实现量化多因子选股

1.Fama-French三因子模型

2.Fama-French五因子模型

3.多因子选股框架介绍

4.米矿Python数据接RQData金融数据API

5.米矿因子投研工具RQFactor

6.Python开源多因子接口alphalens使用方法简介

7.案例:基于Barra多因子选股模型实证研究

【声明】内容源于网络
0
0
数据皮皮侠
社科数据综合服务中心,立志服务百千万社科学者
内容 2137
粉丝 0
数据皮皮侠 社科数据综合服务中心,立志服务百千万社科学者
总阅读16
粉丝0
内容2.1k