本文作者:钱晓阳,中南财经政法大学统计与数学学院
本文编辑:周一鸣
技术总编:王玉婷
Stata and Python 数据分析
如今,机器学习方法在我们生活中的应用越来越广泛,例如常见的人脸识别、AI换脸、语音识别、购物APP的推荐产品以及汽车自动辅助驾驶等都受益于机器学习方法的发展。机器学习在提高效率、节省成本、提高预测准确度、个性化服务等方面都有不错的效果,随着研究的不断深入,机器学习方法的广度得到了极大的提升。今天我们就来简单聊聊常见的机器学习方法。
机器学习方法的分类方式很多,按照学习方式可以把机器学习方法大致分为监督学习、无监督学习、半监督学习和强化学习。
通俗来讲,监督学习就是让机器对大量带有标记的样本数据进行学习,从而得到训练模型,使得该模型能根据输入得到对应的输出信息。监督学习按其解决的问题总体上可以分为回归和分类两类。

生成对抗网络包含两部分:生成器(Generator)和判别器(Discriminator)。生成器可以生成数据,其目的是骗过判别器,让判别器无法判断是真实数据还是生成数据,而判别器用来判断数据是真实的还是生成的,目的是找出生成器生成的假数据。经过不断的循环,就能得到效果很好的生成器和判别器,可以用来满足我们的需要。生成对抗网络在图像方面的应用十分广泛。目前比较有代表性的算法有条件生成对抗网络(CGAN)、深度卷积生成对抗网络(DCGAN)、BigGAN等。
以上就是对机器学习方法的总结,但限于篇幅上述方法的原理并未涉及。最后,笔者为大家提供了最全面的机器学习思维导图,感兴趣的读者可以在后台回复 机器学习 来获得.xmind文件,并根据该思维导图查漏补缺,深入学习这些方法背后的思想。当然,机器学习发展很快,大家也可以通过阅读最新的论文来了解机器学习的前沿方法。在这里推荐一个网站:papers with code,上面总结了机器学习论文及其代码实现形式,大家可以根据需要来进行学习。

重磅福利!为了更好地服务各位同学的研究,爬虫俱乐部将在小鹅通平台上持续提供金融研究所需要的各类指标,包括上市公司十大股东、股价崩盘、投资效率、融资约束、企业避税、分析师跟踪、净资产收益率、资产回报率、国际四大审计、托宾Q值、第一大股东持股比例、账面市值比、沪深A股上市公司研究常用控制变量等一系列深加工数据,基于各交易所信息披露的数据利用Stata在实现数据实时更新的同时还将不断上线更多的数据指标。我们以最前沿的数据处理技术、最好的服务质量、最大的诚意望能助力大家的研究工作!相关数据链接,请大家访问:(https://appbqiqpzi66527.h5.xiaoeknow.com/homepage/10)或扫描二维码:
最后,我们为大家揭秘雪球网(https://xueqiu.com/)最新所展示的沪深证券和港股关注人数增长Top10。


对我们的推文累计打赏超过1000元,我们即可给您开具发票,发票类别为“咨询费”。用心做事,不负您的支持!
用`fs`命令批量获取文件夹和不同文件夹下的excel文件
自然语言处理之实例应用JSON帮手,FeHelper
最新、最热门的命令这里都有!
Stata绘制条形图的进阶用法
Stata绘制饼形图的进阶用法
Stata绘图系列——条形图绘制
“挂羊头卖狗肉”?
微信公众号“Stata and Python数据分析”分享实用的Stata、Python等软件的数据处理知识,欢迎转载、打赏。我们是由李春涛教授领导下的研究生及本科生组成的大数据处理和分析团队。
武汉字符串数据科技有限公司一直为广大用户提供数据采集和分析的服务工作,如果您有这方面的需求,请发邮件到statatraining@163.com,或者直接联系我们的数据中台总工程司海涛先生,电话:18203668525,wechat: super4ht。海涛先生曾长期在香港大学从事研究工作,现为知名985大学的博士生,爬虫俱乐部网络爬虫技术和正则表达式的课程负责人。
此外,欢迎大家踊跃投稿,介绍一些关于Stata和Python的数据处理和分析技巧。

