大数跨境
0
0

变量和标签的故事

变量和标签的故事 Stata and Python数据分析
2018-06-28
2
导读:我有故事,你要听吗?


暑期Stata培训班招生啦!!!接力线上的网课培训,我们在今夏又开始新一轮的线下培训啦!8月4日至12日,爬虫俱乐部期待与您的相遇!培训具体内容详见推文暑期Stata编程技术定制培训班


有问题,不要怕!点击推文底部“阅读原文”下载爬虫俱乐部用户问题登记表并按要求填写后发送至邮箱statatraining@163.com,我们会及时为您解答哟~

喜大普奔~爬虫俱乐部的github主站正式上线了!我们的网站地址是:https://stata-club.github.io,粉丝们可以通过该网站访问过去的推文哟~

好消息:爬虫俱乐部隆重推出数据定制及处理业务啦,您有任何网页数据获取及处理方面的难题,请发邮件至我们邮箱statatraining@163.com,届时会有俱乐部资深高级会员为您排忧解难!

在数据处理中,我们经常会遇到将字符型的分类变量转化为数值型变量的问题,并且将原来的值定义为对应的标签值。

在往期推文《数据类型转换之字符型-数值型》《论egen的花样用法(三)》,我们分别介绍的encode命令和egen命令与group搭配使用时均可以实现这样的功能哦~

以数据集hbp2举例如下,该数据中变量sex为字符型的分类变量。

webuse hbp2,clear
encode sex,generate(gender)
br sex gender in 1/5

结果如下:

当我们不输出变量的标签值时,可以执行如下命令语句:

br sex gender in 1/5, nolabel

可以发现,新生成变量gender是对应的数值。

同样,我们用egen命令与group搭配,看一看能否达到同样的效果呢?

webuse hbp2,clear
egen gender = group(sex), label
br sex gender in 1/5

br sex gender in 1/5, nolabel

我们同样达到了想要的效果。

另外,我们还会遇到将一个变量的观测值定义为另一变量的标签值的问题,那该如何解决呢?这里可以用到一个外部命令labmask(执行命令findit labutil下载labutil命令即可),我们以国泰安上一个关于公司审计意见的数据集为例进行介绍,样本数据如下所示:

我们想让变量证券简称变为证券代码的标签,就可以执行如下命令语句:

labmask 证券代码, values(证券简称)

得到结果:

可以看到,我们将证券简称定义成了证券代码的值标签。

温馨小贴士

我们发现,在最开始介绍的分类字符变量转化为数值型变量时,被转化后变量的分类序号是默认的,而如果我们想要自由定义这个分类序号,就可以参照后面介绍的方法,先生成一个新变量,用来表示变量的序号,然后将原来的变量定义为该新变量的标签。感兴趣的读者,可以先自行尝试,我们在下期推文会详细介绍哦~

注:此推文中的图片及封面(除操作部分的)均来源于网络!如有雷同,纯属巧合!

以上就是今天给大家分享的内容了,说得好就赏个铜板呗!有钱的捧个钱场,有人的捧个人场~。另外,我们开通了苹果手机打赏通道,只要扫描下方的二维码,就可以打赏啦!

应广大粉丝要求,爬虫俱乐部的推文公众号打赏功能可以开发票啦,累计打赏超过1000元我们即可给您开具发票,发票类别为“咨询费”。用心做事,只为做您更贴心的小爬虫。第一批发票已经寄到各位小主的手中,大家快来给小爬虫打赏呀~

文字编辑:王凯丽

技术总编:刘贝贝

往期推文推荐:

1.爬虫俱乐部新版块--和我们一起学习Python

2.hello,MySQL--Stata连接MySQL数据库

3.hello,MySQL--odbcload读取MySQL数据

4.再爬俱乐部网站,推文目录大放送!

5.用Stata生成二维码—我的心思你来扫

6.Hello,MySQL-odbc exec查询与更新

7.Python第一天

8.Python第二天

9.事件研究大放送

10.爬虫俱乐部隆重推出网上直播课程第一季



关于我们

微信公众号“爬虫俱乐部”分享实用的stata命令,欢迎转载、打赏。爬虫俱乐部是由李春涛教授领导下的研究生及本科生组成的大数据分析和数据挖掘团队。

此外,欢迎大家踊跃投稿,介绍一些关于stata的数据处理和分析技巧。

投稿邮箱:statatraining@163.com

投稿要求:
1)必须原创,禁止抄袭;
2)必须准确,详细,有例子,有截图;
注意事项:
1)所有投稿都会经过本公众号运营团队成员的审核,审核通过才可录用,一经录用,会在该推文里为作者署名,并有赏金分成。
2)邮件请注明投稿,邮件名称为“投稿”+“推文名称”。
3)应广大读者要求,现开通有偿问答服务,如果大家遇到关于stata分析数据的问题,可以在公众号中提出,只需支付少量赏金,我们会在后期的推文里给予解答。

【声明】内容源于网络
0
0
Stata and Python数据分析
爬虫俱乐部,新的启航
内容 1337
粉丝 0
Stata and Python数据分析 爬虫俱乐部,新的启航
总阅读512
粉丝0
内容1.3k