大数跨境
0
0

都2021年了还在选择学R还是Python?理性分析看看到底该学哪个

都2021年了还在选择学R还是Python?理性分析看看到底该学哪个 CareerTu职图
2021-02-02
1
导读:到底是学R还是Python?我们来告诉你答案!

直播公开课

 

  限时免费报名  

如何判断自己适合哪一类数据岗位?
Microsoft等大厂面试流程及考察内容
具备哪几种编程语言和技能会让简历更吃香
深度解析Case Study、Behavioral Questions等常见面试题

 

网上有篇百万点击的帖子,R和Python:数据科学1V1 Battle,两种语言相互竞争,试图成为“数据科学中The One”。其实两者都是强大的工具,各有各的优势(即,高级统计库vs实现生产代码);一般来说,考虑它们如何互补比选择一个更有意义



经常搜索数据科学职位的同学会发现,并不是所有的数据科学招聘信息的首选技能列表中都包含了R和Python。这就产生了一个潜在对比:当公司雇佣一个精通R但不懂Python的数据科学家时,他们想要的是什么?反之亦然?



为了寻找答案,我们研究了无数的职位JD,标题,和工作地点。从一个受欢迎的职位与两个不同的搜索查询网站:一个包含条款数据科学与R但没Python和包含Python但没R,特定工作返回搜索结果达到约30%少于Python搜索特定的工作。毫不奇怪,包含这两种语言的搜索比任何一种特定语言的搜索返回的结果都要多得多。


西海岸Python,东海岸爱R?


作为第一步,我们查看了针对R和Python工作搜索最常见的10个城市的职位分类。在收集数据时,这两种语言的职位数量最多的地方是纽约和波士顿(尽管两周后发现,硅谷接手了Python的工作,而纽约和波士顿的R工作保持不变)。在前两个城市之后,职位分布有了一些变化。


DC对能流利使用R 数据科学家的需求最大,旧金山对精通Python数据科学家却情有独钟。我们猜DC对R数据科学家的需求可能是政治数据科学家的公司驱动的,他们中的许多人可能拥有政治学博士学位,而R在这一领域有着深厚的根基。

 

 

数据科学职位“双标”


要了解这些职位的招聘有何不同,其实有一个快速的方法;计算每组招聘职位中出现的数据科学工具和技术的数量。也就是说,在R和Python数据科学工作中使用了哪些工具和技术。

 

通过对你搜“Research”或“Machine Learning”,“Cloud”这些词在JD中有一些不同之处。在R Data science的招聘信息中,我们可以清楚地看到,最常用的词是“Research”,其次是“SQL”和“Statistics”等术语。在Python数据科学的招聘启事中,“Machine Learning”是最常见的,其次是“SQL”、“Research”,以及处理AWS和spark等大数据的工具。


 

Topic Modeling On Job Descriptions


我们可以使用Topic Modeling更深入地研究工作中JD的内容。首先在模型拟合之前做一些文本清理,同时尝试了解有多少Topic适合建模,而不是随意选择一个数字。关于这方面的帮助,我们可以求助于R中的“ldatuning”包。


在向ldatuning提供一个文档术语矩阵(DTM)之后,它将返回一些不同的度量标准,用于评估要处理的主题的数量。下图是来自R职位描述的信息;看起来25个主题是一个合理的选择。Python描述的结果几乎相同,因此Python模型中也使用了25个主题。



下面是产生的Topic,首先从R职位开始。这些术语按照它们在每个Topic上的权重按降序排列。有些话题不是很有趣,因为它们与招聘惯例和福利相关(例如,10,13,14,17,22),甚至与纽约市(6)也有关系,因为很多招聘信息都是在纽约发布的。多个Topic似乎代表了健康和保健行业(18,23)。


其他的描述科学研究,特别是生物和临床试验研究(2,7,25)-这有助于解释达勒姆,NC在名单上的位置,因为它是生物技术/制药研究的温床。商业世界的主题15广泛涉及商业,20似乎与金融有关,24描述市场研究。


Topic 5可以证实上面关于政治学工作的假设,因为它包含了与政策、政府和调查相关的术语。最后,我们来谈谈我称之为一般数据科学的话题;例如,主题3、8、11、16和18涵盖了团队合作、广义分析、机器学习、统计和数据库等Topic。


Python Topics


R Topics


接下来,我们可以从Python JD转移到主题分析结果。忽略经验和福利相关的话题,我们看到一些类似的Topic正在出现。例如,主题14一般代表健康研究、9个市场营销、11个金融、24个商业,而我们有一般的数据科学主题,比如4、20、25个强调团队合作、机器学习和分析。


现在,让我们来看看差异,这里有一些很大的差异。这是一个提到大数据相关主题的。Topic 1中除了专门处理大数据的平台(hadoop、spark)外,还包含了big这个词;主题23似乎也以某种格式表示大型数据。主题21描述了云计算,有两个主题是关于数据库的(10,22),以及多个与软件工程相关的主题(15,19)。

 

从中懂了什么?


当然,R和Python的数据科学家的职位信息有很多相似之处(例如,SQL - Data必须存在于某个地方),但也有一些关键的区别。


从最高层次上看,招聘具有R经验的数据科学家似乎是在寻找具有丰富分析经验的学术型研究人员。因为R在学术界占主导地位,也很符合R职位描述中的许多研究主题。招聘Python流利数据科学家的帖子似乎是在寻找更有计算机科学或工程背景的人,与数据工程师或机器学习工程师的描述相符。



在另一个层面上,在2014年的Quora上被Michael Hoster (Stitchfix的现任数据科学主管)阐述过了,他解释了两种不同类型的数据科学家:

 

类型A数据科学家:是用于分析的。这种类型主要关注数据的意义,或者以一种相当静态的方式使用数据。

 


A类数据科学家可以编写足够好的代码来处理数据,但不一定是专家。A型数据科学家可能是实验设计、预测、建模、统计推断或其他统计部门通常教授的方面的专家。但是,一般来说,数据科学家的工作成果并不是学术统计有时似乎暗示的“p值和置信区间”(例如,对于在制药行业工作的传统统计人员来说,有时是这样)。在谷歌,类型A数据科学家被称为统计学家、定量分析师、决策支持工程分析师或数据科学家,可能还有更多。

 


类型B数据科学家:B是用于构建的。B型数据科学家与A型数据科学家共享一些统计背景,但他们同样是强大的程序员,可能是受过培训的软件工程师。B类型的数据科学家主要对在产品中使用数据感兴趣。他们建立与用户交互的模型,经常提供推荐(产品,你可能认识的人,广告,电影,搜索结果)。在谷歌,B型数据科学家通常被称为软件工程师。B型数据科学家可能会使用“数据科学家”这个术语来指代他们自己,因为这个领域的定义一直在变化,所以他们可能是对的。但我看到这个术语在我这里提出的一般方式中使用得最多。


 

这两种类型之间的区别也在Robert Chang的另一篇媒体文章中得到了很好的解释和扩展。在我看来,A型数据科学家似乎与我们发现的招聘R型数据科学家和招聘Python数据科学家广告中的B型数据科学家的信息非常吻合。


Airbnb就将其数据科学部门重组为3个分支:数据科学家-分析、数据科学家-算法和数据科学家-推理。从这里的数据来看,似乎Python型述的数据科学家适合算法分支,R型数据科学家适合推理分支,或者可能适合分析跟踪。


看到这里你是不是对到底是学R或者Python有个清晰地认识了呢?如果你不清楚自己到底适合哪种类型的数据科学家?不清楚这两个工具具体在工作中如何运用?不知道什么时候该用Python什么时候该用R?没关系,职图名企分析岗训练营中,来自一线名企的导师可以为你详细解答!


导师来自LinkedIn、Chanel、Microsoft、Wayfair

包含Digital Marketing、Marketing Analyst、Business Analyst、Data Analyst

四大方向求职干货

价值$599,限时前100位免费报名



Part 1  Digital Marketing

什么是Growth Marketing?

科技公司看重Digital Marketing岗的技能和特质

科技公司Digital Marketing岗位面试流程、薪资待遇

大厂Marketing部门工作日常&发展路径

 

Part 2 Marketing Analyst

奢侈品行业为什么要招数据分析人才?

在奢侈品公司做Marketing Intelligence Analyst需要具备哪些技能?

如何求职一线奢侈品公司?招聘流程是如何的?

 

Part 3 Business Analyst

哪些专业背景可以从事商业分析?

Business Analyst的就业前景和薪资待遇

商科/文科转型商业分析需要具备哪些技能?

转型需要做哪些准备?跨专业求职如何提高竞争力?

 

Part 4  Data Analyst

如何判断自己适合哪一类数据岗位?

Microsoft等大厂面试流程及考察内容

具备哪几种编程语言和技能会让简历更吃香?

深度解析Case Study,Behaviral Questions等常见面试题


扫码回复【分析 0】

抢占席位!


最后,R和python是数据分析的关键工具,了解它们无疑会比只了解其中一个更有帮助。职图特地推出了Data Analytics飞跃实战项目,该项目重要亮点:Dataset深度挖掘,SQL,Python,R等数据语言实战操作。不仅带着同学们实战、刷题,还会一对一导师辅导让学员们提升对行业的认知、Presentation、商业化思维等软技能。


如果你想在春招中斩获Dream Offer,但发现自身在相关的专业技能、相关的行业经验有所欠缺,那么职图和新零售电商企业深度合作的独创飞跃实战项目将将在最大程度上帮助上你,提升你的求职力,助力斩获名企Offer!


在飞跃实战项目中,所有学员将直接上手参与职图×Grin联名款线上营销,在FLAG的资深导师带领下,巩固专业知识!另一方面,在实战项目中,你将积累高含金量作品集,丰富简历,面试有话讲!求职硬实力+背景提升,全面帮助你冲刺时尚、电商行业心仪Offer!

 


扫码添加职图咨询导师
回复【飞跃 0】
了解飞跃实战详情!


1. 你将获得

  • 直接与电商企业Grin展开合作,深度参与CareerTu联名款商业项目,获取高质量真实项目实操经历,为你之后求职以Amazon、Wayfair、L'Oreal、Everlane为代表的电商公司热招岗位奠定基础。
  • 深度参与联名款线上营销,掌握岗位必备工具的场景应用。

  • FLAG导师带领你体系化学习岗位必备技能和工具,在实战中加强练习融汇贯通。

  • 资深大牛导师进行实战课程辅导以及一对一辅导,帮助同学解决自身个性化的实战学习和求职问题。包含对于实战作业内容的批改和反馈。

  • 项目中包含大厂面试题目解析,帮助你战胜面试中遇到的技术考。面试题目都有导师精挑细选,帮助理清面试常见考题的解题思路

  • 在实战中使用即时通讯工具,有机会与企业内部成员直接进行线上会议。全面复刻工作真实场景和环境,快速适应职场文化

  • 新增Demo day,给到同学和业界一比一的项目展示方式。Demo day时,邀请CareerTu教学组长导师/业界大牛导师,进行深入点评,给到同学更加全面和完整的业界洞察。

 

2. 合作企业

Grin是口腔护理行业领先的天然牙膏品牌。同时Grin还是唯一一个在新西兰牙医诊所上架的纯天然口腔护理品牌。有这么多专业机构和专业牙医为它背书,效果和安全性都是无需怀疑的。Grin的中文意思是快乐的露齿笑,英文念的时候,也是微笑的样子,非常形象。纯天然有机成分加上让人会心一笑的品牌名字,Grin的品牌形象真的非常符合当下“乐活”的生活理念!并且Grin还被刘涛和李佳琦推荐过!


在本次飞跃实战项目中,所有学员将直接上手参与职图×Grin联名款线上营销,在FLAG的资深导师带领下,手握营销经费进行实操,巩固专业知识!另一方面,在实战项目中,你将积累高含金量作品集,丰富简历,面试有话讲!求职硬实力+背景提升,全面帮助你冲刺心仪Offer!

 

3. 项目老师


   

4. 项目成果与学员作品

学员在参加整个实战项目后,将对岗位有更加深刻的理解并积累实战经验,产出一份具有高质量、高含金量的作品集,提升自身背景。

 

往期学员部分作品集展示:

*下滑查看更多


至今已有250+世界名企招聘了职图学员:


扫码添加职图咨询导师
回复【飞跃 0】
立即咨询,抢占名额!




点击“阅读原文”直接了解项目详情!


【声明】内容源于网络
0
0
CareerTu职图
CareerTu (www.careertu.com) 是互联网新职业在线技能学习平台,专注于数字营销 数据分析 商业分析 产品设计。Unlock Your Potential 激发潜能,迭代自我 突破技能界限,实现职场飞跃
内容 6729
粉丝 0
CareerTu职图 CareerTu (www.careertu.com) 是互联网新职业在线技能学习平台,专注于数字营销 数据分析 商业分析 产品设计。Unlock Your Potential 激发潜能,迭代自我 突破技能界限,实现职场飞跃
总阅读3.1k
粉丝0
内容6.7k