大数跨境
0
0

数据分析工具鄙视链:Python、R语言是老大,Excel只能称小弟?

数据分析工具鄙视链:Python、R语言是老大,Excel只能称小弟? CareerTu职图
2020-11-07
2
导读:数据分析工具选择,Python还是R语言?会用Excel只是小白?
 

最新行业报告

 
2020数据分析、商业分析行业报告
工作岗位与职能、薪资对比、热招公司等多方面详细解读
帮助你一网打尽,斩获心仪Offer!

扫码回复【数据分析 0】立即领取

  
History语言发展史

ABC语言 -> 发明 Python (1989年,作者 Guido van Rossum)-> Python 2 (2000年) -> Python 3 (2008年)

Fortan 语言 -> S 语言(贝尔实验室)-> 发明 R (1991年,作者 Ross Ihaka 和 Robert Gentleman) -> R 1.0.0 (2000年) -> R 3.0.2 (2013年)

Python语言

Python语言因为其有简洁性、易读性以及可扩展性的特点,在国外科学计算研究中的运用越来越多,很多知名大学大都采用Python来教授程序设计课。


比如卡耐基梅隆大学的编程基础、麻省理工学院的计算机科学及编程导论就使用Python语言进行授课。众多开源的科学计算软件包都提供了Python的调用接口,例如著名的计算机视觉库OpenCV、三维可视化库VTK、医学图像处理库ITK。
 
而在数据分析相关的领域,Python专用的科学计算扩展库就更多了。例如3个十分经典的科学计算扩展库:
  • NumPy:为Python提供了快速数组处理

  • SciPy:为Python提供了数值运算

  • Matplotlib:为Python提供了绘图功能


因此Python语言及其众多的扩展库所构成的开发环境十分适合工程技术、科研人员处理实验数据、制作图表,甚至开发科学计算应用程序。2018年3月,该语言作者宣布Python 2.7将于2020年1月1日终止支持。如果在这个2020年1月1日之后想要继续得到Python 2.7有关的支持,则需付费。 

Python语言一般做什么应用和开发

  • 互联网与web开发:占比62%

  • 科学及数学计算:占比55%

  • 银行及金融业:占比29%

  • 教育领域:占比18%

  • 桌面GUI:占比14%

  • 软件开发:占比58%

  • 机器人及嵌入式开发:占比27%

  • 测试及计算机仿真:占比23%

  • 其他应用方向:占比18%


R语言
 
R语言是集数据处理、计算和制图软件于一身的系统。


R语言的功能:

  • 数据存储和处理

  • 数组运算工具

  • 统计分析工具

  • 统计制图功能

  • 编程语言

  • 可操纵数据的输入和输出



R是一个免费的自由软件,有UNIX、LINUX、MacOS和WINDOWS版本。R的源代码可自由下载使用,可在多种平台下运行。


R拥有多种统计学及数字分析功能。比其他统计学或数学专用的编程语言有更强的物件导向功能。

R的另一强项是绘图功能,制图可以印刷,也可以加入数学符号。

虽然R主要用于统计分析或者开发统计相关的软体,但也有人用作矩阵计算。其分析速度可媲美GNU Octave甚至商业软件MATLAB。


依赖 Python 和 R 语言的领域:

  • Deep Learning 深度学习

  • Machine Learning 机器学习

  • Advanced Analytics 高级分析

  • Predictive Analytics 预测分析

  • Statistics 统计学

  • Exploration and Data Analysis 数据探索和分析

  • Academic Scientific Research 学术与科学研究

  • 以及…数不胜数的各类科学计算领域研究项目



Python 与 R 语言的用户群比较

数据科学云服务 Kaggle 上有人写了一个项目,用来预测一个分析师更爱用 R 还是 Python。根据观测到的数据,他提出了几个有趣的结论:
  • 如果你接下来的一年内考虑迁移到 Linux,你更有可能是 Python 用户。

  • 如果是数学、统计学专业背景,则更多喜欢用 R语言执行,计算机学科或是大众背景,基本都会采用Python语言。 毕竟Python的知名度比R语言广泛多了

  • 参加相关的代码挑战赛,更可能是 Python用户。

  • 如果接下来想学SQL引用,你更可能用 R。

  • 敏捷开发人员,大多使用 Python。

 

SQL:结构化查询语言


SQL:结构化查询语言(Structured Query Language)是所有数据方向的必备技能,也是比较容易学的技能,概括起来就是增删改查。SQL需要掌握的知识点主要包括数据的定义语言、数据的操纵语言以及数据的控制语言。

 

SQL具有数据定义、数据操纵和数据控制的功能。 

1. 数据定义功能

能够定义数据库的三级模式结构:外模式、全局模式和内模式结构。在SQL中,外模式又叫做视图(View),全局模式简称模式(Schema),内模式由系统根据数据库模式自动实现。

2. 数据操纵功能

具有很强的数据查询功能,可以进行数据插入、删除和修改。

3. 数据控制功能

对用户的访问权限加以控制,以确保系统的安全。

语言特点

风格统一:SQL可以独立完成数据库生命周期中的全部活动,包括定义关系模式、录入数据、建立数据库、査询、更新、维护、数据库重构、数据库安全性控制等一系列操作,这就为数据库应用系统开发提供了良好的环境,在数据库投入运行后,还可根据需要随时逐步修改模式,且不影响数据库的运行,从而使系统具有良好的可扩充性。


以同一种语法结构提供两种使用方式:SQL既是自含式语言,又是嵌入式语言。作为自含式语言,它能够独立地用于联机交互的使用方式,用户可以在终端键盘上直接输入SQL命令对数据库进行操作。作为嵌入式语言,SQL语句能够嵌入到高级语言(如C、C#、JAVA)程序中,供程序员设计程序时使用。


而在两种不同的使用方式下,SQL的语法结构基本上是一致的。这种以统一的语法结构提供两种不同的操作方式,为用户提供了极大的灵活性与方便性。 


语言简洁,易学易用:SQL功能极强,但由于设计巧妙,语言十分简洁,完成数据定义、数据操纵、数据控制的核心功能只用了9个动词: CREATE、 ALTER、DROP、 SELECT、 INSERT、 UPDATE、 DELETE、GRANT、 REVOKE。且SQL语言语法简单,接近英语口语,因此容易学习,也容易使用。 

 

SQL包含的语言:

DDL—数据定义语言(CREATE,ALTER,DROP,DECLARE)DML—数据操纵语言(SELECT,DELETE,UPDATE,INSERT)DCL—数据控制语言(GRANT,REVOKE,COMMIT,ROLLBACK)
 
SQL 语句的执行顺序跟其语句的语法顺序并不一致。

SQL 语句的语法顺序是:
  1. SELECT[DISTINCT]

  2. FROM

  3. JOIN ON 

  4. WHERE

  5. GROUP BY

  6. HAVING

  7. UNION

  8. ORDER BY


其执行顺序为:
  1. FROM

  2. JOIN ON

  3. WHERE

  4. GROUP BY

  5. HAVING

  6. SELECT

  7. DISTINCT

  8. UNION

  9. ORDER BY



 
Excel

Excel是大家最耳熟能详的基础数据处理工具!也是全球第一款允许用户自定义界面的电子制表软件(包括字体、文字属性和单元格格式)。它还引进了“智能重算”的功能,当单元格数据变动时,只有与之相关的数据才会更新,而原先的制表软件只能重算全部数据或者等待下一个指令。同时,Excel还有强大的图形功能。


Excel是数据分析领域应用最基础同时也是最广的入门数据处理分析工具。国内来说大部分中小型公司还是用Excel做数据分析相关的工作较多!例如:数据收集、统计分析、可视化报表等等

Excel非常适合简单的逻辑分析和小规模的数据集工作!同时Excel也可以用分类、聚类、关联和预测这几种算法来实现简单的数据挖掘。
 
“数据透视表”作为Excel中最强大的数据分析工具,重要程度更是不言而喻。但真正专业的数据分析师!还是要学会用Python或R语言!

因为Excel作为入门工具,进行精细化的数据处理工作还是有非常多的弊端需要解决!例如有以下问题:
  • 处理不了海量数据集

  • 可视化操作性和展示方式程度低

  • 数据孤岛问题明显、

  • 数据无法实时更新、

  • 终端可拓展性和兼容性较差等等问题。


对于Excel在数据分析层面的系统性学习,可以参考以下路径来做:软件基础操作 → 数据透视表→ 应用函数的学习 + 图表制作展示→ (SQL) →  VBA/(PQ+PP→PBI)
 
如今数据分析、数据科学岗位人才缺口高达500万,企业对数据人才求贤若渴,不断发布的招聘信息,提供高薪高福利待遇。但是,面对大量的求职机会,却手足无措:投出无数简历,没有回音,面试总被刷下来。

如果你还没有参与过真实的实操项目,又希望有一个拿得出手的经历可以写在自己简历上,不要错过职图飞跃实战项目,能让你在获得项目实操经验的同时,将高薪岗位JD上要求的硬技能一网打尽,提高核心竞争力!

职图飞跃实战的学员,将在6个月的时间内,通过实战联名款真实商业项目,与各个部门相互合作,共同完成联名款产品网页搭建、营销推广和投放、商业智能分析及数据分析、优化的全过程,充实你简历的项目经历、让你面试不怵。 
 
在实战周期中,学员将会在来自Google, Amazon, Estee Lauder, L'Oréal, LVMH 等领先公司的业界资深导师的带领下,体系化学习Data Analytics必备技能和工具,提升商业敏感度。从Statistical Modeling, Machine Learning, Python, SQL, Experiment Design等多个知识体系传授硬技能,并且从编程学习、模型理解、项目实战积累三个角度提升你的求职实力,同时获得一份真实的商业项目实操经历!

2020年度职图飞跃实战最后一期11月16日开课,已经开启报名,因为坚持小班教学,名额有限,想要增强求职竞争力的同学,尽早报名锁定你的席位!


扫码添加加职图资深咨询导师
回复【飞跃 0】
了解实战项目详情!


【声明】内容源于网络
0
0
CareerTu职图
CareerTu (www.careertu.com) 是互联网新职业在线技能学习平台,专注于数字营销 数据分析 商业分析 产品设计。Unlock Your Potential 激发潜能,迭代自我 突破技能界限,实现职场飞跃
内容 6729
粉丝 0
CareerTu职图 CareerTu (www.careertu.com) 是互联网新职业在线技能学习平台,专注于数字营销 数据分析 商业分析 产品设计。Unlock Your Potential 激发潜能,迭代自我 突破技能界限,实现职场飞跃
总阅读621
粉丝0
内容6.7k