大数跨境
0
0

对比Excel的10个功能,学习SQL好像也快了?

对比Excel的10个功能,学习SQL好像也快了? 数据分析与统计学之美
2020-11-12
0


SQL,数据分析岗的必备技能,你可以不懂Python,R,不懂可视化,不懂机器学习。但SQL,你必须懂。要不然领导让你跑个数据来汇......,哦不,你不懂SQL都无法入职数据分析岗,更别说领导了。


SQL难吗?说实话,要写好,很难很难。但要通过SQL笔试这关,并不难。相信大伙都使用过Excel,用SQL实现excel 常用操作去学,感觉会比较具体。我自身也刚入数据岗不久,本文也是为自己巩固一下SQL。

数据是网上找到的销售数据,命名为sale,长这样:



01. 关联公式:Vlookup

vlookup是excel几乎最常用的公式,一般用于两个表的关联查询等。所以我先创建一个新表:复制sale表并筛选出地区仅为广州的,命名为sale_guang。
create table sale_guang SELECT * from sale where city="广州";

需求:根据订单明细号关联两表,并且sale_guang只有订单明细号与利润两列
SELECT * from sale ainner JOIN(SELECT ordernum,profit from sale_guang) b style="margin: -0.8em 0px; color: rgb(26, 26, 26); font-family: -apple-system, BlinkMacSystemFont, "Helvetica Neue", "PingFang SC", "Microsoft YaHei", "Source Han Sans SC", "Noto Sans CJK SC", "WenQuanYi Micro Hei", sans-serif; font-size: medium;              background-color: rgb(255, 255, 255);  ">


02. 对比两列差异

需求:对比sale的订单明细号与sale_guang订单明细号的差异;
SELECT * from sale aWHERE a.ordernum not in (SELECT b.ordernum from sale_guang b);


03. 去除重复值

需求:去除业务员编码的重复值
SELECT * FROM salewhere salesnum not in (SELECT salesnum from sale GROUP BY salesman HAVING COUNT(salesnum)>1)


04. 缺失值处理

需求:用0填充缺失值或则删除有地区名称缺失值的行。
#用0填充:update sale set city = 0 where city = NULL#删除有缺失值的行:delete from sale where city = NULL;


05. 多条件筛选


需求:想知道业务员张爱,在北京区域卖的商品订单金额大于等于6000的信息。
SELECT * from sale where salesman = "张爱" and city = "北京"and orderaccount >=6000;


06. 模糊筛选数据


需求:筛选存货名称含有"三星"或则含有"索尼"的信息。

SELECT * from sale where inventoryname like "%三星%" or 存货名称 like "%索尼%";


07. 分类汇总


需求:北京区域各业务员的利润总额。

SELECT city,sum(`profit`) from saleWHERE city = "北京"GROUP BY `city`;


08. 条件计算


需求:存货名称含“三星字眼”并且税费高于1000的订单有几个?这些订单的利润总和和平均利润是多少?
#有多少个?SELECT COUNT(*) from sale where inventoryname like "%三星%"and `tax` > 1000 ;
#这些订单的利润总和和平均利润是多少?SELECT `ordernum`,SUM(profit),AVG(`profit`) from sale where inventoryname like "%三星%"and `tax` > 1000 GROUP BY `ordernum`;


09. 删除数据间的空格


需求:删除存货名称两边的空格。
SELECT trim(inventoryname) from sale;


10. 合并与排序列

需求:计算每个订单号的成本并从高到低排序(成本 = 不含税金额 - 利润)
SELECT city,ordernum,(Nontaxamount - profit) as cost from saleorder by cost DESC;


总结:结构化查询语言(Structured Query Language)简称SQL,果然和它名字一样,查询起来得心应手,但做想做数据处理方面,能明细感受到比Python和excel吃力(也可能是我还没学好orz)。


往期推荐:

为了探究妹纸对 “bra” 的喜好!趁着“双11”来临之际,我爬取了淘宝......

CSDN文章被洗稿、抄袭严重!用Python做一个“基于搜索引擎的文章查重工具”,解决!

用Python讲述:地理“经纬度”数据的4种转换方法!


【声明】内容源于网络
0
0
数据分析与统计学之美
免费领10w字"Python知识手册",共400页,后台回复“十万”领取!
内容 1080
粉丝 0
数据分析与统计学之美 免费领10w字"Python知识手册",共400页,后台回复“十万”领取!
总阅读210
粉丝0
内容1.1k