大数跨境
0
0

数据分析面试题集锦(五)

数据分析面试题集锦(五) 大话数据分析
2022-12-24
0
导读:数据分析面试必备技能知识问答

大家好,今天整理数据分析面试题集锦(五),经常会被问到,“数据分析需要学习什么技能?”,“针对实际的业务场景,如何使用数据分析工具去分析?”基于此作者总结数据分析面试常用的问题,面试内容包括技能应用篇:EXCEL、SQL、Python、BI工具等,业务思维篇:常用的数据分析方法数据分析业务思维等。

其中大部分问题点,没有绝对标准答案,所有问题点都是为了解决问题,大家如果有更好的问题答案,也可以提出,对于其中的问题也可以提出,共同解答,欢迎点赞、转发、评论,下面一起来学习。

本文讲解内容:Excel、SQL、Python面试必备
适用范围:多种数据分析实用技巧

Excel篇

1、一秒找不同

比如我们要看期中的语文成绩和期末的语文成绩是否相同,使用快捷键Ctrl+\,即可一秒找出不同,阴影部分显示的即为异同项。

2、自定义数据格式

使用期中语文和期末语文的例子,添加一列辅助列,如果成绩大于0显示为绿色向上的箭头,如果成绩小于0显示为红色向下的箭头,如果成绩持平显示为黄色的星号。

[绿色][>0]▲0;[红色][<0]▼0;[黄色]★0

3、中国式排名

这里有一组成绩的总分数,要按照中国式进行排名,也就是说当两个名次重合时,接下来的名次是连续的,而不是跳过的,使用SUMPRODUCT复合函数公式即可实现中国式排名。

排名:=RANK(F6,$F$6:$F$15)排名1:=COUNTIF($F$6:$F$15,">"&F6)+1中国式排名:=SUMPRODUCT(($F$6:$F$15>F6)*(1/COUNTIF($F$6:$F$15,$F$6:$F$15)))+1

4、Excel多条件筛选

多条件筛选,按照一定的数据条件去筛选数据,在数据选项卡下选择高级筛选按钮。

在高级筛选框里面选择条件区域,将筛选后的结果复制到标题行。

即可得到如下筛选的结果。

SQL篇

SQL创建表和查询数据

有一个学生成绩数据库,数据库中包括两个个表。

  • 学生表Student由学号Sno、姓名Sname、性别Ssex、班级Class、其中,Sno为关键字。

  • 分数表Score由学号Sno,分数degree组成,其中,Sno为关键字。

1、分别使用SQL语句创建学生表和分数表

CREATE TABLE student(Sno varchar(20) PRIMARY KEY,Sname varchar(10),Ssex char(2),Class varchar(10));
CREATE TABLE Score(Sno varchar(20) PRIMARY KEY,degree int);

2、查询Student表中的所有记录的Sname、Ssex和Class列

select sname,ssex,class from student;

3、查询Score表中成绩在60到80之间的所有记录

select * from score between 60 and 80;
4、查询95033班和95031班的平均分
select class,avg(degree) from Score ajoin student bon a.sno = b.snoGROUP BY CLASS

Python篇

1、Python批量重命名文件

如下有很多的TXT文件,需要将2021重命名为2022,使用Python即可批量进行重命名。



使用Python遍历原始的文件名,然后构建新的文件路径,使用rename函数将旧的路径名替换为新的路径名。

import ospath=r'D:\系统桌面(勿删)\Desktop\办公自动化\TXT文件'TXT_list=os.listdir(path)
for i in TXT_list: old_path=os.path.join(path,i) new_name=i.replace('2021','2022') new_path=os.path.join(path,new_name) #使用rename函数将旧的路径名替换为新的路径名 os.rename(old_path,new_path)

2、使用Faker库模拟数据

使用Faker库构造一组数据,并且导出到Excel本地,可用于数据测试和数据模拟。

from faker import Fakerfrom openpyxl import Workbook
wb=Workbook()#生成workbook 和工作表sheet=wb.active
title_list=["姓名","手机号","身份证号","出生日期","邮箱","详细地址","公司名称","从事行业"]#设置excel的表头sheet.append(title_list)
faker=Faker(locale="zh_CN")#模拟生成数据
for i in range(100): sheet.append([faker.name(),#生成姓名 faker.phone_number(),#生成手机号 faker.ssn(), #生成身份证号 faker.ssn()[6:14],#出生日期 faker.email(), #生成邮箱 faker.address(), #生成详细地址 faker.company(), #生成所在公司名称 faker.job(), #生成从事行业 ]) wb.save(r'D:\系统桌面(勿删)\Desktop\模拟数据.xlsx')
后台回复数据分析入门,获取数据分析入门资料
加入数据分析资料群,一起交流数据分析知识

关注和星标『大话数据分析』

和作者一起学习数据分析!

👆点击关注|设为星标|干货速递👆

三年互联网数据分析经验,擅长Excel、SQL、Python、PowerBI数据处理工具,数据可视化、商业数据分析技能,统计学、机器学习知识,持续创作数据分析内容,点赞关注,不迷路。

【声明】内容源于网络
0
0
大话数据分析
数据分析的收集者、整理者、分享者、实践者
内容 408
粉丝 0
大话数据分析 数据分析的收集者、整理者、分享者、实践者
总阅读27
粉丝0
内容408