这一篇主要是介绍一下Tableau的简单使用,先从读取一个简单的Excel文本文件开始。读取数据集,这里我也准备了一个示例文件。
接下来,在正式开始分析之前先介绍几个概念:
数据源
我理解它指的其实就是你连接的源数据集是啥,比如这里我是拿一个Excel文件来进行分析,那么我的数据源就是这个基于这个Excel文件建立的。如果我是从某个txt文件进行分析,那么我的数据源就是基于这个txt文件的。
维度
维度是描述业务实体属性的文本或定性数据。你可以把它们看作是观察数据的角度、背景或上下文。它们通常是离散的(非连续的),用于对数据进行分组、筛选和分类。说人话,其实就是一个描述性质的特征字符。它的核心特点就是回答“谁”、“什么”、“何处”、“何时”的问题。通常都是文本、日期或者类别等非数值型的。并且数据是离散的,独立分开互不影响的类别。核心在于定性。
比如你说一个人的姓名、家庭住址、所在城市、性别等等这些都是“描述信息”,那么一个表格中的这些字段就都属于维度。
度量
度量 是可被测量和聚合的数值数据。它们是你所要分析的具体指标或数值。它们通常是连续的,用于进行数学计算(如求和、平均、计数等)。说人话,它就是一个定量的指标,可以用来进行数学计算的。就是一个“值”。例如销售额、销售数量、毛利等这些都属于度量字段。
注意:所有的表格中的字段都可以分为这两大类指标,即度量字段与维度字段,这点很重要,一定要区分清楚这两种指标,不然随着数据量的越来越大,越来越复杂,逻辑就会越来越难以理解的。其实本质上数据分析就是基于维度和度量来进行各种关联聚合分析。
认识首页
读取数据源成功之后的界面长这样:
如果你的Excel表格中有多个sheet页面,那么在关联框你就可以针对多个表来进行关联操作了。
OK,接下来,什么都不要操作,默认即可,我们先从最简单的开始入门,用到的操作再详细介绍,没有用到的操作先不管。直接一波流极简模式入门好吧。
左下角有两个页签:
第一个页签也就是我们当前所在的页面就是数据源页面,可以针对你连接的数据源进行各种操作,比如表关联啊
工作表1:代表的就是你开始进行分析的第一个工作表文件,点击一下进入到数据分析界面。
如果我想看不同年龄的学历分布情况,那我可以直接拖拽字段即可:
这样就得到了一个最简单的条形统计图了,还可以按照从低到高的顺序排列一下:
到这里,其实严格意义上来说,我们已经做完一个最简单的数据分析了,这个时候你一定会有很多疑惑,这个界面还有这么多功能菜单没有介绍,怎么不一个一个介绍咧。
其实,在真实企业实践中,数据分析都是基于需求来的,也就是说你在正式打开Tableau之前,你一定得有一个明确目的,你要分析啥?要得到什么效果才是你需求的?这一点很重要!!!
基于这个目的,你再来做合适的报表,否则再花里胡哨,再炫酷都只是会沦为时尚洋垃圾。这一篇只是最简单的带大家入一个门,至于其他功能,后续我会慢慢介绍。因为Tableau的功能是真的很强大的,只有你想不到,没有它做不到的,有的功能甚至我也没有用过,也不知道是干啥的。因此,大家不管是看我这篇教程还是看其他教程,一定要秉持一个信念,带着目的去分析,用到的功能就学习去使用,没有用到的功能,可以不用管它。
后续我的教程的思路都是基于一个一个实际的案例需求来进行的,不会单一为了介绍某个功能而去创造某个例子。今天就先写到这里,大家有什么疑问欢迎到评论区交流学习~~~

