大数跨境
0
0

这两个概念都不懂?你就别做数据分析了!

这两个概念都不懂?你就别做数据分析了! 数据分析与统计学之美
2020-12-14
0

为什么需要加星标?

由于微信公众号出现了 “乱序” 排列的状况,也就是说:文章不会按照 “时间顺序” 推送给你。那么朋友们就不能第一时间,收到我的干货。因此希望您抽出一分钟,完成如下三步

01

02

03


1580人已添加“星标
       
       

若恒 | 作者

51CTO | 来源

大家好,我是黄同学

看到这个标题是不是很好奇,到底哪两个概念啊?

不卖关子!指标与维度是数据分析中最常用到的术语,它们是非常基础的,但是又很重要,经常有朋友没有搞清楚它们之间的关系,只有掌握理解了,我们的数据分析工作开展就就容易多了。现在就来说说指标与维度的那些事。

指标

指标,用于衡量事物发展程度的单位或方法,它还有个IT上常用的名字,也就是度量。

例如:人口数、GDP、收入、用户数、利润率、留存率、覆盖率等。很多公司都有自己的KPI指标体系,就是通过几个关键指标来衡量公司业务运营情况的好坏。

指标需要经过加和、平均等汇总计算方式得到,并且是需要在一定的前提条件进行汇总计算,如时间、地点、范围,也就是我们常说的统计口径与范围。指标可以分为绝对数指标和相对数指标

  • 绝对数指标反映的是规模大小的指标,如人口数、GDP、收入、用户数,

  • 相对数指标主要用来反映质量好坏的指标,如利润率、留存率、覆盖率等。

我们分析一个事物发展程度就可以从数量跟质量两个角度入手分析,以全面衡量事物发展程度。刚才说过,指标用于衡量事物发展程度,那这个程度是好还是坏,这就需要通过不同维度来对比,才能知道是好还是坏。

维度

维度事物或现象的某种特征,如性别、地区、时间等都是维度。其中时间是一种常用、特殊的维度,通过时间前后的对比,就可以知道事物的发展是好了还是坏了。
如用户数环比上月增长10%、同比去年同期增长20%,这就是时间上的对比,也称为纵比;
另一个比较就是横比,如不同国家人口数、GDP的比较,不同省份收入、用户数的比较、不同公司、不同部门之间的比较,这些都是同级单位之间的比较,简称横比;
维度可以分为定性维度跟定量维度根据数据类型来划分
  • 数据类型为字符型(文本型)数据,就是定性维度,如地区、性别都是定性维度;
  • 数据类型为数值型数据的,就为定量维度,如收入、年龄、消费等。

一般我们对定量维度需要做数值分组处理,也就是数值型数据离散化,这样做的目的是为了使规律更加明显,因为分组越细,规律就越不明显,最后细到成最原始的流水数据,那就无规律可循。
最后强调一点,只有通过事物发展的数量、质量两大方面,从横比、纵比角度进行全方位的比较,我们才能够全面的了解事物发展的好坏。

进一步拓展思考,我理解为指标拆分和维度对比。其实在实际产品数据分析的过程中也可参照以上思想。
通过大量的数据分析软件工具应用可以发现,主要包括以下内容:

  • 整体情况的分析和汇总:全局数据的概况、变化趋势、占比等

  • 多个维度的分析:如果是日志数据,已经存在多个数据项,以某一个数据项作为主关键词汇总分析,同比、环比变化,占总数的变化。如果没有日志数据,则需要想清楚解决这个问题原因是什么?需要采集哪些数据项?

  • 重要场景问题的分析:根据分析的重要问题、用户关心的问题进行分析

  • 软硬件性能管理、告警管理、报表管理、基础参数配置和用户管理等等

在多维度分析、告警、报表,数据图表可视化设计呈现方面也存在许多共性,总结如下:

  • 数据的呈现方式是表格还是图表?若是时间范围,时间统计粒度是多少?

  • 表格需要呈现哪些数据?数据的单位?保留几位小数?数据计算的方法?排序依据?

  • 图表采用哪一种?呈现的范围是多少?

  • 常见的数据项操作:新增、删除、修改、查询(新增哪些是必填数据项?校验重复性和有效性?删除是否需要提醒?是否具有权限删除?修改可修改的数据项有哪些?修改后是否要进行校验有效性和重复项?是否有修改的权限?查询是精准查询还是模糊查询?是单一查询还是支持批量查询?批量查询输入方式的讲究?查询的内容输入什么是否支持大小写 空格等?数据区间的查询是自定义还是给出范围划分?)

人们总认为与大数据分析沾点边的技术都要花大价钱才能得到。但事实上,大数据分析的思想才是最贵的,技术可以实现数据批量清洗,处理,呈现地更快、更美。但却不知道要哪些数据算有效,哪些数据才是重点需要分析得出有价值的信息。

转自:中国统计网,本文为转载分享\推荐阅读,若侵权请联系后台删除

推荐阅读:


手把手带你爬虫 | 爬取500px图片


只需4步,win10电脑开机“自动”清理回收站!


Numpy、Pandas中axis=0和axis=1傻傻分不清楚,本文全解决!

【声明】内容源于网络
0
0
数据分析与统计学之美
免费领10w字"Python知识手册",共400页,后台回复“十万”领取!
内容 1080
粉丝 0
数据分析与统计学之美 免费领10w字"Python知识手册",共400页,后台回复“十万”领取!
总阅读76
粉丝0
内容1.1k