散点图作为最常规的一种图表经常被用在数据量较多的图表里,而且通过散点图,我们也可以对数据进行预测,今天我们就用散点图,来对宁波的房价进行一个分析和预测。
首先我们需要找到原始的图表,也就是宁波近期各个小区的房价的原始数据表格,这个在当地的一些房产的网站上其实都可以找到,经过数据的梳理,最后形成下面的表格:

这个表有几个字段:
房子小区所在的各个区,这个字段是为了能对比各个去的房价,知道每个区的房价的区间
宁波各个小区的名称
宁波各个小区的房价。
这个表格里的数据是原始数据,如果我们用这些原始数据去做散点图,默认情况下我们看到的散点图是这样的:

也就是所有的区的房子的价格全部挤在了一起,我们无法来区分到底哪个区的房子便宜,哪个区的房子贵。
所以我们的目标是是否可以根据每个区一个区域,然后在X轴上一个区一个区的进行数据的呈现,这样我们就可以很清晰的来看到当地的房价。
所有为了实现这个功能,我们就需要辅助列,既然要把各个区分开,而且按照顺序来,那我们就应该在各个小区前面加上一个顺序的辅助列,具体如下:

有了这个辅助列后,所有的区都按照这个辅助列进行排列,然后我们把各个区的小区的房价用不同的颜色进行排列,就可以很明显的分析各个区的房价。具体看下图:

看这个图明显我们可以分析出很多
相对来说江东区的房子价格是搞得,而且普遍都集中在20000左右(数据来源2018年年初)
镇海的房价最低,应该有升值的空间,值得购买。
鄞州的房价跨度下,因为鄞州面积大
海曙区的各个小区的房价基本持平,没有太大的跨度区间
江北区和北仑区相对房源较小
-------------------------------------------------------------------------------------
欢迎关注人力资源数据分析,学习更多的数据分析技能


