
这是法国的一家共享单车数据,共7条路线。
首先我们预览下数据

what is this?
这怎么分析?别怕,有Pandas

这就是Pandas的威武!
老规矩,缺失值可视化

2列空白?删除!

整洁多了。
我们看下数据集信息:

发现Date虽然是日期格式,但不是日期类型,转换!

找茬找茬!
多了2个变量,Weekday 和 Month,分别表示星期几和月份。
然后我们对每行样本求和,计算出每天的骑车人数总和。

接下来,2张图告诉领导,我们发现了什么?!

周四周五骑车人数多,周六周日明显骑车人数少,看来法国人民也是骑单车上班,周六日宅家里啊
再上图:

1-4月,哇塞,骑车人数明显增多;
5-8月,骑车人数达到高峰;
9-12月,骑车人数有所下降!
发现了什么?
骑车人数与温度相关啊!天气冷,骑车人少,天气适宜,骑车人数多。
数据下载链接: https://pan.baidu.com/s/1eR64RQE
密码: 8jbs
作者:zhaikun 风控建模屌丝一枚,现居于北京
个人微信公众号:Python数据分析与评分卡建模
联系方式:664086823@qq.com


