大数跨境
0
0

Python实战—小费数据集应用

Python实战—小费数据集应用 大话数据分析
2020-02-10
0
导读:从数据获取、问题探索、数据清洗、数据探索一系列数据分析过程。


今天是我在家的......
不知道第多少天
由于疫情的缘故
大家不能出去玩
肯定无聊到发慌
如果迫不得已要出去的话
一定要戴好口罩,勤洗手
保护好自己鸭!
现在许多高校已经开始延迟开学
不如此时静下心来
趁着这段空闲时间
在家利用网络平台
好好学习新知识
一起学习吧!



一、数据来源



    本节选用的是Python的第三方库seaborn自带的数据集,该小费数据集为餐饮行业收集的数据,其中total_bill为消费总金额、tip为小费金额、sex为顾客性别、smoker为顾客是否吸烟、day为消费的星期、time为聚餐的时间段、size为聚餐人数。


import numpy as npfrom pandas import Series,DataFrameimport pandas as pdimport seaborn as sns   #导入seaborn库
tips=sns.load_dataset('tips')#seaborn库自带的数据集tips.head()

二、问题探索 



一、小费金额与消费总金额是否存在相关性?
二、性别、是否吸烟、星期几、聚餐人数和小费金额是否有一定的关联?
三、小费金额占小费总金额的百分比是否服从正态分布?


三、数据清洗



tips.shape #数据集的维度
(244,7
共有244条数据,7列。


tips.describe() #描述统计

描述统计结果如上所示。

tips.info() #查看缺失值信息



此例无缺失值。


四、数据探索



tips.plot(kind='scatter',x='total_bill',y='tip') #绘制散点图
由图可看出,小费金额与消费总金额存在正相关性。
male_tip = tips[tips['sex'] == 'Male']['tip'].mean() #男性平均消费金额male_tip

3.0896178343949052

female_tip = tips[tips['sex'] == 'Female']['tip'].mean() #女性平均消费金额female_tip

2.833448275862069

s = Series([male_tip,female_tip],index=['male','female'])s

male      3.089618

female    2.833448

dtype: float64

 

s.plot(kind='bar') #男女平均小费柱状图

由图可看出,女性小费金额小于男性小费金额。
tips['day'].unique() #日期的唯一值 
[Sun, Sat, Thur, Fri]
Categories (4, object): [Sun, Sat, Thur, Fri]
sun_tip = tips[tips['day'] == 'Sun']['tip'].mean()sat_tip = tips[tips['day'] == 'Sat']['tip'].mean()thur_tip = tips[tips['day'] == 'Thur']['tip'].mean()fri_tip = tips[tips['day'] == 'Fri']['tip'].mean()#各个日期的平均小费值s = Series([thur_tip,fri_tip,sat_tip,sun_tip],index=['Thur','Fri','Sat','Sun'])s

 

s.plot(kind='bar') #日期平均小费柱状图

由图可看出,周六、周日的小费比周四、周五的小费高。
tips['percent_tip'] = tips['tip']/(tips['total_bill']+tips['tip'])
tips.head(10) #小费所占百分比

tips['percent_tip'].hist(bins=50)#小费百分比直方图

由图可看出,小费金额占小费总金额的百分比基本服从正态分布。




由于公众号没有开通留言功能
大家可以在公众号后台联系作者
喜欢文章的朋友
麻烦点个再看
Python在手
天下我有
一起努力
往期精彩回顾

Python软件安装

统计180班QQ群聊文本可视化分析

用数据说话,Python就业前景分析


【声明】内容源于网络
0
0
大话数据分析
数据分析的收集者、整理者、分享者、实践者
内容 408
粉丝 0
大话数据分析 数据分析的收集者、整理者、分享者、实践者
总阅读122
粉丝0
内容408