2019
年度Spotify最受欢迎的TOP50歌曲
数据来源于Kaggle网站(https://www.kaggle.com/),该网站上常常会对各种社会调查数据进行更新,并同时提供免费下载,如NBA球星薪资情况、Chicago犯罪率、幸福指数调查报告等。此次分析报告所下载的是音乐网站Spotify上2019年最受欢迎的歌曲TOP50。Spotify作为一个正版流媒体的音乐服务平台,于2008年10月再瑞典斯德哥尔摩正式上线。Spotify提供免费和付费两项服务,同时得到了华纳音乐、索尼、百代等全球几大唱片公司的支持,其所使用的音乐也全都是正版。截止到2015年1月,Spotify已经拥有唱过6000万的用户,其中1500万为付费用户。
本次数据分析报告中所采用的数据是2019年度Spotify的TOP50。其中采取了:歌手、受欢迎度、停顿次数、能量与节奏强度(以100分来进行打分)
受欢迎度(Popularity):以浏览量、评论人数、收听人数、销售量为测量标准
音乐强度(Energy)(Danceability):着重体现节奏与能量强度
乐种类:Genre
音乐长度(Length)
停顿次数与长度(Speechiness /Acoustincness)。
MODERN
二、数据处理
(一)导入数据(数据需要先下载)
将数据导入juypter中,对数据作基本的筛查与了解
(二)查看缺失数据并清理
对Popularity这一项的数据进行显示;
对该缺失数据进行清理,保留非缺失值;
对Genre类别的数据进行查看。
下面是代码显示:
三
、数据可视化
MODERN
(一)TOP50音乐的类别分析
对Genre类别进行统计,并用matlab进行绘图;
可以看出,在2019年度TOP50的音乐中,“POP”占了绝大部分因素。Pop中划分了各种不同类别的流行音乐,如“Canadian pop””dance pop”等。在该统计图中,pop占据主要的优势地位,同时还有另一个关键词“dance”。
(二)词云生成
利用Pyechart进行词云的生成。
code 和 data:链接:
https://pan.baidu.com/s/1Yb9J2exwg3u9hOPQkSE-fg 提取码: sqs3


