大家好,今年春节档的两部影片《哪吒2》和《封神2》,大家一定很有印象,这两部影片在电影刚上映的时候,观众对它们的评论褒贬不一,在没看这两部影片之前,很多观众对影片的评论往往是片面的。
今天我就爬取一些观众在豆瓣评价中的数据,基于评价的数据,提取评论关键词,统计词频数位于前20的关键词及词频数,进行分析,这里选择词云图展示,可以量化文本评论的效果。
首先,使用DeepSeek提取评论数据的关键词以及词频数,在DeepSeek中输入下面的提示词:
影评分析数据下载链接,包含影评数据及本节使用的字体文件,下载即可使用。
链接:https://pan.quark.cn/s/4e668b9895d6
请提取并分析《哪吒2》影评数据中的[评论内容]字段,得出词频数位于前20的关键词及词频数,输出为.csv格式
如下,DeepSeek就很快根据评论数据提取出来了关键词和词频数。
请提取并分析《封神2》影评数据中的[评论内容]字段,得出词频数位于前20的关键词及词频数,输出为.csv格式
对上面两部电影做完词频分析以后,接着做可视化,这里使用词云图,词云图通过视觉手段,如字体大小、颜色和旋转角度等,来突出显示关键词,从而过滤掉大量的文本信息,让浏览者一眼就能领略文本的主旨。
词云图的官网如下,点击CREATE创建一个新的词云图。
将之前生成的关键词和词频数粘贴进去,点击import words按钮。
由于该网站默认的是使用英文字体,如果要创建中文字体的话,需要自己导入中文字体,这里我都准备好了字体文件,见前文的数据链接,都在数据链接里打包好了,直接下载使用即可。
点击Add加载进来黑体字体,这是一个中文常用字体。
以上设置完以后,点击Visualize即可创建词云图。
点击DOWNLOAD按钮,可以下载词云图到本地,高清的需要付费,这里点击免费的即可。
如下是生成的《哪吒2》影评数据词云图,由词云图可以看出,电影在特效和剧情方面比较突出,这也反映了大众的评价。
接着,我们按照上面的方式做一个《封神2》的词云图,先CREATE一个新的词云图,将DeepSeek生成的关键词和词频数粘贴进去。
按照文章前述设置词云图属性,得出如下《封神2》词云图,由词云图可以看出,电影突出邓婵玉和姬发的剧情故事,电影的特效也是一大特色。
我在使用DeepSeek的时候,经常遇到下面的情况,显示“服务器繁忙,请稍后再试”,导致效率很慢,这个问题估计大家也有遇到过。
要有效解决DeepSeek服务器繁忙的问题,可以使用硅基流动部署搭配Chatbox的方式,使用这种方法可以实现“满血版”DeepSeek大模型,在部署方法更加简单,仅需两步即可完成,实现过程如下:
具体的操作方法可以见下面的链接,帮助你更流畅的使用DeepSeek。
以上,我们使用DeepSeek+WordArt生成了《哪吒2》和《封神2》的词云图,通过词云图可以直观地看到观众对于这两部电影的真实评价,这两部均提到了特效和剧情,由此看到大多数观众的对于电影评价的共通点。
关注和星标『大话数据分析』
和作者一起学习数据分析!
👆点击关注|设为星标|干货速递👆
前蚂蚁金服数据运营,现京东经营分析,公众号、知乎、头条「大话数据分析」主理人,专注于数据分析的实践与分享,掌握Python、SQL、PowerBI、Excel等数据分析工具,擅长运用技术解决企业实际问题。