大数跨境
0
0

中国各城市首轮感染高峰期预测!

中国各城市首轮感染高峰期预测! 数据分析与统计学之美
2022-12-16
0

作者:chenqin@知乎,经济学研究者

编辑来源:Datawhale

对台湾地区、香港特别行政区和日本的感染情况与“发烧”搜索指数进行了分析,发现一个可能可以帮助预测感染高峰期的方法:
1. 将Google搜索指数分为疫情期间和非疫情期间,非疫情期间的发烧指数平均数为
,将疫情期间的搜索指数做以下处理后加总,计算一个数值
其中S的含义是这样的:如果发烧的搜索是发烧人口的一个相对稳定的比例,且在非疫情期间发烧人口是总人口的相对稳定的比例,那么S就正比于疫情感染的人口占总人口的比例,我们把它叫做“超额发烧搜索指数累计面积
2. 下图列出了台湾地区、香港特别行政区以及日本的“超额发烧搜索指数累计面积”,即下图橙色面积、蓝色面积和灰色面积。
我们发现在这三个地区,当疫情达到顶峰时,这个“超额发烧搜索指数累计面积”的数值全部刚好达到80。这两个地区第一波疫情结束时,香港特别行政区的面积达到了160,台湾地区的面积达到了200,日本的最终面积是250。
3. 如果用百度搜索指数做类似的研究会有什么效果呢?我使用了本轮疫情进入群体感染最快、最早的石家庄、邢台和保定做了计算:
可以算出,从疫情开始后计算,石家庄的“超额发烧搜索指数累计面积”已经达到了76,邢台已经达到了67,保定也达到了71。由此来看,百度搜索指数和Google指数分别算出的“超额发烧搜索指数累计面积”,至少是在一个差不多的数量级上。
4. 考虑到保定、石家庄、邢台等地的发烧指数仍然在上升,以及百度搜索指数和Google指数的差异,我们比较保守地将100作为疫情达峰时的“超额发烧搜索指数累计面积”,将250作为第一轮疫情结束时的“超额发烧搜索指数累计面积”。那么我们通过每个城市的搜索指数累计增长,累计速度,就可以算出现在每一个有疫情的城市疫情达峰的时间,以及疫情结束的时间。
这是计算的结果,列出了所有能在明年春节前达峰的城市以及这些城市在达峰前已经感染的人口比例(截止至12月10日)。
2022年12月12日更新:
数据不足,方法简陋,供参考。
推荐阅读    点击标题可跳转
0. 深度对比Python4大文件/文件夹处理库!
1. Python快速实现分列转到行!
2. 对比学习12款Python数据可视化库!
3. 如何用Python分析股票收益率?
4. pprint漂亮的打印,强烈推荐大家学习这个库!
5. 数据分析方法论,大总结!
6. 有了这款Python神器,新手也会调试代码!
7. Pandas与openpyxl库的 "完美" 融合!
8. Python提取PDF简历中的信息,写入Excel
9. Linux系列:完美收官,一共22个课时!
10. Python操作MySQL数据库!
11. 一个「神奇」的Python库,99%的人都爱!
12. 对比Excel/MySQL/Python,讲述if的使用原理!
13. 坐地铁,就能学会的3种"非常有趣"的Python玩法!-1
14. 坐地铁,就能学会的3种"非常有趣"的Python玩法!-2

【声明】内容源于网络
0
0
数据分析与统计学之美
免费领10w字"Python知识手册",共400页,后台回复“十万”领取!
内容 1080
粉丝 0
数据分析与统计学之美 免费领10w字"Python知识手册",共400页,后台回复“十万”领取!
总阅读76
粉丝0
内容1.1k