大数跨境
0
0

中国各城市首轮感染高峰期预测!

中国各城市首轮感染高峰期预测! 数据分析不是个事儿
2022-12-16
0
导读:永远不要🐏!



作者:chenqin 链接:https://zhuanlan.zhihu.com/p/590989182




我对台湾地区、香港特别行政区和日本的感染情况与“发烧”搜索指数进行了分析,发现一个可能可以帮助预测感染高峰期的方法:

1. 将Google搜索指数分为疫情期间和非疫情期间,非疫情期间的发烧指数平均数为


,将疫情期间的搜索指数做以下处理后加总,计算一个数值


其中S的含义是这样的:如果发烧的搜索是发烧人口的一个相对稳定的比例,且在非疫情期间发烧人口是总人口的相对稳定的比例,那么S就正比于疫情感染的人口占总人口的比例,我们把它叫做“超额发烧搜索指数累计面积

2. 下图列出了台湾地区、香港特别行政区以及日本的“超额发烧搜索指数累计面积”,即下图橙色面积、蓝色面积和灰色面积。

我们发现在这三个地区,当疫情达到顶峰时,这个“超额发烧搜索指数累计面积”的数值全部刚好达到80。这两个地区第一波疫情结束时,香港特别行政区的面积达到了160,台湾地区的面积达到了200,日本的最终面积是250。

3. 如果用百度搜索指数做类似的研究会有什么效果呢?我使用了本轮疫情进入群体感染最快、最早的石家庄、邢台和保定做了计算:

可以算出,从疫情开始后计算,石家庄的“超额发烧搜索指数累计面积”已经达到了76,邢台已经达到了67,保定也达到了71。由此来看,百度搜索指数和Google指数分别算出的“超额发烧搜索指数累计面积”,至少是在一个差不多的数量级上。

4. 考虑到保定、石家庄、邢台等地的发烧指数仍然在上升,以及百度搜索指数和Google指数的差异,我们比较保守地将100作为疫情达峰时的“超额发烧搜索指数累计面积”,将250作为第一轮疫情结束时的“超额发烧搜索指数累计面积”。那么我们通过每个城市的搜索指数累计增长,累计速度,就可以算出现在每一个有疫情的城市疫情达峰的时间,以及疫情结束的时间。

这是计算的结果,列出了所有能在明年春节前达峰的城市以及这些城市在达峰前已经感染的人口比例(截止至12月10日)。

  • 12月12日更新:

  • 12月13日更新:

  • 12月14日更新:

今天的更新有三个大的改动。

第一是加入了巨量算数指标修正了一些城市,加入了一些之前数据不足的城市。

第二是我将过峰的“超额发烧搜索累计面积”修正回了80。

之前的几张表格中,保守起见,这个数值我使用的是100,他会使一些城市过峰偏慢。但从这几天的数据看,石家庄、保定等地已经过峰,这说明中国内地城市居民,在非疫情-疫情的变化中,搜索行为的变化上和香港特别行政区、台湾地区的居民在同样时期的变化是非常类似的。因此一些城市会在今天的表格中有所提前。

第三是加入了“结束进度条”这一变量,代表已经度过疫情顶峰的城市在第一波疫情结束前可能还要走的路程。


  • 12月15日更新:

今天按照行政区划代码的顺序做了排序,增加了一个变量“累计感染占总人口比值”。这个数值也是根据累计的超额搜索面积计算的。在“数据团+”小程序中也做了相应更新。一些人口较少的城市的搜索指数变化幅度较大,可能会导致数据波动。

数据不足,方法简陋,供参考。


END

年末更需要抓紧时间读书充实自己啊,

之前每周都会给大家送实体书,
但并不是每个人都能抽到。
这次直接给大家分享数据分析书籍电子大礼包
200+!
感兴趣的可以点击文末“阅读全文”获取!
PS:为了明年公众号的内容内容,
麻烦大家填一下问卷哈

【声明】内容源于网络
0
0
数据分析不是个事儿
分享数据人的干货!
内容 1307
粉丝 0
数据分析不是个事儿 分享数据人的干货!
总阅读0
粉丝0
内容1.3k