关键词:维恩,韦恩图,R语言,交集,互联网,比重,VennDiagram,sql
在数据分析过程中,会遇到一种情况就是做一件事的方式有两种,例如,用户启动app的方式有:
自自动;
push拉起启动;
第三方拉起;
library (VennDiagram)
library(tidyverse)
library(RPresto)
library(DBI)
con <- dbConnect(RPresto::Presto(), host = "0000000", port = 0000, user = "yanagishima",
schema = "default", catalog = "hive", source = "yanagishima")
dt <- dbGetQuery(con,"select udid,parameters['from'] as c
from dwd_logs.dwd_mpjs_log_fudid
where dt = '20180901' and parameters['from'] in ('1','2','3','4','5')
and eventid = 'app_start' group by 1,2 limit 1000000")
a <- filter(dt,c == 1)
b <- filter(dt,c == 2)
c <- filter(dt,c == 3)
d <- filter(dt,c == 5)
venn.diagram(x=list(a=a$udid, b=b$udid,c=c$udid), "My6.png")
结果如下:
客官可以看人的行为交集,并集等信息,有助于理解业务。
而不是单纯的,1 多少,2 多少,3多少人,这样交集是信息缺失的。
文氏图(英语:Venn diagram),或译Venn图[1]、温氏图、维恩图、维恩图解、范氏图、韦恩图等,是在集合论(或者类的理论)数学分支中,在不太严格的意义下用以表示集合(或类)的一种草图。它们用于展示在不同的事物群组(集合)之间的数学或逻辑联系,尤其适合用来表示集合(或)类之间的“大致关系”,它也常常被用来帮助推导(或理解推导过程)关于集合运算(或类运算)的一些规律。

