大数跨境

大数据对制作人有什么用?先从弄清节目“性别”说起(绝对干货)

大数据对制作人有什么用?先从弄清节目“性别”说起(绝对干货) 话娱
2015-12-15
2
导读:文|宋秉华你的节目是男的、女的还是不男不女的?记得是今年3月的时候,我与我的同事龙云飞先生曾经有过一场争论,

文|宋秉华(土豆娱乐节目制作中心总经理);转载请注明作者、来源


你的节目是男的还是女的?


记得是今年3月的时候,我与我的同事龙云飞先生曾经有过一场争论,争论的话题是:“《奔跑吧兄弟》到底更受男生欢迎,还是更受女生欢迎?”


我认为更受女生欢迎,原因很简单,我所在的一个夫妻为主的微信群里,太太们对这个节目的讨论更加热烈,提及的时候用词也更加狂热。


但是我的同事并不认同这一观点,他认为这个节目之所以女生讨论比较多,主要是女性比男性在社交媒体上更倾向于分享,不论是从他的朋友圈来看,还是从微博上来看,都是如此。


“因此,并不能说明这个节目更受女性欢迎,男人同样很喜欢。”


这确实是一个僵局问题,我与我的同事所收获的信息,都是一种直观的感受,而非经过严谨调研的数据。


于是,我们决定进行一点数据的研究来找到这个问题的答案。


我们找到了优酷土豆视频大数据中心的Lionel杜长嵘先生以及Zoe廖逸竹小姐帮我们解答这个问题。


幸运的是这个节目在我们平台有播出,因此,我们几乎可以记录这个节目每一个观众的每一秒用户行为。同时,通过观众问卷调查,我们可以基于百万级的可识别用户,仔细观察我们的观众构成。


不要看绝对数值,要看TGI


相比较其他的视频网站,优酷土豆的大数据中心有着很特殊的地位:首先他们的数据量非常大,非常全,包括UGC、PGC、版权、自制内容都包括。这使得我们进行数据比对可以从更全面的维度上进行。


其次是,优酷数据中心拥有百万级的样本用户数据,这些样本用户的信息通过用户线上问卷调研采集样本,再经配比清洗以规避样本偏差。


数据中心的Lionel,首先帮我们观测了所有已经填写了问卷调查的样本用户中,观看了《奔跑吧兄弟》第一季和第二季的男女观众比例。


从绝对人口来看,显然答案是我错了。




男性比例明显高于女性。但这仍然让我不死心,这与我的整体观感差别太大了。


我随后继续与数据中心的同事讨论,数据大神们表示:仅仅通过绝对人数比例来定义一个节目更偏男性或女性是不客观的。事实上这个数据恰恰说明这个节目更受女性观众欢迎。原因很简单:


网络视频的观众,具体到网络综艺的观众性别比例,男性本来就远高于女性;

2015年8月,优酷全站的男性观众占比58%,女性占比42%;

2015年9月,优酷全站男性观众占比60%,女性40%。


也就是说,基本上,《奔跑吧兄弟》的男女观众比例,男性还是略低的。


这里,就需要引入一个叫做TGI的概念。

TGI:即Target Group Index(目标群体指数),可反映目标群体在特定研究范围(如地理区域、人口统计领域、媒体受众、产品消费者)内的强势或弱势。


通俗地讲,当我们根据一个数字来讨论一个倾向性的时候,我们应该看我们得到的这个数字,在整体这个数字维度的平均水平上,是更大还是更小,而非根据这个数字本身来做判断。


或者更简单地说:这个数字说明的意义,与它本身绝对值的大小并无必然关系。但是可以统一到TGI维度来表示。当TGI大于100的时候,说明这个数字表示更大、更倾向于或更强势,当TGI小于100的时候,表示更小、更不倾向于、更弱势。


回到《奔跑吧兄弟》,我们来看一下它的性别TGI。



上图黄色圆圈中的指标,是女性观众的TGI。当女性大于TGI大于100的时候,通常男性TGI就会小于100。


也就是说:这个节目更受女性观众欢迎。


NB的“播放完成比”


数字的解读到这里似乎可以印证这个观点了,但是我们还不太死心,毕竟5个TGI指数的差别,力度还小了一点。


我们提出了一个新的问题:会不会女生看这个节目看的时间更长呢?如果是,那么结论就有力多了。


数据中心给我们的建议,是通过一个叫做“播放完成比”的数值为度进行比较。


所谓播放完成比,是基于所有看过这个节目的观众平均每次观看节目的时长,除以节目的总时长之后得出的数值。


这个数值非常的有力,显然一个节目,谁看的时间更长,当然就更受谁的欢迎。

于是我们把男性观众观看跑男的播放完成比,与女性观众的播放完成进行了一个直接的对比。结论如下:




从对比数据来看,女性的观看时长较为明显的高于男性。所以,结论:《奔跑吧兄弟》更受女性欢迎。


基于这个观察,我们不得不说要对《奔跑吧兄弟》的节目组表示敬意,因为他们在第三季做了一个非常正确的决定选择备受女性观众欢迎的鹿晗加盟。


在得出这一结论之后,我们又验证了如下几个节目的男女比例播放完成的数据:


《万万没想到》



《晓说》


《花千骨》



《最强大脑》



大多数情况下,女生只要开始看一个节目,就会比男生更有耐心一点。当然也有例外,比如:《晓说》这样的纯粹男性向节目。


《花千骨》这样的古装戏,几乎主要是女性市场了。与之对应的是《万万没想到》这样的纯粹男屌丝倾向的短剧。


制作人直觉的谬误


或许会有制作人说:“这个需要数据吗?直觉就能看到了啊?”是的,直觉经常是对的,但也有可能是错的。举个例子来考验大家的直觉:


《快乐大本营》的片头是45秒,《万万没想到》的片头是5秒,在网络上进行观看时,哪一个节目片头更容易被观众拖拽进度条跳过?


是的,我们与大家的直觉判断一致,网络观众没耐心,《快乐大本营》的片头更长,所以更容易被跳过。


但真实答案是:拖拽率一样。观众对一个片头选择跳过,只与他看过这个片头多少次有关,与片头本身的长度无关。


所以,一个节目理论上,上线时间越久,片头越容易被跳过。本身的长度没多大问题。


举这个例子是想说明:一个制作人的直觉,很多情况下都会对的,但一定也有很多时候是错的。而要验证这个逻辑,通过数据是最精准、最快速和最低成本的答案。否则,我们就要花费很长时间和很高成本来得出这个结论。


了解一个节目的性别之后,我们甚至可以进一步了解某一种节目的类型的观众性别。从目前已知的数据来看,我们可以有如下几个结论:


1) 电视剧大部分都是女性观众为主的。(《来自星星的你》更容易现象级)

2) 搞笑类内容大部分都是男性观众为主。

3) 游戏类内容男性观众占绝对大多数。

4) 全部综艺类内容整体男女差别不大,但单个节目差别很大。


以上结论并非全部,仅是一些可供参考的数据。


“鱼”与“熊掌”如何兼得?!


从节目类型上来看,搞笑类内容男性观众高达68%,这一数据同时也是《万万没想到》的男性观众比例。《万万没想到》的第二季,甚至比第一季的男性比例还要高。不知道您注意到没有,《万万没想到》从第三季开始,就一定会在剧情中摆放一些非常漂亮的女配角。


今年以来,优酷土豆刘柳团队在研发《好笑头条君》这个项目的时候,从一开始就明确了这个喜剧节目必须以男性为主。这一点,在他们的节目VI上就得到了清晰体现。




所以,这个节目势必在选题、立意、视觉表达的方面应该更符合男性的需求。

于是节目组进行的选题大都表达男性立场,来看一下第一期时,他们进行的主题选择:


1) VCR《你怎么能出轨呢?》

2) 歌曲《可是你还是没有女朋友》

3) VCR《呐喊——我不想当高富帅!》

4) 广告APP推荐《人生GPS,为您的人生导航》

5) VCR 《股票大涨!》


从选题上来看,表达的已经大多数都是男性观众所面对的问题。


接下来对的问题就又来了:我们真的就放弃女性观众了吗?也有40%的观众呢啊?


于是,为了不丢失节目基本观众,同时又在对女性吸引力上加强,节目组从演员颜值配置上进行了有效的补充,采用大量男性高颜值演员,以补充对女性吸引力的不足:


1) 主持人:贾乃亮

2) VCR《你怎么能出轨呢?》——演出:佟大为

3) VCR《呐喊:我不想当高富帅!》——演出:马可(《花千骨》杀阡陌)

4) VCR 《股票大涨》——演出:韩庚

5) VCR 《黑暗料理》——演出:黄维德


那么,结果如何呢?很遗憾,这种一厢情愿的调整失败了。


节目的第一期观众男性观众占比仍然高达82%,甚至远远高于了一般搞笑节目的男性比例。这一严重的比例失调对节目来说不得不说是一种损伤,如同龙云飞先生所说的那样,女性更热衷于分享,这使得节目在自我传播能力上受到了一定程度的损失。


相信大多数节目都会追求男女通杀,但是对于制作人而言,充分了解某一类型的节目更容易吸引男性,还是更容易吸引女性,以及通过怎样的动作将使得你的节目具有更加平衡的性别对比,一定可以极大地促进节目的影响力。


所以,问题来了,尊敬的制作人,您的节目是男的,还是女的,还是不男不女的呢?


(最后插播一句:对于网络节目而言,基本上男女比例6:4是健康的,对于电视观众而言,则反之


视频大数据有哪些维度?


好吧,我不得不承认,原本想把这篇科普文写得通俗易懂些,但还是越写越难懂了。


不如,索性我们就更专业一些吧。


是时候我们来完整的透视整个网视都有哪些数据维度来供我们思考了。


1) VV(Video View)——播放次数




VV是目前中国一个视频网站的重要指标,也是视频页面通常显示的播放数字,VV表示一个视频被播放了多少次。


举例,一集《万万没想到》会有数千万的VV,而一集《快乐大本营》可能也有上千万的VV。


需要注意的是VV这个维度仅仅统计了一个视频播放的“次数”,而不能告知我们具体每一次播放实际播放了多少时间。数千万的《万万没想到》的VV中,大部分的播放都属于完整播放,但也有可能有的播放仅仅有数秒时间。


简单地说,当一个视频的前贴广告都播放完,且正片开始播放了,我们就可以统计为一个VV


但通常情况下,在我们的数据统计中,低于5秒的播放,我们视之为“无效VV”,反之则称之为“有效VV”。


那么,是不是当一个视频有1000万VV的时候,我们就能说:有一千万人观看了这个视频呢?答案当然是:不这里就牵扯到第二个维度:UV。


2) UV(Unique Visitor)播放用户数


熟悉电视收视率的观众会知道,所谓收视率,按照不同的统计范围,各有一个“推及人口”的模糊数字。


比如:50城收视率,每一个点的收视率,大概就是可以推算出,相当于200万人口看了这个节目。全国网数据,每一个点的收视率,默认推算出1200万收视人口。


而视频网站的UV,相当于这个意思:总共有多少人看过这个视频。


从视频网站的统计中,通常单一个视频,平均每个人约看1.5次(一天内),因此一天之中的每10个VV,大概会来自于7个UV。也就是说,其中至少有3个人(UV),看视频的时候中断了一下,分成了两段来看或者看了两遍。


VV和UV的绝对数量,已经大概可以反映一个节目的受欢迎程度,但是视频数据的能量远不止如此,比如下一个指标:TS


3) TS(Time Span)播放时长


TS是指观众在观看这个节目的时候,总共观看了多少秒钟。


TS的指标对于节目品质的指导意义更强。当一个节目获得更长的TS,意味着观看节目的人更多,或者观看的时间更长。


在视频网站的统计中,通常统计这个节目总共产生了多少时间的观看。


比如:《万万没想到》第二季,共产生了79840000小时的TS,换算一个人生命是四万小时的话,相当于一个人轮回转世2000多回,从公元0年开始,每次轮回生下来到死不吃不喝光看《万万没想到》了……


我个人的看法,TS总是一个绝对量,但数据总是要对比才有趣,所以就有下一个维度,叫做:播放完成比。


4) 播放完成比(好吧这个指标没有英文)


通常情况下,一个五分钟长度的综艺节目,播放完成比的标准线(Benchmark)是50%左右。如果低于这个Benchmark,则表示节目受欢迎程度偏低。


一个10-15分钟的综艺节目,播放完成比的平均标准则降低到了42%。


实际上就是这样,节目时长越长,播放完成比标准线就会越低。


那么,现在最常见的75分钟以上的综艺节目,在网络上的平均播放完成比,会达到多少呢?请不必难过:仅仅17%左右。


之所以请大家不要难过,是因为同样维度下,综艺的播放完成比还是比较高的……如果把所有时长超过75分钟的节目,按照播放完成比来排一个类型顺序的话,基本上是:


电视剧>电影>动漫>综艺>资讯>纪录片>教育……


看来中国人还真是不太爱学习…………


播放完成比看起来已经是一个很有说服力的数据维度了,那么还有没有更有说服力的呢?有的,而且有两个。


5) 关闭时间点




上面这张图,绝大部分电视人都很熟悉,是某个电视台的某个节目从18:00-19:00的收视率分钟曲线。看起来这节目还不错不是吗?


网络视频也有类似的分钟曲线图,只是精度是每10秒。来看下面这张。




这是某个网络节目的曲线图,其中每个点,指的是在这个时间点上,还有多少观众没有关闭整个视频。


在网视中,由于所有的节目都是从第一秒开始播放,所以任何一个节目都避免不了“观众随时可能关闭视频”的命运。而从哪个点关闭的人数最多,则充分的可以说明这个点上的节目内容观众已经忍耐不了了。


针对上图,我们可以发现在7分到7分30秒左右,观众关闭的行为忽然增多,可以说明这一时间点(以及之前的)的内容吸引力出现了问题。


视频数据由于可以精准记录每一个观众的每一秒用户行为,这使得我们几乎可以讲节目研发当做一项科研来进行研究。同时由于视频数据的快速反应能力,即便在节目生产过程中,数据也可以快速反应给制作人,使得制作人获取更快速以及更加精准的节目判断。


“广电独家”是广电业界第一订阅号,“影视独家”深度透视影视产业规律,由北京中广传华影视文化咨询有限公司运营,新版微信长按二维码图可直接订阅



【声明】内容源于网络
0
0
话娱
话说泛娱乐资本平台
内容 3502
粉丝 0
话娱 话说泛娱乐资本平台
总阅读5
粉丝0
内容3.5k