大数跨境
0
0

收听测量仪数据的正确打开姿势——下篇:数据特点

收听测量仪数据的正确打开姿势——下篇:数据特点 收视中国
2017-01-09
0
导读:作者王浩洁 首发“V传媒”2017年1月1日起,北京电台将正式停用以日记卡方式采集的收听率数据,全面启用测量




作者:王浩洁 

首发:“V传媒


2017年1月1日起,北京电台将正式停用以日记卡方式采集的收听率数据,全面启用测量仪收听数据。从2016年7月起,电台就已经开始对内提供测量仪数据作为日常参考,以便完成数据过渡。


在数据过渡期,我们对测量仪数据进行了观察。上篇旨在解决小伙伴们对测量仪技术方面的疑问,下篇将尝试总结测量仪数据的基本特性。


测量仪收听数据是传统的日记卡收听数据的升级换代产品。二者在很多地方是一脉相承的,两套数据有这样一些相同点:首先,不管是测量仪还是日记卡,基本的调查方式仍然是抽样调查,而不是普查。其次,两套数据均是连续性调查数据,是对听众365天24小时收听行为的调查。第三,样本替换均为规律性、渐进式替换,日记卡每周换户2%,一年内换完,测量仪年更新率为15%-25%。根据样本填写质量、参与调查历史等进行渐进式的样本替换,可避免造成因为样本大面积替换而产生的数据异常波动。第四,数据的指标体系完全一致,我们日常使用的收听率、市场份额、平均到达率等指标方面没有任何变化。


既然测量仪数据和日记卡数据都是听众收听行为的数据反馈,对同一个对象进行测量,又为什么会出现不同的数据?这主要是由数据收集的方法不同、样本量不同、数据精度不同等因素造成的。



1、终端:智能手机作为数据收集终端提高样本进入门槛


测量仪是通过安装在智能手机上的应用来完成数据收集的。这一收集方式事实上为样本的选取带来了一定的进入门槛。与日记卡相比,测量仪数据的样本框也确实出现了一些变化。首先是样本年龄的下限从10岁提升到了15岁,上不封顶。调查公司认为,通过智能手机“自主”选择收听的行为需要有一定的年龄底线,因此把样本的最低年龄提升到了15岁。15岁以下的儿童则被视为对智能手机没有完全的使用掌控权。其次,由于数据是通过智能手机采集的,不可否认的是,老年人对于智能手机的接触相对较少,且年龄越大,接触程度越低。因此,不排除部分老年听众样本,尤其是年龄在80岁以上的样本,在学习如何操作智能手机方面有难度,这对调查公司的具体执行能力提出了考验。作为数据使用方,我们也需要密切观察老年听众收听数据的变化来判断数据质量。



2、样本:不仅仅是样本量增加


与日记卡相比,测量仪数据在样本量上有了明显的提升。日记卡时代,索福瑞收听数据在北京地区的样本量是“300户”,被抽取的家庭户中10岁以上符合条件的所有家庭成员均为样本。按照平均每户2-4人的规模,实际样本人数在700-900人之间浮动。按户抽取样本是因为按固定的户籍门牌抽样能很好地完成“随机”抽取这一要求,且能够保证样本在各个城区按照人口密度等特点进行合理分布,从而提高样本代表性。新的测量仪数据仍然按户抽取样本。但抽取的是900-1200户,每户不再抽取所有人,而是仅抽取符合样本框条件的一个样本,所以样本量可以表述成“900-1200户”或“900-1200人”。


日记卡时代,当一户所有人口都被抽取时,尽管不同年龄、性别的家庭成员会有不同的生活场景,但仍然有很多全家共同出现的生活场景。换句话说,一个家庭就类似于簇生的蘑菇,样本之间会有部分行为相似。例如在早上,可能丈夫、妻子和孩子都在车上收听同一个频率。客观上会放大一些收听数据。测量仪则一户仅抽取一人。同样三个样本,日记卡时代可能因为这三个样本是同一个家庭的,于是监测到的情况是在同一个场景下收听了同一个内容。测量仪时代,三个样本就是三个家庭户,三个家庭户出现收听行为差异的可能性大大提高。这样的改变会让收听行为的多元化在数据方面表现的更为清晰,但同时也意味着数据的复杂性提高了。





3、行为:突破刻板印象,多维划分人群,呈现多元收听行为


在谈到收听行为的多元化趋势时,首先需要强调的是,并非收听测量技术改变了听众的收听行为,而是以前数据收集方式无法清晰展现这种客观存在的变化,决不能倒因为果。


日记卡时代,8分钟的填涂原则和回忆式填写的疏漏让收听数据上的马太效应有所放大。部分频率、节目的知名度通过“误填”,在数据上转化成了实际收听,有夸大的成分。而部分听众对非知名频率、节目和“低谷”时段的漏填和多远化选择也被掩盖在了回忆式填写的误差当中。测量仪还原了这种多元化的选择。比较明显的是高峰时段收听率的回落和低谷时段收听率上涨。如果更细致的观察数据,我们会发现,以往对细分人群关于生活状态的假设能够更好地在测量仪数据中得到佐证。例如,如同样是18-22岁年龄段的听众,学生和非学生在测量仪中收听的高峰和低谷就会出现区别。日记卡数据,这一区别则并不稳定和显著。这种数据上的区别可以进一步佐证我们对于不同人群划分的准确性,并为有针对性地制作内容产品提供有力的数据参考。另一个发现是,传统概念上的早晚高峰正在发生变化。测量仪数据显示,部分频率晚上8点以后的收听率甚至高于晚高峰。进一步拆解数据发现,晚高峰以后的收听人群在人群细分、内容选择等方面有显著差异。测量仪数据比日记卡数据更清晰地显示出细分人群的多元化收听行为,数据对收听行为的描述犹如从人像绘画提升到了人像照片。这为我们重新思考频率、节目、时段、人群价值带来了契机,也提示我们需要摆脱对广播市场的刻板印象,按照真实的市场变化趋势进行自我调整。


4、精度:更快数据反馈、更细数据颗粒、更个性化的参考


测量仪数据比日记卡数据的一个重要提升在于数据精度。日记卡数据的最小时间间隔是15分钟,测量仪数据最小间隔是1分钟。日记卡时代,一些时长低于15分钟的节目无法获取精确的数据,只能无奈地被包含在大时段数据当中。数据颗粒度精确到以1分钟为单位后,关于听众流动的数据将会逐渐成为新的分析领域。以往日记卡数据很难做听众流动分析,因为在15分钟这个尺度内,听众的行为是处于“黑箱”状态的,数据无法准确展现听众开关机或流出流入的确切时点和方向。测量仪数据则能够精确地展现听众流动的状态,这将为我们研究节目编排提供有力的数据支持。


从数据提供的频次来讲,除周末外,测量仪数据能够做到昨日数据今日下午拿到。这样的数据提供频次为我们的很多工作带来了便利条件。例如,突发事件的报道在隔天就能看到报道在数据方面的效果反馈。如果一个阶段性的策划报道,可以在报道执行过程中以收听数据为参考对报道方向、呈现形式等进行过程中的修正。总之,当数据颗粒度越小,精度越高时,我们可观察到的变化会越细微。这种类似于“像素”提升似的变化一方面会为我们的工作带来更多可靠的参考数据,另一方面,我们也需要对这种频繁的、各个尺度上的波动有心理准备。毕竟,精细化数据这个“放大镜”对于优点和缺点的放大是一视同仁的。


5、未来:大数据应用,道阻且长,行则将至


测量仪数据实际上也是借助大数据的处理方式来实现的,例如利用位置信息、移动速度信息等建立算法模型推断样本收听状态就是典型的大数据应用。对于广播从业者而言,复合传播模式逐渐形成传播常态时,对于大数据,尤其是对于听众多渠道收听行为的统和性数据需求越来越强烈。然而当前这方面的大数据存在着各种各样的问题。例如不同音频聚合平台之间的数据壁垒如何打破、单个音频聚合平台后台数据真实性的如何保证、听众通过不同渠道收听的行为数据如何实现排重和同源……


问题很多,现实障碍很多,但这不能成为阻止前行的借口。最近人民网研究院发布了《中国媒体融合传播指数报告》。报告中的广播部分的指数体系除收听率外,还引入了微博、微信、入驻聚合新闻客户端、入驻音频客户端和媒体自有APP等项。在这一报告的电台榜单中,北上广深电台无一能进入前十。尽管这个指标体系的构建尚有诸多未向公众公开的细节,例如权重如何确定,数据如何收集等。但这样的分析视野和实践值得学习。同时,也应该看到,其他地方电台在微信、微博等新的传播领域上确实领先于我们,这样的差距不容忽视。


收听数据的应用伴随着广播行业的发展不断进步,这条路溯洄从之,道阻且长。然荀子《修身》有云,路虽弥,不行不至;事虽小,不做不成。数据应用同理,客观看待,细致考究,积极实践,行则将至。



回顾上期请戳:

收听测量仪数据的正确打开姿势——上篇:技术问答




【声明】内容源于网络
0
0
收视中国
关注视频行业发展,聚焦电视媒体跨界融合传播,以严谨思考与专业分析,发掘分享数据价值,深入解读收视市场动态与热点。
内容 929
粉丝 0
收视中国 关注视频行业发展,聚焦电视媒体跨界融合传播,以严谨思考与专业分析,发掘分享数据价值,深入解读收视市场动态与热点。
总阅读4
粉丝0
内容929