广电大数据系统,能根除数据造假吗?
作者:CQITer小编 时间:2018-12-30 16:33
![]()
图片来源@视觉中国
文|网娱观察,作者|张嘎央
流量为王,这年头,掌握了好看的数据,便掌握了谈判的资本,而通往流量王座的道路,却充满了陷阱和套路。
据中国电视剧制作产业协会揭露,2016年,购买一集电视剧收视率的价格为30万至50万元,以20家卫视频道每年播出13000集电视剧计,全年有40多亿元被收视率造假相关方非法窃取。根据不同时段的播出需求,这个价格还可能更高。每年数十亿的收视率造假链条,已经为中国的电视产业带来了不小的隐患。
业界和相关部门已经注意到了问题的严重性,也一直在摸索改善的方法,最新的动作是:12月26日,广电总局召开新闻发布会,宣布“广播电视节目收视综合评价大数据系统”基本建成并开通试运行,湖南、浙江、上海、江苏、安徽等全国几十家广播电视台皆有代表出席。
不是仅有一纸文件,靠口头呼吁,而是建立了一个全新的系统。这是否意味着政府牵头,民间结盟,将要针对根深蒂固的收视率造假问题开展一番“铁腕整治”呢?盘踞在行业上空多年的乌云,又能否就此散去呢?
数据造假,电视行业的“隐形炸弹”很难想象一个成熟的行业,长期以来都在用被污染的数据自娱自乐、自欺欺人,不想着去提高电视作品质量,解决根本的问题,反而忙于用数据粉饰早已溃烂的创口,这就像怀抱着一个看不清倒计时的炸弹一样。
数据造假对平台、制作方、观众三方,都并非一种健康的现象。收视率造假,数据不断创下所谓“新高”,形成明星影响力的“泡沫”,导致追星炒星、高价片酬,从而推高制作成本,不仅让平台不堪重负,且拉低作品质量,这又需要亮眼的收视率来“挽尊”,最终形成一个破坏行业秩序生态的恶性循环。
在市场空间不断被拓宽的今天,量化行业繁荣真实性的数据计量方式却没有跟上,依然沿用着上世纪80年代中期开始运行的系统。这就让“造假”有机可乘。
2009年艾杰比尼尔森媒介研究撤离中国市场后,中国广视索福瑞媒介研究(CSM)便成为量化收视率的唯一权威机构。据索福瑞官网显示,其总样本家庭为5.82万余户,25个省级收视调查网的样本用户为17250个,117个城市收视调查网的样本户有21000个。
![]()
如此一来,某个地区的“收视高低”,其实仅仅只由少则几百多则上千个家庭决定,数量最多的重庆,也仅有1300多户。5万多户样本,代表着全国13亿人口的收视习惯——可以说是我国电视行业颇具魔幻色彩的一个缩影。
样本数量少的同时,采集方式也相当落后。现行的日记卡和收视率测量仪,前者由样本户手工填写收视日记卡,后者则为样本户配备专门的遥控器,按下代表个人信息的代码键后,数据就会回传给调查公司。两者都有人为操纵的可能,事实上,也的确遭受了严重的污染。
针对样本少,易污染的问题,广电运行的“广播电视节目收视综合评价大数据系统”,还是颇有对症下药的意味。首先是针对样本量不足,官方宣布,截至2018年底,该系统来自不同地域的样本,有线电视用户达2254万,IPTV用户收视数据达1969万,大大丰富了样本数量。
而在促进公平性真实性方面,广电认为大数据系统具有以下三个优势:
其一,“大覆盖”。系统初期,汇集4000万有线电视和IPTV样本用户的收视数据,全面涵盖直播、回看、点播等多种收视方式,并将逐步扩展至数亿级样本规模,实现样本全覆盖。
其二,“全留痕”。如某城市500万用户,如果从中抽样选取500个样本用户,那么这500个样本用户没有看过的节目均会被统计为“零收视”;而在系统的大样本统计中,即使1‰的低收视率也会记录留痕。
其三,“可忽略”。同样对于500万用户的某城市,如果针对某节目污染500个抽样中的5个样本用户数据,该节目的收视率可提升或降低1%。如果该节目的真实收视率为2%,统计偏差可达50%。而对本系统而言,这种情况仅会对该节目的收视率影响百万分之一,统计误差基本可忽略不计。


