主页 - IT -

广电大数据系统,能根除数据造假吗?

作者:CQITer小编 时间:2018-12-30 16:33

字号

图片来源@视觉中国

图片来源@视觉中国

文|网娱观察,作者|张嘎央

流量为王,这年头,掌握了好看的数据,便掌握了谈判的资本,而通往流量王座的道路,却充满了陷阱和套路。

据中国电视剧制作产业协会揭露,2016年,购买一集电视剧收视率的价格为30万至50万元,以20家卫视频道每年播出13000集电视剧计,全年有40多亿元被收视率造假相关方非法窃取。根据不同时段的播出需求,这个价格还可能更高。每年数十亿的收视率造假链条,已经为中国的电视产业带来了不小的隐患。

业界和相关部门已经注意到了问题的严重性,也一直在摸索改善的方法,最新的动作是:12月26日,广电总局召开新闻发布会,宣布“广播电视节目收视综合评价大数据系统”基本建成并开通试运行,湖南、浙江、上海、江苏、安徽等全国几十家广播电视台皆有代表出席。

不是仅有一纸文件,靠口头呼吁,而是建立了一个全新的系统。这是否意味着政府牵头,民间结盟,将要针对根深蒂固的收视率造假问题开展一番“铁腕整治”呢?盘踞在行业上空多年的乌云,又能否就此散去呢?

数据造假,电视行业的“隐形炸弹”

很难想象一个成熟的行业,长期以来都在用被污染的数据自娱自乐、自欺欺人,不想着去提高电视作品质量,解决根本的问题,反而忙于用数据粉饰早已溃烂的创口,这就像怀抱着一个看不清倒计时的炸弹一样。

数据造假对平台、制作方、观众三方,都并非一种健康的现象。收视率造假,数据不断创下所谓“新高”,形成明星影响力的“泡沫”,导致追星炒星、高价片酬,从而推高制作成本,不仅让平台不堪重负,且拉低作品质量,这又需要亮眼的收视率来“挽尊”,最终形成一个破坏行业秩序生态的恶性循环。

在市场空间不断被拓宽的今天,量化行业繁荣真实性的数据计量方式却没有跟上,依然沿用着上世纪80年代中期开始运行的系统。这就让“造假”有机可乘。

2009年艾杰比尼尔森媒介研究撤离中国市场后,中国广视索福瑞媒介研究(CSM)便成为量化收视率的唯一权威机构。据索福瑞官网显示,其总样本家庭为5.82万余户,25个省级收视调查网的样本用户为17250个,117个城市收视调查网的样本户有21000个。

广电大数据系统,能根除数据造假吗?

如此一来,某个地区的“收视高低”,其实仅仅只由少则几百多则上千个家庭决定,数量最多的重庆,也仅有1300多户。5万多户样本,代表着全国13亿人口的收视习惯——可以说是我国电视行业颇具魔幻色彩的一个缩影。

样本数量少的同时,采集方式也相当落后。现行的日记卡和收视率测量仪,前者由样本户手工填写收视日记卡,后者则为样本户配备专门的遥控器,按下代表个人信息的代码键后,数据就会回传给调查公司。两者都有人为操纵的可能,事实上,也的确遭受了严重的污染。

针对样本少,易污染的问题,广电运行的“广播电视节目收视综合评价大数据系统”,还是颇有对症下药的意味。首先是针对样本量不足,官方宣布,截至2018年底,该系统来自不同地域的样本,有线电视用户达2254万,IPTV用户收视数据达1969万,大大丰富了样本数量。

而在促进公平性真实性方面,广电认为大数据系统具有以下三个优势:

其一,“大覆盖”。系统初期,汇集4000万有线电视和IPTV样本用户的收视数据,全面涵盖直播、回看、点播等多种收视方式,并将逐步扩展至数亿级样本规模,实现样本全覆盖。

其二,“全留痕”。如某城市500万用户,如果从中抽样选取500个样本用户,那么这500个样本用户没有看过的节目均会被统计为“零收视”;而在系统的大样本统计中,即使1‰的低收视率也会记录留痕。

其三,“可忽略”。同样对于500万用户的某城市,如果针对某节目污染500个抽样中的5个样本用户数据,该节目的收视率可提升或降低1%。如果该节目的真实收视率为2%,统计偏差可达50%。而对本系统而言,这种情况仅会对该节目的收视率影响百万分之一,统计误差基本可忽略不计。

责任编辑:CQITer新闻报料:400-888-8888   本站原创,未经授权不得转载
关键词 >>大数据 广电 投稿
继续阅读
热新闻
推荐
关于我们联系我们免责声明隐私政策 友情链接