广电大数据系统，能根除数据造假吗？

作者：CQITer小编时间：2018-12-30 16:33

字号

图片来源@视觉中国

文｜网娱观察，作者｜张嘎央

流量为王，这年头，掌握了好看的数据，便掌握了谈判的资本，而通往流量王座的道路，却充满了陷阱和套路。

据中国电视剧制作产业协会揭露，2016年，购买一集电视剧收视率的价格为30万至50万元，以20家卫视频道每年播出13000集电视剧计，全年有40多亿元被收视率造假相关方非法窃取。根据不同时段的播出需求，这个价格还可能更高。每年数十亿的收视率造假链条，已经为中国的电视产业带来了不小的隐患。

业界和相关部门已经注意到了问题的严重性，也一直在摸索改善的方法，最新的动作是：12月26日，广电总局召开新闻发布会，宣布“广播电视节目收视综合评价大数据系统”基本建成并开通试运行，湖南、浙江、上海、江苏、安徽等全国几十家广播电视台皆有代表出席。

不是仅有一纸文件，靠口头呼吁，而是建立了一个全新的系统。这是否意味着政府牵头，民间结盟，将要针对根深蒂固的收视率造假问题开展一番“铁腕整治”呢？盘踞在行业上空多年的乌云，又能否就此散去呢？

数据造假，电视行业的“隐形炸弹”

很难想象一个成熟的行业，长期以来都在用被污染的数据自娱自乐、自欺欺人，不想着去提高电视作品质量，解决根本的问题，反而忙于用数据粉饰早已溃烂的创口，这就像怀抱着一个看不清倒计时的炸弹一样。

数据造假对平台、制作方、观众三方，都并非一种健康的现象。收视率造假，数据不断创下所谓“新高”，形成明星影响力的“泡沫”，导致追星炒星、高价片酬，从而推高制作成本，不仅让平台不堪重负，且拉低作品质量，这又需要亮眼的收视率来“挽尊”，最终形成一个破坏行业秩序生态的恶性循环。

在市场空间不断被拓宽的今天，量化行业繁荣真实性的数据计量方式却没有跟上，依然沿用着上世纪80年代中期开始运行的系统。这就让“造假”有机可乘。

2009年艾杰比尼尔森媒介研究撤离中国市场后，中国广视索福瑞媒介研究（CSM）便成为量化收视率的唯一权威机构。据索福瑞官网显示，其总样本家庭为5.82万余户，25个省级收视调查网的样本用户为17250个，117个城市收视调查网的样本户有21000个。

如此一来，某个地区的“收视高低”，其实仅仅只由少则几百多则上千个家庭决定，数量最多的重庆，也仅有1300多户。5万多户样本，代表着全国13亿人口的收视习惯——可以说是我国电视行业颇具魔幻色彩的一个缩影。

样本数量少的同时，采集方式也相当落后。现行的日记卡和收视率测量仪，前者由样本户手工填写收视日记卡，后者则为样本户配备专门的遥控器，按下代表个人信息的代码键后，数据就会回传给调查公司。两者都有人为操纵的可能，事实上，也的确遭受了严重的污染。

针对样本少，易污染的问题，广电运行的“广播电视节目收视综合评价大数据系统”，还是颇有对症下药的意味。首先是针对样本量不足，官方宣布，截至2018年底，该系统来自不同地域的样本，有线电视用户达2254万，IPTV用户收视数据达1969万，大大丰富了样本数量。

而在促进公平性真实性方面，广电认为大数据系统具有以下三个优势：

其一，“大覆盖”。系统初期，汇集4000万有线电视和IPTV样本用户的收视数据，全面涵盖直播、回看、点播等多种收视方式，并将逐步扩展至数亿级样本规模，实现样本全覆盖。

其二，“全留痕”。如某城市500万用户，如果从中抽样选取500个样本用户，那么这500个样本用户没有看过的节目均会被统计为“零收视”；而在系统的大样本统计中，即使1‰的低收视率也会记录留痕。

其三，“可忽略”。同样对于500万用户的某城市，如果针对某节目污染500个抽样中的5个样本用户数据，该节目的收视率可提升或降低1%。如果该节目的真实收视率为2%，统计偏差可达50%。而对本系统而言，这种情况仅会对该节目的收视率影响百万分之一，统计误差基本可忽略不计。

责任编辑：CQITer新闻报料：400-888-8888 本站原创，未经授权不得转载

关键词 >>大数据广电投稿

继续阅读

热新闻