从系统开通试运行至今近三年,总局广播电视节目收视综合评价大数据系统对行业产生了深刻影响。该系统的核心架构是怎样的?系统突出创新和关键应用如何?下一步工作重点是什么?近日,《广电时评》记者对总局广播电视规划院节目综合评价大数据研究中心负责人进行了专访。



作者:江勇


“嗡嗡嗡。”

 

走进总局节目收视综合评价大数据系统的通讯网络机房,轰鸣的空调声响让录音笔罢了工。


总局节目收视综合评价大数据系统的通讯网络机房。


一排排机架上,数百台服务器、交换机、路由器高速运转着,无数数据以二进制形式在这里汇集、储存、运算,它们最终成为收视表上一串串专业的数字。

 

节目综合评价大数据研究中心负责人说:“全国超过3亿(有线电视、IPTV、互联网电视)用户收视数据汇聚在此,这里相当于整个系统的‘大脑’和‘库房’。”

 

2018年12月26日,总局广播电视节目收视综合评价大数据系统开通试运行。近三年来,依靠真实无污染的收视统计数据和分析,系统为舆论引导、节目播出管理等提供了重要支撑,也成为电视台等单位日常考核、广告招商等工作的主要参考。


 

“国家队数据”“无污染数据”“脱水数据”等,是行业对收视综合评价大数据系统的基本认知,但关于这套系统如何创建、如何运转、有哪些创新特色等深入问题,所涉不多。近日,《广电时评》记者对总局广播电视规划院节目综合评价大数据研究中心负责人进行了专访,揭秘这套系统的源起、运行、发展。

 

上线:一次从源头治理收视造假的重要举措

节目收视综合评价大数据系统的第一次亮相是在2018年年底。但在更早的2016年,广播电视规划院就在国家广电总局的领导下,牵头组织多家广播电视台、网络运营商、科研院所、高校、企业,陆续开展了收视核心技术研发、标准制定、小范围规模实验等工作。


总局广播电视节目收视综合评价大数据系统开通试运行。


该负责人表示,长期以来,党中央高度重视收视调查体系建设,要求建立权威、有说服力的新型收视调查体系,促进广播电视事业高质量创新性发展。总局党组认真贯彻中央决策部署,把建设节目收视综合评价大数据系统作为贯彻落实中央精神的重要举措。

 

同时,权威的节目收视综合评价大数据系统建设也是行业的大势所趋。社会各方呼唤新型收视调查体系的尽快建立与全面应用,从源头上解决收视调查领域突出问题。

 

在此背景下,节目收视综合评价大数据系统应运而生。

 

攻坚:三阶段完成系统搭建

从0到1,创新搭建。

 

节目收视综合评价大数据系统抛弃传统的收视调查模式,创新建设了一套以云计算、全网络、全样本、大数据为重要特征的新型大数据收视调查体系。

 

该负责人直言,“非常难,从数据接入、到系统搭建、模型和指标设计到系统上线,都是从零开始的”。

 

自2016年起,系统的建设历程以不同时期、不同攻坚重点,主要分为三个阶段。


 

第一阶段,广播电视规划院牵头相关单位开展收视调查核心技术自主研发,制定并发布收视数据元素集、交换接口、清洗规则等多项行业规范,自主掌握了一批核心技术专利和软件著作权。


 

同时通过研究大数据收视调查理论,确定了指标体系和计算方法,解决新情况下收视大数据样本分析、统计规则和处理方法、数据建模和分析的问题。

 

第二阶段,规划院组织多家有线电视网络、IPTV和互联网电视机构,开展了千万级规模的技术实验,验证了第一阶段形成的大样本收视调查的基础理论、技术方案、指标体系、调查标准、模型算法以及质量控制、安全与隐私保护策略等的合理性和可行性。


 

本阶段实验获得专家高度评价,一致认为“可以满足对超大规模、多源异构收视数据分析与节目综合评价的需要” 。

 

第三阶段,2018年下半年,广电总局决定在前期规模试验和反复试算的基础上,由规划院开展“广播电视节目收视综合评价大数据系统”建设工作。


 

“从课题研究到实验验证,再到系统建设运行,凝聚着许多工作人员的付出和心血。”该负责人说。

 

于行业而言,系统的建成和投入运行,对于建立科学、真实、有效的收视评价体系,从根本上解决收视率造假问题,发挥了重要作用。

 

架构:五个特色强化服务管理

节目收视综合评价大数据系统是怎样运行的?

 

该负责人介绍,收视大数据处理过程中,涉及收视大数据采集、清洗、入库、分析、应用等环节,“整个流程有点像做菜”。

 

系统的运作流程为——用户收视数据由运营商(如歌华有线等)从机顶盒直接采集,通过安全通道传送至收视综合评价大数据系统。系统在对海量数据进行采集汇聚、清洗转换之后,开展建模、统计、分析等工作,输出大数据收视调查指标。


 

整个流程中无人为干预环节,在关键的数据采集阶段,系统设置有规范性核查、完整性核查、合理性核查的三级校核机制,有效防止数据污染。

 

综合而言,大数据系统的创新点可以概括为五个方面:

 

一是样本全、覆盖广,海量数据源。系统现已实现全国3亿有线电视、IPTV、互联网电视用户收视数据的汇聚分析,涵盖直播、回看、点播等多种收视方式。

 

二是大数据、云计算,高效处理精准到户。系统基于大数据、云计算技术,高效及时地统计超大规模收视数据,分析精准到户,既可以反映热门节目、黄金时段的收视情况,又可以精准捕捉小众节目、边缘时段的收视特征。

 

三是防操纵、抗污染,根本解决收视造假。系统数据采集、清洗、分析、呈现各环节无缝衔接,全流程自动化、封闭化处理,防范人为操纵。系统基于海量大数据统计,个体样本数据污染对统计结果的影响可忽略,系统抗污染能力强。

 

四是多维度、全方位,融合分析引领发展。系统创新性地建立了涵盖八方面超过80项核心指标的收视大数据指标体系,通过对收视数据深度挖掘、及时反馈,指导内容选题、素材集成、需求组合、分析预测、创作生产,转变传统节目生产方式,有效引导行业健康发展。

 


五是全媒体、开放性,预设未来全新定位。系统适应媒体融合发展和传播格局、传播环境的新变化,持续丰富电视收视数据来源,将全面覆盖有线电视、卫星直播、IPTV、互联网电视以及网络视听领域等不同传播渠道,并提前预设了全国有线电视网络整合和5G移动应用大趋势下的新定位、新模型。

 

影响:以数据促进行业发展

节目收视综合评价大数据系统试运行之初,不少媒体评价“以釜底抽薪的方式,对行业收视问题进行了整治”。

 

运转至今,系统对行业的积极影响已然显现。

 

据负责人介绍,目前系统已经向中央领导、中宣部、行业主管部门、全国电视台等输出各类专业数据分析报告超3万份,支撑宣传调控,助力电视台的创作生产和播出管理,获得多方肯定。


 

通过数据查询分析或数据报告呈现等形式,为中央广播电视总台、中国教育电视台、电影频道以及全国上星卫视频道提供全面数据支撑,并成为日常节目考核的主要数据。

 

2019年12月17日节目综合评价大数据研究中心正式以“中国视听大数据(CVB)”品牌向社会公布收视数据,CVB数据发布后,得到了社会大众好评,对广电总局出“组合拳”“重拳”治理收视率造假一片叫好。


“中国视听大数据(CVB)”向社会公布的第一份收视数据。


2020年底,由广播电视总局制定,经国家统计局批准并发布《广播电视节目收视大数据统计调查制度》,广播电视行业成为第一个以大数据方式开展政府部门统计调查的行业。

 

谈及下一步的工作重点,该负责人介绍,目前节目综合评价大数据研究中心有五十名左右员工,分别负责数据的接入、分析,数据报告的编制与发布,舆情分析,数据应用推广等工作。

 

在现有工作基础上,接下来规划院将依托大系统资源,推动实施“广播电视节目收视综合评价大数据系统扩容”工程,提升系统数据汇聚规模,优化数据全链条机制,完善数据全生命周期质量,确保数据采集与汇聚的准确、完整和及时,保障数据发布与应用的真实、客观和有序。

 

随着收视环境的多屏化,规划院将加快推进互联网电视和互联网视听网站的数据接入,构建面向网络视听领域的数据指标体系,实现网络视听收视数据的有效汇聚和分析,全面发挥“中国视听大数据”作用。

 

日前,国家广播电视总局发布《关于进一步加强文艺节目及其人员管理的通知》,通知明确提出:“科学看待收视率、点击率等量化指标,加大‘中国视听大数据’推广应用力度。”

 

对于新要求,该负责人说,“我们将持续优化完善节目收视综合评价大数据系统,更好地服务宣传管理,支撑行业发展,为优质节目的传播实现全面、多样化的数据支持。”

 

(宁雅虹对本文亦有贡献)


编辑 | 宁雅虹 随芳芳


>>总局召开“我们的新时代”主题电视剧重点项目推进会|多个重点剧目披露进度

丨报道

>>疫情防控主题短视频暖心共情、助力抗疫

丨专论

>>《艺术里的奥林匹克》:多元趣“融”,解读奥林匹克的力与美

丨节目

>>5G+系列黑科技,打开体育赛事沉浸体验丨咪咕案例

丨案例


发布     👍 0 举报 写留言 🖊   
✋热门推荐
  • 本体是万事万物之源,只有提到这种境地,才能真正的理解中国传统哲学天人合一的精妙。和的本质,他是本体与他体,主体与客体之间,发生接触发生碰撞发生发生交换,等等一切
  • 最重要的是问题是所有的想法是不是向目标的,只有以目标来鉴定对方的“对”和“错”每个人的想法都是合理的,每一种想法都是合理的,不同的是在他的环境里所发生的事情的认
  • Tips:青海很大,景点也分的很散,对于第一次去的小伙伴,不太建议自由行,除非你只玩西宁的景点,不然的话还是考虑自驾或者包车。(好吧,这段话等你五周岁生日的时
  • 与人相处的要诀,就是要真心的接受对方。今天是2018年12月01日,我支持微公益,这只是一个开始,有爱,让微博不再冷漠…………�好的开始�是慎始��善的结果�是
  • 每天我跟其他一些负债的朋友们在群里交流,好多人都怕被网贷起诉,其实这个问题大可不必担心,全国负债人已高达2亿,法院根本没有那么大的精力,再一个基本所有网贷了都有
  • 目前,百花谷区、艺术水岸区、背景山林区收尾工程正在如火如荼进行中,预计将于2020年12月31日面向公众开放。依照计划,明年4月前成都大运会所设置的49座新建改
  • 明末清初有一本书叫《解人颐》,其中有这样一段话: 终日奔波只为饥,方才一饱又思衣。 衣食两般皆俱足,又想娇容美貌妻。 娶得美妻生下子,恨无田地少根基。 买到田园
  • 每个部位变美变好看的方法 1、下巴:就是抬头!一定要使劲儿仰头,感觉下巴和脖子都收紧了,停5秒再放下,每天做20~40下。一周就会见到效果。 2、上臂内侧
  • [嘻嘻]给肖战哥哥:哥哥,今天是陪你过的第二个生日啦,也是喜欢你的第380天,太晚认识你错过你好多好多…不能弥补的遗憾…幸好最后还是遇见你,偶然通过阿羡认识你,
  • 对于新生代租客来说,2000元左右的租金预算在近郊及部分主城区域均能有较多的选择空间。其中,租房区位方面,77%的受访者希望租住在交通便利的地方;租房租金方面,
  • ATP 现在将评估这些建议,以确定立即采取的下一步措施,并制定与所有虐待问题(包括家庭暴力)相关的长期保护战略。 该报告由英国大都会警察局前侦探总督察克里斯·斯
  • 对着知识分子老丈人发现经济实力不好使,就展现了说话有深度有文化的一面。对着知识分子老丈人发现经济实力不好使,就展现了说话有深度有文化的一面。
  • 三、网红景区方面(一)渝中区洪崖洞、解放碑、朝天门景区,主要易发拥堵时段为18时30分至23时;主要拥堵道路嘉滨路、沧白路、长滨路、八一路、五一路、新华路、民族
  • 我出的题目成功的逼退了对手[加油]今儿五公里跑进32分,不容易啊。哈哈哈,告诉我,你快乐就好,有能耐你就单身到底,这中恐吓是他俩最后的倔强[二哈]#九月再见#
  • 我自己也有一个同感,过去两年的时间,我每隔5天会写一篇小作文,内容主要是对精神病学和心理学的一点思考,但我也会经常陷入到同样的担忧——我连这个心理的细节都捕捉到
  • 在原有的家族观念中,母亲总能找到父亲有错的现实逻辑,甚至很多时候连父亲都觉得自己有错(也许他是觉得自己有罪)。一到12月,我就会开始准备我的圣诞礼物,觉得还是需
  • 我国空间站在空间生命科学与人体研究、微重力物理科学、空间天文与地球科学,以及空间新技术与应用等4个重要领域制定了系统的、长期的规划,将研制一大批科学研究设施,支
  • 昨日鸡啤疙瘩 还以为店倒闭了 原来是换更大的地方了hh好吃!他家还莫名其妙的有迷卫衣[允悲]图三到图九为拼多多:星饭应援坊图三图四是我与他们家的聊天记录,自称官
  • 摘下我的心,埋在没有草的草原,海水漫过,它就变成了月亮,变成了夜的主宰。那扇窗的一盏灯、这些年的一些人停顿在某个片段,还有那本永远读不完的诗集,终被时间淹没。
  • 袁世凯和北洋三杰袁世凯出生在白露寒生露凝但他这个寒是不够冷的阳气仍盛于阴气只不过昼夜温差大皇帝之中在白露中出生的还有唐玄宗和朱祁钰他们共同的一个特点是政治上不够