5月28日,“第三届大数据与传媒产业峰会”在贵阳隆重召开。近几年来,随着大数据技术的不断应用,广电传媒行业发生了深刻的变化。党的十九大提出推动互联网、大数据、人工智能和实体经济深度融合,习近平总书记也提出“实施国家大数据战略加快建设数字中国”等讲话精神。在本次会议上,业内专家和领导探讨传媒行业发展之“道”,探寻大数据实际应用之“术”,共同为传媒数据产业快速发展建言献策。
未来电视有限公司副总经理白德鑫作了题为《探索大数据,迎接智慧媒体时代》的主题演讲。
以下为演讲内容:
各位大家好,我是未来电视的,我们今天讲的是大数据迎接媒体的智能时代,这个是主要介绍一下我们在互联网电视这一块做的运营的数据挖掘和数据分析的体验。大概从内容生产的开始。内容生产其实是现在大家说可以借助大数据做内容生产的能力,但是纸牌屋之后,大数据产生的内容还没有新的出现,实际上当时我们来看是一个噱头,现在来说,我们已经到了这个时代,整个用户的收视行为,包括舆情,包括整个社交网络上产生的一些语音,包括我们的情感分析,这些都可以借助对我们的内容生产有一些很好的帮助作用。
我们看一下现在的数据现状,2017年中国电影上影389部,这个数据来自中国电影发行协会,实际报备的数量是3825部,实际上说我们生产了很多的内容,很难上到接触到更多的受众群体,2017年我们电视剧播出是402部,报备的数据是1180部。2017年综艺节目超过了208档,包括了网综和上星的综艺节目,实际上这个数据这么多的综艺节目如何吸引用户?这些都是我们需要观察用户在社交网站上产生的数据行为。电视剧我们可以在豆瓣上的评分,实际上评分,包括电视机的终端上面说电视剧引用的是豆瓣的评分,这个是评分到高度,豆瓣下面有大量的影评人的结果,对评论进行分析可以得出情感,对这部电视剧是好感还是差,除了评分我们也用另外的角度说这个事情。
如果采用大数据的方式我们的生产方式有一些改变,我们可以通过热门剧豆瓣高分去抽取视频内容的行为,然后预测用户的接受度,从我们的拍摄过程中,现在由于互联网这种广泛的覆盖,在OTT的互联网电视的覆盖,用户群体越来越大,实际上我们的节目制作并不是说我做完了很多节目才开始上线,这个是我们结合整个社会化的营销的场景让用户有参与感,在互联网里面做终端硬件可能是小米参与的口号,在内容制作的时候也需要内容口号。这个是我们做的广场舞,我们与用户互动的群体,我们针对用户产生的转发,包括评论,拿到数据对情感的分析,我们还有一个足球道路,这个是我们在整个社交网络传播,我们对传播的效果以及用户的评论进行分析,反馈给我们前端的节目组,这些节目制作的时候在我们整个基于社会化的的传播交互来做的。然后是上线的阶段,其实就是节目运营,如何让节目更好的符合用户的需求,我们对整个的视频的内容进行分析,刚才葛院长介绍了用户的情感,我们分析以现在在互联网里面的节目来做分类的话,按照传统的方式分类有几十种,腾讯视频有2000多个标签,标签可以当成另外的分类,我们在2016年有8400个标签分类,实际上这些我们如何更精细化的把用户更精确覆盖他的收视行为,现在我们可以在视频里面进行识别的标签达到可以到2万左右,这个标签其实代表了我们更精细化的内容的加工和抽取。然后我们生产、上线、回馈的时候我们进行数据的整合,数据整合并不是说只是产生在我们的一个未来电视的电视端的行为,只是用户说我看了片子,观看了多长时间,是不是退出,用户的行走路径是什么,但是在家庭场景里面有用户的体系,电视机面向的不只是一个用户,电视机面对的是家庭,家庭是3到5个人,我们根据统计预测是2.3个人,一个屏幕面向的用户群不是只有一个,我们针对整个的网站,搜索引擎和热搜的评价进行深入的挖掘,从多个维度进行分析,反向推向我们的内容选材。在社交网络说做预热,在预热的过程中得到用户的正向反馈,完善我们整个数据内容生产的更精细化产生的用户价值。
基于大数据和整个的社交网络做分析的话,这种《来自星星的狗》可能就不需要公示备案了,我们说《来自星星的你》是很热的剧本,从我们的感官上这个是非常热门的剧,但是我们做这个事情的话,怎么选材不是我们纯粹拷贝一个,后面改一个名字而已。
从内容运营和技术运营来说,我们大数据给我们内容标签更非常,我们对整个视频里面的人脸进行识别,不只是明星,对于我们电视端来说,时政人物、明星、主持人都是我们需要关注的对象,从央视的内容来说,撒贝宁主持的节目和一个不知名的主持人主持的节目对观众的吸引力不一样,所以我们打出标签,在物体识别里面如果场景里面出现了自行车、甚至交通设置,我们可能有一些用户需要看的,喜欢看的可能是这种汽车类的,这个其实现在在一些网站上更明显一些,我拿他的手机APP来看,所有跟飞机坠落的视频来看,整个看了几十部,花了两个小时左右,就是飞机坠落的视频,类似这种我们除了识别人物,还要识别物体,包括场景,包括刚才说的飞机坠落的场景,甚至我整个喜欢阳光沙滩的类型呢,或者小孩子喜欢宠物的节目,包括情感分析,情感分析除了我们在视频内容上的情感,包括我们整个语音交互的情感,我们把情感和表情识别出来,这对我们在整个对视频内容运营的时候的标签会越来越丰富,更精细化做这个。其实这个里面我们打了这么多内容丰富的标签,反向推出另外一个事,如何分辨大屏前的是儿童、中年、家庭主妇,如果用我们现在的方法来推动很难,如果我们用足够标签来识别的话,我们可以识别当前的时间和当前时段使用电视用户是谁,不在是一个家庭的用户,而不是一个单一用户的个人。
内容标签对我们产生的是用户的行为,可能在手机端,PC端大家的用户是单向的用户,不管是搜索引擎,电商,搜集这些数据,视频网站可以收集到这些数据,通过浏览的记录可以看到是不是在电商的记录,针对大屏幕不是一个,可能是三个,可能是五个,怎么更精确识别出来电视机前的用户群体,我们通过识别让用户更感兴趣,更不容易跳出我们的应用。
我们在这个事情上,在未来电视OTT电视端做的一些事情我介绍一下,刚才介绍的是我们看到的一些事情,实际上我们正在做的事情首先是我们看到了什么未来,大家说OTT是OTT了所有的传统媒体的群体,我们看这个发展的趋势来说,OTT激活的用户规模是1.68亿,每年以快速的比例增长,这个增长从终端的角度来说,每个终端可能覆盖2个人以上,整个广告市场,广告的市场从刚开始的2015年2个亿,整个会员付费市场从2017年13亿到2020年50亿的会员付费,增值业务市场2017年是5个亿,2020年达到100亿,未来就是在家庭的场景下是OTT得天下,因为它具备了互动,具备了时时反馈和回馈。
未来电视我们得到的收入是我们的收入同比增长43%,我们的广告收入同比翻了一倍,我们的付费收入是翻了10倍,我们的增值收入1.4倍,目前未来电视的用户是8300万,日活的用户增长超过了1倍,我们现在做的事情是基于大数据、基于云计算和人工智能完善我们在互联网电视的播控的能力,包括我们在终端的一些应用。
我们现在正在做的一个事情就是改变我们针对面向家庭用户的用户画像,我们做一些深度的数据挖掘,基于我们现在大概每天1000多万的日活用户,他的收视行为,我们对他的收视行为,对视频内容重新的标签化,使我们的标签从原来分类提升到2400个视频标签。通过这个标签来进行十分多户的方式进行用户的定位和识别,我们对标签除了视频的内容识别还有标签的内容,其实主要还是基于这种精细化的标签来打动用户的年龄段,我们通过年龄段推算用户的群体是什么样。
我们说一下我们在数据挖掘和大数据我们基于央视大概160万个小时的视频,包括我们实施用户行为的分析系统,包括我们做的人脸的识别做的一些基于数据和精细化运营的内容。
谢谢大家。
以下为演讲PPT:
推荐阅读
经典栏目
精彩专题
关注我们
大视频行业颇具影响力的行业社群平台,重要新闻、热点观察、深度评论分析,推动电视行业与各行各业的连接。
集合电视台、网络视听、潮科技等各种好玩信息。
专注于报道广电行业新鲜5G资讯,致力于成为广电行业有权威、有深度的5G自媒体平台。
UHD、4K、8K的最新资讯和最深入的分析,都在这里。
视频产业的专业圈子,人脉、活动、社区,就等你来。
我们只沉淀有深度的信息和数据。
致力于卫星电视信息、卫星通信技术、天地一体网络应用案例、以及广电、通信等产业的市场动态、政策法规和技术资讯的传播。