关键词:媒体数据;数据资产;数据思维
全媒、融媒、数媒、智媒,近十年来媒体融合转型的概念变化中,前两者是形式形态上的变化,后两者才是内核和基础的变化,其中的关键是媒体的数据化运营到运营数据业务。人民数据、新华数据、财新数据、南方数据,这些媒体数据新概念、新品牌代表了大数据时代媒体动能转换、功能转换的一个新趋势。数据媒体到媒体数据的新价值为何可成、如何生成、有何构成,是其中的难点和重点,也形成了对媒体自身的颠覆性、重塑性挑战。
全媒、融媒、数媒、智媒,近十年来媒体转型中历经的这些新概念,大致代表了认识与实践的几个不同阶段。最初的全媒成了小而不全,最初的融媒成了移动优先,最初的数媒成了数字化呈现,而最新出来的智媒概念,似乎满足于智能化而不是智慧化。如果说全媒是形、融媒是态,数媒和智媒就是核和心。全媒、融媒阶段,没有数据支撑作为新的动能转换,就像头不动而身体在动,甚至是身体不动而仅仅手指在动。同样,没有数据支撑作为新的基础设施,智媒转型就像是身体不动而头在动,甚至是头不动而仅仅眼珠在动。要么头重脚轻,体力有限,移动困难;要么头小身子大,智力受限,应变艰难。可以说,以前的全媒、融媒转型过程不够深透完整,就是因为没有打下数媒的新基础;接下来的智媒转型能不能成功,还是要看有没有基于数媒的新动能。
就目前学界业界的基本认识而言,数媒的概念有两层含义:一是以数据为支撑的新闻呈现,即新闻数据化、表达可视化,包括了非标准化抽象新闻数据的图表式、坐标式、数轴式和H5、动漫游戏等具象化呈现;二是从数据中挖掘新闻,即数据新闻化、数据产品化,也包括媒体智库报告、榜单评估、舆情服务等智慧化产品。第一层含义中的数媒,更多的是形式、格式上的数据化,第二层含义中的数媒有了较多的数据采集和加工,并且数据来源不限于单一的媒体数据,比较接近真正意义上的数据媒体。惯性和成见的影响如此根深蒂固,一说到媒体数据,就容易想到媒体自身的数据、现有的数据,正如一说到数据媒体,就容易想到利用数据生产的新闻,或者仅仅是数据化可视化形式呈现的新闻。而本文探讨的“媒体数据”概念,即使称之为媒体数据库、媒体大数据,仍然有被误读的危险和困扰。它不是指现有的数据媒体与媒体数据,既超出了现有的媒资库如媒体自身的资料库、历史数据库,也不限于与媒体智能化生产与智慧化传播相关的案例库、专家库,而是依托媒体建立起的大数据库,依托“媒体+”形成的数据生产、聚集、运营和服务能力。因而真正要讨论的前瞻问题是,走过了全媒、融媒阶段的媒体融合转型,有没有可能成为以数据为支撑的数据媒体?或者说,有没有可能建成以媒体为依托的数据库,成为生产运营数据的媒体数据服务机构?与此相应的另一个关键问题是,媒体机构的从业人员有没有可能成为信息采集员、数据分析师?
在传媒业过去几十年的发展当中,正是这样一个数据累积的过程,新闻记者作为时代的记录者,真实地记录着时代进程和社会里发生的大小信息,记录这个时代产生的数据,可以说,媒体本身就是一个数据公司、一个天然的大数据库,每天都在产生着大量的、极具价值的数据资源。而现在随着大数据时代的到来,媒体对大数据资源的整合积累更是空前重视,几乎所有的大型传媒机构都将之定为“一把手”工程去推进,从过去以集聚内部报纸内容数据建库作信息查询之用,到现在开始多维度、全方位、专业化、行业化地采集生产集聚数据资源,例如人民日报的人民数据,新华社的新华数据、央视网的视频数据、知网的期刊数据、财新的商业数据,以及南方报业正在打造的南方数据等等,“媒体数据”这一内涵扩大了的新概念,包含着新价值的生成、新融合的提升,以及对新趋势的预判和响应。
好在有了对大数据时代的共识,“媒体数据”的新概念不会显得特别突兀,尽管它还是会被惯性和成见不时拉回到最初的原始概念。也许,这就是它无法摆脱的根本特征之一。以数据的生产运营服务为新能力的“数据媒体”(从媒体机构的新定义和新定位上,可以再次简称为“数媒”——生产运营数据的媒体机构),有了区别于商业数据机构、区别于官方“数字政府”、区别于“智慧社会”并且能够与之融合、竞合的新价值。
新信息技术因为符合新媒体传播规律,贴合用户需求提升用户体验,对媒体发展的影响深刻。无论新媒体、传统媒体皆纷纷借助互联网、大数据、人工智能新技术,走上了融合转型之路,并依靠自身优势和智慧,形成了各具特色的发展模式。笔者走访调研了北京的人民数据、新华数据、央视数据中台、财新数据、知网数据,跟踪分析了地方媒体中理念和行动相对超前的浙报集团的“媒立方”、四川封面新闻“智媒体”,深度参与了南方报业的中央数据库建设和媒体智库化转型,这些媒体机构都在不约而同地瞄准了大数据方向,打造“媒体数据”的新平台、抢占“数据媒体”的新高地。初步分析梳理,这些“数媒”的智能化发展方式各具亮点:
1. 人民日报:“中央厨房”+ 人民云大数据开放共享平台
人民日报在智能化布局上,有两大重要亮点,一是“中央厨房”的建设,一是“人民云”大数据开放共享平台。“中央厨房”是人民日报社全媒体融合的核心平台,分为空间平台、技术平台、业务平台三个部分。其中,技术平台由内部用户管理系统、互联网用户管理系统、传播效果评估系统、可视化产品制作工具、新媒体内容发布管理系统、报纸版面智能化设计系统支撑。业务平台是内容处理平台,实现了新媒体与传统媒体、网上与网下、母媒与子媒、国内媒体与国外媒体的四个“联动”。“人民云”大数据开放共享平台,是人民日报的自建技术平台,以大数据价值挖掘为核心,主要由大数据管理平台、大数据服务平台和大数据创业平台三大业务平台构成。同时,建设人民数据库,集聚人民日报和旗下报刊的核心内容资源以及党政人大政协等机构的数据资源,打造成最大的党政数据库。
2. 新华社:“媒体大脑”+ 大数据运营生态系统
新华社的“媒体大脑”可以说是中国第一个媒体人工智能平台,功能覆盖线索、策划、采访、生产、分发、反馈等全新闻链路,旨在用云计算、物联网、大数据、人工智能等多项技术为媒体赋能,重新定义智能时代的内容生产。在大数据布局方面,通过新华社技术局数据处主导,以开源体系建设基础数据技术平台,集聚新华社内部数据资源。始建于2004年的新华社多媒体数据库主要汇集了新华社文字、图片、图表、视音频、报刊等各类新闻信息产品以及各类新闻和历史资料,并能实现检索、浏览、个性化订制及推送服务等多种功能,实现新闻资源全面共享,支撑全集团各媒体的统一生产。另外,新华社通过旗下多个数据单位打造全方位的大数据运营生态系统,如新华睿思数据云图分析平台、新华智能大数据协作平台等等。
3. 央视网:新媒体集成遥控平台+ 数据中台
央视网正在升级建设“一网+ 一端+ 新媒体集成遥控平台+ 市场端口连接”的全媒体传播格局,并致力于建设一个强大的媒体“中台”,汇集统一的数据采集能力、计算能力、萃取能力、交换能力等,准确把内容、平台、用户连接起来,推动内容的精准分发和服务的精准触达。目前,央视网“数据中台”已形成“贯通多终端、统一管理”的数据采集分析体系,实现对央视网多终端覆盖情况及传播效果进行全流量监测、评估、分析,每天用户访问记录超过100 亿条。在此基础上,央视网通过合作引入第三方公司的外部数据,形成更为丰富、多元的全域媒体数据库,以此支撑数字化转型。
4. 封面传媒:智能媒体+ 智慧媒体+ 智库媒体
封面传媒要以“数据驱动增长”作为发展理念打造基于数据驱动的互联网科技传媒公司。其开启的智媒体探索,主要包括“小封”机器人写作、打造封巢、机器合成语音播报、构建“引领人工智能时代的泛内容生态平台”和智能实验室等。其小封机器人,不仅可以极速写作,更能够应用语音识别、意图识别等AI 技术,基于新闻、兴趣、生活与用户展开互动,现在实现了每天发稿120 篇左右,每月3000+ 篇稿件。此外,在算法推荐、用户画像、人机协同等技术领域,封面传媒都已经有很广泛的应用。在智库媒体方面,封面传媒建立了封面数据+ 舆情的新型媒体智库。
5. 浙报集团:“媒立方”+ 大数据产业生态圈
浙报集团自主研发的融媒体智能化传播服务平台“媒立方”,作为支撑浙报集团媒体深度融合的平台级产品,将大数据技术作为平台建设的重要组成部分,支撑起包括指挥中枢、PC 端、移动端在内的所有采编终端,打通全流程数据, 驱动“策、采、编、发、反( 馈)”进入在线环境,成为“数据驱动新闻,智能重构媒体”的理念实践样本。另外,渐报集团通过渐数文化(原渐报传媒)投资建设“富春云”互联网数据中心、浙江大数据交易中心和“梧桐树+”大数据产业园、大数据产业基金组成“四位一体”大数据产业生态圈。
6. 南方报业:中央数据库支撑融媒生产和媒体智库
在媒体智库化、传播智能化的方向上,南方报业形成了南方经济智库、南方党建智库、广东乡村振兴服务中心、南都大数据研究院、南方舆情数据研究院等十大媒体智库矩阵。其中,南都大数据研究院自2018 年2 月成立以来,以数据生产为核心,现已形成数据报道、榜单评价、民意调查、咨询研究、鉴定测试、评估认证、数据库及轻应用等八大类近百项智库产品和服务,入库数据超过10 亿条,走出了一条从数据新闻到数据产品再到数据产业的发展路径。南方报业建立了集团层面的中央数据库(大数据服务中心),设立专门的数据资产管理部门,制定大数据管理办法、采访过程数据采集管理办法等,下一步将打造“数据服务平台”,打造“南方数据”品牌。
智能技术、智能设备的更新迭代、成熟普及,不断地推动着媒体智能化的发展,甚至是颠覆重塑性的变革。很显然,媒体融合从物介质的融合到内容形态的融合已基本形成,融合下半场的重心将向智能化发展,无论是新媒体还是传统媒体,迎接智能化颠覆性挑战的首要步伐,都应该有意识依托媒体做好大数据的资源和技术积累,其中的难点和挑战在于,从传媒到数据、从传播到服务、从采访到采集、从对内到对外,动能转换的过程需要转换思路、转换机制、转换形态。具体表现在,从随机采访到系统采集, 从被动收集到主动采集;从结果数据到过程数据,从简单数据到复杂数据;通过用数据、养数据、聚数据、管数据,从数据化运营到运营数据业务,形成媒体数据生产应用的新的闭环系统。
(一)“媒体数据”建设需要全新的产品思维
媒体数据的新概念,不能仅限于媒体现有的和自身生产采集的数据,而是要依托媒体平台优势构建多种类型的特色数据库。目前还有很多媒体的数据库,仍然停留在简单的媒资库时代,又或者是在传统的报纸库基础上纳入自有的网站、公众号、客户端等内容资料,还仅仅是当作资料库来建设使用。要盘活媒体数据使用需要新思维,要以加快数字经济时代媒体融合创新发展为战略目标,以“数据资产增值”为考量,以市场需求为导向,围绕不同的用户需求和市场需求,打造实用有效的数据产品和数据服务能力。
第一,媒体数据的构成要有多样性。一是要以其自身的媒资数据为基础数据,包括传统媒资数据和新媒资数据,这些数据包括报纸数据、期刊数据、网站数据、APP 数据、两微数据等内容数据以及用户数据、经营数据、采写过程数据、报料数据等等。二是媒体数据要结合自己的优势和把握市场需求生产多样化的特色数据,媒体数据本身就可能是政务数据、智库数据、评估数据、调查数据、舆情数据、知识数据等,各媒体还可以根据媒体自身定位特色、地域特色等等形成数据,例如,人民日报的党政新闻数据,新华社的多媒体报道数据,南方报业基于智库矩阵课题研究所形成的各类课题数据以及基于地缘优势所形成的粤港澳大湾区深调研数据。三是媒体数据要发挥连接的优势,聚合各行各业的合作数据资源,包括产业行业数据、政府数据、经济数据、运营商数据、电商数据等,例如人民数据一方面通过交换、代建代运营合作等形式聚合特有资源的数据,另一方面通过对外参股、收购具有核心技术的数据类公司,不断丰富自己的合作数据。
第二,媒体数据要重视数据的“时度效”。“时”可以理解为数据集聚的持续性,“为有源头活水来”,如果一个数据库没有持续不断的更新数据进入,只是一湖死水,一个“数据死湖”,其利用价值大打折扣,对于媒体数据来说,连续性的采访报道和长期追踪可以为媒体数据库不断地注入鲜活的数据。“度”是指追求数据的全面性、准确度,举个例子,如果要做一个“舆情数据分析报告”,却只有网上舆情数据而缺乏社会舆情数据,分析出来的结果无疑就是“片面之词”“一面之词”,更甚者,如果制作分析报告所选取的数据不真实准确,那么这个分析报告就不仅是片面报告了,更是个虚假报告,所以,媒体数据建设要重视集聚不同维度的数据,全面充分,同时更要重视数据的真实性准确度,才更具参考价值。“效”主要是数据的利用价值,大数据时代,无论是官方还是民间,国企或民企,决策对数据的依赖越来越高,媒体数据库应该把握时代需求,进行有针对性的数据库建设,打造适合各类党政部门和企业需求的数据产品,有市场有用户的数据产品才是有价值的产品。
第三,媒体数据要重视用户体验和实际应用场景。特别是要兼具资料库、知识库、资源库的功能服务。过去的媒资数据库,一般是服务于报社内部,功能比较单一,往往仅提供简单关键字查阅功能,缺乏计算分析等功能,同一传媒集团下的报纸数据库组建大多各行其是,呈烟囱式建设模式,缺乏系统的底层大数据管理、大数据功能服务规划,这些都为媒体走向“智媒”自设路障,更难以形成“媒体数据”对外的服务价值。媒体数据库的功能建设,首先要明确用户是谁、在哪里,什么应用场景下使用,怎么去触达用户,只有理清这些问题,才能建好一个高效能、高效用的数据库。为此,要定位好数据库的特色和发展方向,如果定位做资料库功能服务,最重要的就要做好检索功能,要从底层打好数据标签标引、实现便捷检索、跨库检索、智能聚类等;知识库功能则重点为用户提供研究辅助、决策参考辅助、知识图谱功能服务,大数据挖掘计算分析可视化这些能力更要做到位;资源库功能主要是基于媒体生产内容的特色,为用户提供内容版权等服务,那么内容赋能系统、版权管理、智能审核、运营决策等功能服务都不可缺少。最重要的是数据技术系统搭建,要从全局考虑,搭好基础数据技术平台,要以业务发展为方向,能实现快速反应快速迭代,快速支撑市场运营方向,快速响应用户需求。
(二)“媒体数据”运营需要多样化的商业模式
媒体要打造有价值的数据库,数据积累是一方面,更重要的是数据变现,实现媒体数据资产增值。无论是传统媒体或是新媒体,都应该在原有的商业盈利模式基础上,把握数字经济发展的机遇,对外开放媒体数据服务能力,开拓盈利新渠道。
第一,提供数据库服务,简单说就是销售数据库。这里不能片面地理解成为销售数据,现在很多社会上的公司,直接就把未经脱敏脱密的数据进行对外销售,导致引发了大量的黑市数据交易,有些公司打着数据精准服务、个性化服务的幌子,做着窃取数据、非法收集、侵犯用户隐私的事,媒体数据服务要避免这一误区。传统的版权销售也可以说是种数据库销售,但大数据时代,不能仅盯着版权销售这一个小点,要把握大数据时代需求,大力发挥媒体特点优势,要有数据产品生产和服务的创新性思维,进行多样化和特色化、专业化的数据库建设,开展精准营销,打造适合各类党政机构和企事业单位需求的数据产品。人民数据、知网、财新网都在数据库销售服务上取得了相对不错的效果。
第二,提供大数据价值分析挖掘服务,具体的产品表现就是销售数据分析报告、模型。基于大数据价值分析挖掘,洞察数据背后的规律趋势,形成数据分析洞察报告、数据分析模型等辅助决策,为用户提供决策参考。媒体智库在这方面有天然的优势,媒体人市场触角灵敏,在日常采访和调研过程中能接触了解到地方党委政府的中心工作、行业产业发展的问题痛点和前沿资讯,并且拥有记者编辑这些深耕各专业领域的经验丰富的人才,对数据的洞察服务能力远比其它行业有优势。人民网的人民舆情监测室,南方报业的南方舆情数据研究院、南都大数据研究院、21 世纪经济研究院等在这方面做了比较多的尝试,也取得很好的市场效果。
第三,提供大数据生态圈连接服务,相当于数据交易的中间服务。可以说,数字经济时代,所有公司都是数据公司,都会产生数据,要让其数据资产变得有价值能增值,交易变现是最直接的途径,数据交易将会变成一种商业交易的常态。媒体,特别是党媒可以充分发挥其连接力、影响力、公信力、传播力的优势,为各类公司的各类数据、数据服务、数据能力提供交易的连接等中间服务,协助党和政府在数字经济时代做好数据交易的中间服务平台。
第四,数据平台赋能服务。有些转型走得比较早、比较前的媒体,在数据驱动发展过程中,建成了平台型的数据技术产品,积累并验证了大量数据技术能力的超前性、有效性,例如数据分析能力、数据可视化技术能力、数据运营决策能力等等,并能开始对外开放这些服务能力,让用户使用其技术系统,或直接在其平台上实现数据计算分析能力的服务,例如“人民云”大数据共享平台的“输出数据中心”服务、新华社的“现场云”服务、南方报业的南方号大数据传播与管理平台等,都是不错的尝试。
(三)“媒体数据”实践需要创新型的运作机制
“媒体数据”是运营数据的媒体服务,这种“数媒”不是传统的媒体,不能以传统媒体的运作机制来操作,要有创新的组织架构、岗位职能、人才构成和激励方式。
第一,组织架构要创新。“媒体数据”可以说是一个媒体特色的数据公司,从最基础的构成来说,要有相应的数据生产部门、数据资产管理部门、数据运营服务部门和数据技术部门。数据生产部门负责数据的采集入库、数据标签、数据校正,数据产品的采编、数据产品的可视化应用等,相应地应该有数据采集员、数据编辑、数据校对、数据产品规划、数据可视化设计、数据分析师等职位。数据资产管理部门负责数据入库标准制定、数据内部共享交易规则制定、数据资产审核确认等,相对应地可以有数据管理员等职位。数据运营服务部门主要是媒体数据对外服务的运营推广、外部数据资源合作、数据市场的支撑,可以设置数据运营服务职位。而数据技术部门则应该是“数媒”重要的支撑部门,承担着数据技术系统的研发、运维、市场运营的服务支撑等,一般应设置大数据架构师、大数据开发工程师、大数据运维工程师、大数据算法工程师等岗位。如果说在一个数据公司里,市场是方向,那么技术就是基础,人民数据为了打好这个基础,在技术投入方面,以自研为主,仅技术团队就超过500 人,而封面传媒把对技术的投入作为其重要战略投资之一,可以说,数媒要取得发展,必须大力加强在技术团队方面的投入。
第二,岗位角色要创新。“媒体数据”或者说“数媒”,又不同于一般的“数据公司”,媒体可以整合大量的记者采编等人力资源,可考虑采用专职服务团队和兼职人员组成的架构模式。数据技术、数据资产管理,这些职能可以设立专职服务团队来推进,而数据生产、数据运营的大部分职能则可以通过媒体的采编记者或经营人员兼职实现角色转型——记录、采访,记者天然就是数据采集员:梳理、分析,记者天然就是数据分析师。纸媒要变数媒,变成数据公司,就要提倡全员动员:人人都是采集员,人人都是分析师。一个记者或编辑,既可以是数据采集人员,也可以是数据产品的生产人员、策划人员,而报社经营团队则同时可将数据服务能力推向市场。
第三,人才构成要创新。在人才引进的激励机制创新方面必须有所侧重,技术型人才、产品型人才是“数媒”发展不可或缺的人才,而往往传统媒体最缺乏的就是这些专业型人才。要引进这些人才,无论是在岗位职级结构或是薪酬收入体现方面,都不能拘泥于现有体制,要结合市场情况,进行机制创新,要能引得进人才,也要留得住人才。另外,媒体内部对技术决策影响力的重视也有待加强,目前绝大多数报业集团的决策层,一般都没有技术岗成员,可考虑参照广电机构设置总工程师或首席技术官、首席数据官等角色,提升智媒时代的技术、数据决策参考支持力。南方报业成立了集团技术委员会,统筹技术、数据的战略发展,可以说是智媒时代“技术赋能、数据驱动”上务实有效的顶层设计。
媒体融合,在这个传播格局发生深刻变革的时代,如何取势、明道、优术,每个媒体走的路、走路的速度可能不一样,大方向上、大趋势上与大数据时代是一致的。“媒体数据”的新概念、新内涵,如何产生新价值、新动能,还有待观察,而“数媒”和“智媒”是人工智能与媒体相遇、碰撞的必然。心中有数,脑中有智,身体才有力量,手中才有力量。
(作者曹轲系暨南大学新闻与传播学院客座教授、南方报业传媒集团副总编辑;陈良晓系南方报业传媒集团中央数据库项目组成员。本文系国家社科基金重大项目《人工智能时代的新闻伦理与法规》(18ZDA308) 研究成果。)
参考文献:
[1] 叶蓁蓁:《人民日报“中央厨房”有什么不一样》,《新闻战线》2017 年第2 期。
[2] 傅丕毅 徐常亮 陈毅华:《“大数据+ 人工智能”的新闻生产和分发平台——新华社“媒体大脑”的主要功能和AI 时代的新闻愿景》,《中国记者》 2018 年03 期。
[3] 李鹏:《媒体已进入视频化表达、智能化引领时代》,2018年12 月1 日,http://www.sohu.com/a/279236475_99916165,2019年6 月12 日。
[4] 徐园 李伟忠:《数据驱动新闻智能重构媒体——浙报集团“媒立方”技术平台建设的实践与思考 》,《新闻与写作》2018 年01 期。
推荐阅读
经典栏目
精彩专题
关注我们
大视频行业颇具影响力的行业社群平台,重要新闻、热点观察、深度评论分析,推动电视行业与各行各业的连接。
集合电视台、网络视听、潮科技等各种好玩信息。
专注于报道广电行业新鲜5G资讯,致力于成为广电行业有权威、有深度的5G自媒体平台。
UHD、4K、8K的最新资讯和最深入的分析,都在这里。
视频产业的专业圈子,人脉、活动、社区,就等你来。
我们只沉淀有深度的信息和数据。
致力于卫星电视信息、卫星通信技术、天地一体网络应用案例、以及广电、通信等产业的市场动态、政策法规和技术资讯的传播。