6月12日-13日,第三届“融合创新研讨会暨首届智能网关与数字家庭发展论坛”在广州市亚洲国际大酒店举行。本届会议,除与全国各地的广电同仁共同研讨的融合创新发展之路之外,还对智能网关技术与数字家庭领域进行了深入探讨。
在13日下午的“首届智能网关与数字家庭发展论坛”的专题论坛上,香港城市大学教授祝建华做了题为《数据挖掘在智能网关和数字家庭中的应用》的演讲。祝建华指出,从途径来说,三网融合是自上而下的,不仅仅是中央政府再推,还包括电信运营商和电视运营商,这种融合是数据融合,而他认为是自下而上的。
图为:香港城市大学教授祝建华
以下为演讲实录:
各位大家下午好,我的演讲是在前面嘉宾演讲内容的小应用。我们第一次相聚在三网融合的研讨会,大家对三网融合充满了无限的期望。我长期生活在香港,2004年已经有几家电信和电视运营商推行,他们不是走三网,而是一网三用,大家对三网融合拥有很好的前景和憧憬。即使三网融合了,也不过如此。我认为三网融合已经到了山穷水尽的地方,刚才几位嘉宾的演讲已经认同了我的观点。
这次受到邀请,参加智能网关和数字家庭的会议,我感觉我们又走到了第二个境界,就是柳暗花明又一村的境界。在内地已经慢慢的形成共识,如果要采取以前的方法将三网强扭在一起是做不到的,但是在智能网关的概念和框架下,我们会慢慢的走到或者是拿到这样的结果。
我是希望将过去四、五年大家讨论和追求的三网融合和现在慢慢开始出现的情况进行比较,至少我们看到了三种区别。
从途径来说,三网融合是自上而下的,不仅仅是中央政府再推,还包括电信运营商和电视运营商,这种融合是数据融合,我的看法是自下而上的。
各大电信运营商,各大终端和路由器厂商,都希望进行融合。现在的情况就是中原逐鹿,我认为自伤而上不是厂商对接的,而是所有的家庭,所有用户使用产生的数据,因此这是自下而上的方式。从融合的平台,或者是界面来说,以前考虑的三网融合就是将电信网、电话网、电视网结合起来,当时大家纠结的是服务器,包括融合的内容猫和管道,现在大家纠结的是家庭智能网关。现在看到的小米机顶盒或者是小米路由器就是将来的智能网关,我认为未来的智能网关要比现在的产品更加的广泛,我认为智能家居将是未来大的使用和发展的领域。
健康产品、安防产品等等,跟目前广电产品感觉是完全无关,但是在数据融合和智能网关的背景下,会慢慢的走到一起。
融合什么,融合靠什么,用专业习惯或者是专业的偏见来说,真正融合起来的不是硬件,也不是软件,实际上是应用所产生的数据,这就是用户数据。你们是长期做数据挖掘的,这是非常枯燥也是花时间的。
我的题目是数据挖掘,什么是数据挖掘?无非就是将几个不同的学科,同时运用统计学、数据库、机器学习、自然语言处理等方法,然后进行分析,寻找结构化数据或非数据结构化的数据。
经典数据挖掘之一:电视收视率。
如果在座的各位是广电行业的人,对电视收视率一定是非常熟悉的。电视收视率我经常跟其他领域的人沟通,尤其是跟计算机和相关的行业人讲,电视收视率是人类最古老和最经典的大数据挖掘的案例,不敢讲是唯一的,应该是最长久,规模最大的。
大家非常熟悉的就是收据率,在一个城市选择几百户家庭,在他们家的电视上安装一个测试数据,就可以记录这个家庭什么时候看电视,看了哪些频道,什么时候开、什么时候关,什么时候跳到另外的频道,从而搜集数据。这些数据成为电视台和节目制作人员又喜又爱的生命线,这就是行业的收视率数据。实际上除了电视的收视率外,还可以衍生出统计和挖掘的工具和方法,还包括到达率、忠诚度、重叠率,每个细项里面还有很多的分指标。很多非电商行业的人,他们讲起电视是传统的行业,从上世纪五、六十年代开始做数据的搜集,他们挖来挖去,发现做的就是一个是,就是什么时候开电视,什么时候关电视,看什么样的频道。
国际上大部分的地区,都在进行数据的搜索,包括网络购物数据的搜索。最近还跟阿里巴巴、百度签订合作协议,主要是搜集网络相关的数据。有这么多的管道、设施和店面,你的数据挖掘到了吗?每一天会产生各种各样的数据,如果大家要开发的话,我们可以通过这些数据给大家予以帮助。
讲到智能系统,包括电视、互联网、电话、家电、健康系统、安保系统等等。以前只是挖电视收视率,现在分门别类的挖上网和打电话,此时仅仅是个体行为的挖掘。现在将电视的行为和其他的行为结合起来。艾默生作为市场调研公司,他们的数据是了解个体看电视的数据,阿里巴巴是通过网络了解个体的生活行为。家庭中有二、三个人,除的挖个体的行为,还包括数字家庭中的人机交互行为的挖掘。
人与人之间,包括夫妻、父子、母女,他们之间可以构成被挖掘的对象。甚至人与人行为之间的关系,也可以进行数据的挖掘。我们将个体推到家庭,家庭推到居住小区,最后从小区到社会,这是层层递进的挖掘,其中有无数的信息,无数的宝藏,无数的规则,我们可以为他们提供硬件的服务,软件的服务,甚至信息本身可以为用户直接服务的,为什么这么说?他们平时看电视和做各种各样的家庭服务,他们并不知道自己做了什么内容。
有一个产品是可以说明问题的,现在越来越多的人手上带一个智能电子监测器,包括监测睡觉的时候,还有睡觉的质量,运动的情况。现在大家运动的时候,佩戴一个走步机,心跳、体温,了解自己行为后的身体状况。这些行为和数据,不仅仅是提供给运营商,运营商测量这些数据,不仅仅是改变自己的服务,还会将数据卖给广告商和其他的电商。实际上这些数据本身是可以反馈给用户的,用户并不知道行为背后有怎样的规则。
我讲一个大数据神人stephen Woifram的故事,他是数据挖掘的神人和偶像。他可以用三件事情表达。1988年他开发了专业软件,叫做Mathematica,很多读工程的人都在使用这个软件。
2002年出版了《新科学》,一切都可以被计算,世界上没有什么可以不被计算的。他的书遭受到很多人的反对,大家认为任何的东西都要被计算。12年过去了,现在讲大数据和计算,很多人想起来了他的书。当年大家不能接受,因为人的很多行为,无法记录下来。他远远走在我们的前面,当时大家不能理解,现在知道了,所有的行为,无论是好事坏事,或者是所惑所思都被记录下来了,因此计算是水到渠成和必然的结果。
2009年创办了计算机搜索引擎,跟百度和谷歌不一样,它是计算搜索引擎的。他自己是身体力行去做的,因为他有这样的实践,因此提出了这样的口号。
1990年到2012年间个人发了300万条电子邮件记录,纵轴标是一天24小时的分布,相当于日点图,越深的地方,发得越多,空的地方发得比较少。2002年是一个转折点,2002年前睡觉是略早一点的,半夜12点睡觉到凌晨3、4点。
1998年到2002年睡得比较晚,就是写《新科学》这本书,书写完了以后,生活是相当有规律的。
2002年—2012年间个人电脑键盘的1亿条记录,我们的键盘是102个键,每个键都有一个代码,只公开了一个信息,其他的信息没有讲,因为全部公开的话,就知道他打什么字。他7%的时间是打了DEL这个键,这说明7%的按键是浪费的。如果是我的数据,我估计可能是21%,因为我经常用删除键的。
2000—2012年个人会议时间记录,他这些记录都是十几年或者是二十年的数据,还包括电话记录、个人健身记录,他跑步都用电脑记录,甚至走路的时候,专门做了一个键盘,左手一个键盘,右手一个键盘,边走边打字,打字的速度跟坐下来打的速度基本上是相同的。
将所有的内容会合起来,他为自己总结了一些经验。他引以为豪的是,一天之内跟家人在一起的时间,吃完饭的时间基本上是雷打不动的。下班就回家吃晚饭,其他的时间都在工作,这不是我要举的列子。大家想一想,今天已经有记录大家起居饮食、娱乐信息、沟通、健康、家务所有活动的可能性,很多的数据已经存在了。智能网关只是提供一个平台,将这些数据结合起来。
时间是我们了解人的一把钥匙和窗口,我们也做了这样的工作。今天不是具体看这些研究案例的时候。
我描述的这种场景,在目前来讲,目前还只是一种可能,还不是现实的情况。网关提供了一种可能性,当中看到各种各样的技术,包括人才、信息和法律内容。目前,大家对于互联网的信息产生了担忧,欧洲制定和相当多的法律予以限制。如果我们将家具、安防、健康、游戏等等整合在一起的话,这些数据是否可以拿到,我希望这些数据不会被别人拿到,我希望拿别人的数据。对于社会所有的人而言,这就是一种两难。因此希望搞研究,搞技术,制定法规的人共同坐下来谈。斯诺登事件出来后,全世界各阶层都在进行辩论。我个人认为,互联网的今天,大数据的今天。便利和安全两者永远是矛盾的,要找到两者之间的平衡,一定要有关的利益,厂商、服务商,用户坐在一起,找到各方可以接受的边界。用户希望是免费的,越便宜越好,越好用越好。但是信息不能拿出去分享,让马儿跑,又不能让马儿吃草。厂商是做什么的,厂商就是希望拿到的信息越多越好。他们希望提供网络设施,并且将影视、安全和利益相关方的数据界定好。
因为时间的关系,我就讲到这里,谢谢各位。
推荐阅读
经典栏目
精彩专题
关注我们
大视频行业颇具影响力的行业社群平台,重要新闻、热点观察、深度评论分析,推动电视行业与各行各业的连接。
集合电视台、网络视听、潮科技等各种好玩信息。
专注于报道广电行业新鲜5G资讯,致力于成为广电行业有权威、有深度的5G自媒体平台。
UHD、4K、8K的最新资讯和最深入的分析,都在这里。
视频产业的专业圈子,人脉、活动、社区,就等你来。
我们只沉淀有深度的信息和数据。
致力于卫星电视信息、卫星通信技术、天地一体网络应用案例、以及广电、通信等产业的市场动态、政策法规和技术资讯的传播。