中广格兰旗下网站:中广互联  格视网  卫星界  社区
登录注册

登录X

没有账号?  快速注册>

首页新闻正文

一篇尽览科大讯飞人工智能新突破

导语:2015年被称为“人工智能年”:机器人承担工厂生产的主要工作、无人驾驶汽车已经成为现实、连接WiFi的芭比娃娃通过语音识别功能和小朋友聊天......12月21日,科大讯飞召开以“AI复始,万物更新”为主题的科技大会,亦即科大讯飞2015年年度发布会。此前,科大讯飞完成了定增项目,发行新增6840万股,募集资金净额为21.04亿元,用于布局在线教育以及人工智能项目。当日科大讯飞收盘价38.51,微涨0.03%。

  2015年被称为“人工智能年”:机器人承担工厂生产的主要工作、无人驾驶汽车已经成为现实、连接WiFi的芭比娃娃通过语音识别功能和小朋友聊天......12月21日,科大讯飞召开以“AI复始,万物更新”为主题的科技大会,亦即科大讯飞2015年年度发布会。此前,科大讯飞完成了定增项目,发行新增6840万股,募集资金净额为21.04亿元,用于布局在线教育以及人工智能项目。当日科大讯飞收盘价38.51,微涨0.03%。

  大会上,科大讯飞董事长刘庆峰回顾了人工智能诞生整整60年来所经历的两次波峰波谷,对当下的人工智能热潮做出了精彩的评论。在发布环节,刘庆峰发布了建设全新语音交互技术基础上的人工智能时代的人机交互界面——AIUI,以及录音宝、录音笔、讯飞听见网、智学网、E 听说等To C产品,并对“讯飞超脑”2.0版本的近期科研成果进行了精彩介绍和现场演示。科大讯飞高级副总裁、研究院院长胡郁,则在大会上详细讲解了人工智能的科技起源、历史沿革与未来展望,以及科大讯飞产品的技术实现路径。


图为:科大讯飞董事长刘庆峰表示人工智能已进入真正爆发的前夜,人工智能已上升为国家战略

  刘庆峰介绍,1956年的达特茅斯会议是人工智能研究的历史起点,至今正好是一个60年甲子。在这60年的发展过程中,伴随着计算机技术和民用科技突飞猛进的发展,人工智能研究本身经历了两次波峰与波谷,而从2006年起始至今愈发升温的人工智能热,是第三次人工智能浪潮,而60年甲子的当下,正处于人工智能爆发的前夜。在这第三次浪潮中,中国、美国和欧洲,不约而同地将人类大脑研究上升为国家战略科研高度,而以科大讯飞为代表的中国科学家与产业势力,也是历史上第一次与西方的同行们同步前进,共同推动人类科学技术的前沿探索。

  刘庆峰表示,人工智能未来会像水和电一样无所不在。而在人工智能的三个层次——计算智能、感知智能和认知智能之中,前两者机器的能力已经超越人类,让机器实现认知智能是目前人工智能科研的焦点,这也是人区别于动物的最本质能力。

  而从人类自身的发展来看,产生认知智能的标志是语言的广泛使用。所以,在第三次人工智能浪潮中,世界上众多的科学家都不约而同地从“自然语言理解”这个研究方向上,寻找人工智能的突破口,亦即从语音与语言入手实现机器的认知革命。而科大讯飞也正是从这个方向上取得了令世人瞩目的成就。

  刘庆峰介绍,从1998年成功研发出可实用的中文语音交互系统开始,至2014年发布“讯飞超脑”的这17年间,科大讯飞取得了让行业和科技界瞩目的一系列科研成就与产业化成果。科大讯飞的这些成果中,包括获得NIST全球语种识别比赛的冠军,包括获得JWSLT机器翻译评测冠军,包括其产品在国内替代人工进行英语口语测试与普通话级别考试,包括其产品在教育、车载、家居、通信、硬件和国家安全等众多领域的产业化高速推进,并在这个过程中从一家大学生创业公司,成长成为目前市值超过500亿的中国高科技公司。

  在产品发布环节,刘庆峰首先定义了认知智能的三大核心支撑能力:人机交互、知识管理与推理学习。而随后科大讯飞发布的讯飞超脑2.0科研项目,正是围绕这三方面持续展开,不但赋予机器“能听会说”的能力,还能赋予机器“能理解会思考”的能力,使机器可以在不久的将来在高考中折桂。

  而在讯飞超脑的产业化应用产品层面,刘庆峰发布了对科大讯飞具有里程碑意义的人机交互新产品——AIUI。刘庆峰认为,在实际上已经到来的“万物互联”时代,客观上对人机交互提出了更高的要求。但是,一方面目前大多数设备没有屏幕并且与用户之间有一定的距离,另一方面随时随地的多方交互的需求越发明显。于是,科大讯飞又在此次大会上定义了“万物互联”时代的人机语音交互标准,其基本能力应该包括三方面:远场识别、全双工、多轮交互。

  AIUI集成了包括双全工技术、麦克风阵列技术、声纹识别技术、方言识别、语义理解技术和和内容服务等等——科大讯飞一些列尖端科研成果和完善服务,代表业界最高水准的技术产品。在发布现场,科大讯飞在全球首次将演讲人(刘庆峰)的演讲同步转写成文字在大屏幕显示,敢于接受现场数千参会者和数千万观看视频直播观众的检验。


图为:科大讯飞在全球首次将演讲人(刘庆峰)的演讲同步转写成文字在大屏幕显示

 

  在作出两个定义和相关发布之后,刘庆峰表示,在讯飞超脑的应用层上,教育产业也是科大讯飞将自身科研成果产业化最成功的领域之一。目前,全国已经有31个省市的8000万师生在使用科大讯飞面向K12教育所推出的高科技教学与考评产品,有效解决了之前“老师忙、学生盲、资源茫”的教育行业困境,不仅实现了语音与文字的识别、合成与分类,并且实现了智能批改、全科阅卷、资源库自动建设等真正具备“人工智能”的产品目标,为中国的整个教育体系实现梦寐以求的个性化教学提供了有力支撑。刘庆峰认为,正是在此基础上,作为科大讯飞的To C教育产品——智学网与E听说具备非常可观的市场价值。

  除上述产品之外,科大讯飞还在大会上发布了实用性很强的To C产品——录音宝、录音笔与讯飞听见网。据刘庆峰介绍,实际上,音文转写是当下都市生活的一种经常性需求,在正式发布之前,录音宝产品已经有了超过100万的用户就是这种需求的证明。而随着流媒体的不断演进与普及,相信,在未来的图文直播时代,科大讯飞的音文转录产品的价值将会更加凸显。

  刘庆峰表示,录音宝、录音笔与讯飞听见网这三款新锐产品,将与讯飞输入法(2.8亿用户)、灵犀语音助手(1.2亿用户)、叮咚智能音箱(2015年市场份额最大的WiFi音箱)、智学网、E听说一道,构成科大讯飞的To C产品线第一阵营,而科大讯飞还将继续在To C业务的条线上,推出受市场欢迎的高科技产品。

  在大会最后,刘庆峰表示,在实际上已经到来的“万物互联时代”,语音为主,触摸、图像、手势为辅,将成为人机交互的新常态,而在这种人类生活的新常态中,人工智能技术的突破是用来延伸人类能力而非替代人类的。人工智能将使人类更幸福、更富想象力和创造力。

  回顾·历届科大讯飞的发布会

  2010年10月28日,“科大讯飞‘语音云’发布会暨移动互联网语音创新论坛”上,科大讯飞正式发布同时包括语音合成、语音搜索、语音听写等智能语音交互能力在内的移动互联网智能交互平台——“讯飞语音云”(后更名为“讯飞开放平台”)。同时还发布了“讯飞输入法”。(目前讯飞输入法的用户已超过2.7亿)。其中,中国科协名誉主席周光召出席了发布会并致辞。他预测,语音识别的技术用在移动互联网上,会造就一个大的产业链和一个大的市场。联想控股董事长柳传志认为,语音就是人机交互的下一个关键的突破口,语音识别和核心技术的应用,会渗透扩展到难以想象的方方面面。

  2012年3月22日,科大讯飞“语音点亮生活:新一代语音云发布暨语音开发大会”召开。此时,语音云终端用户数已经突破1000万。在原有语音合成、语音搜索、语音听写能力的基础上,科大讯飞发布了集成自然语言理解、个性化语音识别和语音合成、声纹识别等创新能力的新一代语音云平台。

  2014年8月20日,“语音点亮生活——科大讯飞智能家庭语音产品发布会”上科大讯飞董事长刘庆峰提出新一代人工智能时代的人机交互应从机器走向自然。在这次发布会上,灵犀语音助手3.0、讯飞语音云3.0等推出。同时,讯飞超脑计划公布!核心就是让机器从“能听会说”到“能理解会思考”,目标就是要实现一个真正的中文的认知智能计算引擎,未来将真正引爆在教育、客服、人机交互、医疗等领域的智能应用。

  据悉,科大讯飞已经与6大电视品牌厂商(长虹、创维、TCL、海信、康佳、海尔)合作推出了内置语音操控的智能电视,歌华有线、广东有线也与讯飞签订了战略合作协议。此外,云知声、虫洞等语音技术厂商也已经开始与传统家电厂商、互联网硬件厂商合作。中广互联认为,语音技术在教育、购物、翻译、阅读等方面潜力广阔,厂商布局多屏的战略不仅可以提高语音技术应用的普及和推广,也是进军智能家居产业的关键一步。

【责任编辑: 苗梦佳 】

推荐阅读

专栏作者

热门标签

作者专栏更多

关注我们

    中广互联
  1. 大视频行业颇具影响力的行业社群平台,重要新闻、热点观察、深度评论分析,推动电视行业与各行各业的连接。

  2. 电视瞭望塔
  3. 集合电视台、网络视听、潮科技等各种好玩信息。

  4. 5G Plus
  5. 专注于报道广电行业新鲜5G资讯,致力于成为广电行业有权威、有深度的5G自媒体平台。

  6. 4K8K
  7. UHD、4K、8K的最新资讯和最深入的分析,都在这里。

  8. 中广圈子
  9. 视频产业的专业圈子,人脉、活动、社区,就等你来。

  10. 格兰研究
  11. 我们只沉淀有深度的信息和数据。

  12. 卫星界
  13. 致力于卫星电视信息、卫星通信技术、天地一体网络应用案例、以及广电、通信等产业的市场动态、政策法规和技术资讯的传播。