(本文作者:国家广播电视总局发展研究中心 张苗苗)
从ChatGPT到Sora,生成式人工智能在文本、图片、音频、视频之间的多模态切换以及相互生成的模式,被认为是最接近人类获取知识的方式。音频行业在AIGC技术应用爆发之前,主要的发展路径是利用智能语音交互来触达多种伴随式场景,包括智能音响、车机、手表、智能家居等等。当前,音频领域正加速融合AIGC技术,在数字人、内容创作与分发、音乐行业、儿童教育与娱乐等方面应用广泛。
AIGC技术正在推动音频行业的内容与业务融合创新。通过智能终端和AI大模型的结合,音频行业能够提供高质量和更加个性化的内容服务。
赋能数字音频领域全链路。AI技术迭代与元宇宙热潮加速虚拟数字人产业的进一步升级。据有关机构统计,2022年中国数字虚拟人带动产业市场规模和核心市场规模分别为1866.1亿元和120.8亿元,预计2025年分别达到6402.7亿元和480.6亿元。音频主播的内容生产呈现垂直细分的态势,包括新闻播报、陪玩陪聊、有声阅读、评书故事、线上PIA戏、K歌直播等,各大音频平台据此划分一系列内容专区,根据自身定位打造头部内容,分析受众偏好进行推送。人工智能语音技术实现有声读物文本与语音转换,提高有声读物生产效率。有声读物市场规模不断扩大,长尾效应得到重视。
多场景应用实现虚实交互更自然更智能。通过语音识别和自然语言处理,用户可以通过语音与音频平台进行更流畅的交流,如语音搜索、语音控制播放等。可以创造新的声音效果和声音角色,为音频内容增添多样性,包括虚拟声音助手、有声读物中的角色配音等。数字人技术可以与智能硬件结合,如智能音响、车机、手表等,提供伴随式场景服务,如语音助手、个性化内容推荐等。AIGC在音频领域的应用,还促发探索了新载体。如结合实体和虚拟元素的音乐作品,这些新载体不仅具有实体的收藏感,还具备虚拟的便捷性,如通过NFC技术与智能手机互动的音乐卡片。同时,也带来音乐出版方式的革新,一些机构研发了新的出版模式,音乐人可以通过一站式的自我出版解决方案,上传自己的音乐并生成销售工具,实现版权自主和直接与乐迷的连接。在智能驾舱场景中,AIGC技术可以提供更加自然和流畅的语音交互体验。通过大语言模型的发展,车辆能够更好地理解用户的指令和需求,如座椅调节、空调控制、氛围灯变化等,从而提供更加精准和智能的响应。
内容创作和分发效率极大提升。AIGC技术可以自动生成音乐、故事、新闻等内容,极大地提高了音频内容的生产效率。例如,通过AIGC技术,儿童内容的创作过程得以加速。原本需要3-4天完成的10分钟左右的故事创作,现在可以在8小时内完成。这种效率的提升使得内容生产变得更加快速和经济。通过AI作曲和编曲技术,用户可以快速创作出个性化的音乐作品。同时,通过AI技术,可以实现自动化的内容创作,如AI简报生成的资讯和亲子共创的故事平台等,为用户提供更加丰富和多样化的内容选择。
服务形态创新增强个性化服务体验。AIGC技术能够根据用户的收听历史和偏好,为其推荐定制化的音频内容,提升用户体验。如生成个性化的播放列表、定制新闻简报等。可以根据听众的特征和偏好,生成个性化的广告内容,提高广告的针对性和效果。在音乐内容领域,通过游戏化、交互式和社群化的方式,让听众参与音乐的体验过程,例如通过互动游戏让听众助力音乐作品的传播,提升音乐体验的趣味性。在教育内容领域,AIGC技术可以用于创建互动式学习材料,如语言学习、历史故事讲解等。对于儿童内容,AIGC技术可以帮助创作更加适合儿童的音频内容,如故事、知识、习惯等,同时还能与智能硬件合作,提供更加互动和有趣的学习体验。
AIGC带来行业创新发展机遇的同时,也面临着技术、法律、安全、伦理等多方面的挑战,需要政府、行业和社会共同努力、跨领域合作,推动技术的健康发展和合理应用。
技术层面。AIGC的出现和应用,在带来便捷高效的同时也存在很多新的风险和挑战。这些风险和挑战,一些是本身技术限制引起的,如生成的内容不能保证真实性、会产生有害言论等。一些是用户对技术使用不当引起的,如在教育、视听内容、科研等领域滥用ChatGPT 等产生的文本。又比如数字人技术虽然发展迅速,但仍存在表情捕捉的精准度、声音合成的自然度等技术不完善的问题。提供高质量的用户体验是数字人技术面临的挑战之一,需要不断优化交互设计和内容创作,以满足用户的期望和需求。
法律层面。AIGC应用涉及大量用户数据的收集和处理,如何确保数据安全和用户隐私不被侵犯是一个重要挑战。需要制定相应的规范和标准,确保技术的规范化和健康发展。AIGC技术在内容创作中的应用还可能涉及知识产权问题,需要明确版权归属和保护创作者的权益。同时,业内提出应对儿童内容安全和隐私保护更加重视。建立严格的内容审核机制和数据安全措施,以确保儿童在享受AIGC技术带来的便利和乐趣的同时,他们的安全和隐私也得到充分保护。
伦理和社会责任层面。在AIGC技术大潮之下,数字人技术的发展引发了伦理和社会责任的讨论,包括数字人的真实性和透明度、对现实社会的影响等。如,与已故亲友的“数字生命”重逢,这样的体验已成为现实,甚至已经成为一门特殊的“生意”。除了“复活”逝者,利用AI数字人技术为现实中的公众名人、网红博主创造数字分身的应用已然成熟,并已具备不容小觑的“吸金”能力。AI“一键复活”的功能存在一系列伦理问题与法律风险,其制作过程涉及对私人信息的提取,生成的内容又具有“以假乱真”的效果,可能会干扰人们的真实记忆。用逝者生前音视频内容做出来的,只是具有其相似音容的数字产物。AI“复活”逝者产业亟须厘清标准与规范,对技术加以科学规制,防止出现更多乱象。
科技与人文平衡层面。很多业内人士提倡在享受AIGC技术带来便利的同时,要关注科技与人文的平衡。比如音频从业者应多关注儿童的线下活动能力,鼓励儿童与真人交流互动,减少对线上活动的过度依赖,在内容创作和服务过程中要注意保护儿童的安全和隐私,引导科技与人文平衡的认知。
音频行业人士认为,目前AIGC技术应用处于起步阶段,在音频领域的应用还远远低于预期。但AIGC在音频创作传播、人机协同等方面已展现出巨大潜力,声音将成为人与人、人与机器之间数字连接的重要桥梁。
为数字音频带来更多机遇。数字音频产品服务的形态多样,涵盖了“音频+影视”“音频+直播”“音频+出版”“音频+智能设备”等创新领域,AIGC技术将进一步赋能音频平台、音频主播、有声读物、智能车联网等方面的生产与传播价值,助力全媒体、全方位开发数字音频的经济价值。
推动智能硬件开发深度合作。AIGC技术正在推动音频行业与智能硬件的深度合作,如智能音响、车机、手表等,为用户提供更加便捷的伴随式场景服务。
助力商业模式闭环与智能营销。通过AI技术,音频平台可以更好地与智能营销结合,实现全链路的闭环服务,如利用技术创建虚拟产品演示和销售、虚拟客服和售后支持等,让用户可以在元宇宙中咨询问题、提出意见和建议,为用户提供更加完善的产品和服务。
推荐阅读
经典栏目
精彩专题
关注我们
大视频行业颇具影响力的行业社群平台,重要新闻、热点观察、深度评论分析,推动电视行业与各行各业的连接。
集合电视台、网络视听、潮科技等各种好玩信息。
专注于报道广电行业新鲜5G资讯,致力于成为广电行业有权威、有深度的5G自媒体平台。
UHD、4K、8K的最新资讯和最深入的分析,都在这里。
视频产业的专业圈子,人脉、活动、社区,就等你来。
我们只沉淀有深度的信息和数据。
致力于卫星电视信息、卫星通信技术、天地一体网络应用案例、以及广电、通信等产业的市场动态、政策法规和技术资讯的传播。