AVS3-P10实时语音标准制定工作进入CD阶段，预计2024年正式发布

2024年03月25日来源：新一代人工智能联盟

导语：《信息技术智能媒体编码第10部分：实时语音》（AVS3-P10）已经完全满足技术需求，主客观测试验证表明其性能在多个对比项中表现最优。

　　2024年3月21日上午，在深圳鹏城实验室举行的第88次AVS标准工作组会议开幕式上，音频组组长窦维蓓宣布了《信息技术智能媒体编码第10部分：实时语音》（AVS3-P10）已经完全满足技术需求，主客观测试验证表明其性能在多个对比项中表现最优，标准制定工作由工作组草案(WD)阶段进入委员会草案（CD）阶段。这一进展标志着AVS3-P10标准制定取得了重大突破，为实时语音通信领域注入了创新的活力。

　　作为全面和系统性引入AI技术的全球首个实时语音编码标准，AVS3-P10真正实现了高质量前提下的低码率编码。按照计划，AVS3-P10标准将于2024年正式发布。

　　在2023年12月16日公布的N3718(AVS3-P10《信息技术智能媒体编码第10部分：实时语音》WD1.1)已经实现了低码率、高质量的单声道实时语音编码，在此基础上，2024年3月15日公布的N3758 （AVS3-P10《信息技术智能媒体编码第10部分：实时语音》CD 1.0），在技术上集成了在AVS音频历代标准中采用的基于极大相关旋转（MCR：Maximum Correlation Rotation）的参数立体声编码技术，并针对实时语音场景重新优化了码书。经过测试，码率低至7.6kbps时也可实现高质量双声道立体声编码效果，更符合AVS3P10高质量、低码率的性能要求。

　　按照ITU-T P.800 DCR主观质量评价规范，中国电子技术标准化研究院的交叉验证，结果表明：在宽带和超宽带场景下，在低于17kbps的测试码率条件下，AVS3-P10的CD1.0实现了双声道立体声主观质量均超过对比系统。

　　进入CD阶段是AVS3-P10标准的关键里程碑，预示着实时语音通信、在线会议等领域的技术创新和应用发展将迎来新的飞跃。

　　AVS3-P10 实时语音编码，作为新一代的语音编解码技术标准，是对AVS系列标准的重要补充。该标准代表了主要技术贡献单位——腾讯在语音处理和人工智能技术创新和用户体验方面的最高追求，体现了业界最高水平，将为用户带来前所未有的性能和体验，引领行业进入一个全新的时代。

【责任编辑：徐亚新】

推荐阅读

品牌活动

24小时阅读榜

热门标签

广电总局	中国广电	中央广播电视总台	卫星互联网	机顶盒
有线	微短剧	5G&6G	网络整合	人事
超高清	应急广播	国际传播	系统性变革	AIGC