中广格兰旗下网站:中广互联  格视网  卫星界  社区
登录注册

登录X

没有账号?  快速注册>

首页新闻正文

AVS3-P10实时语音标准制定工作进入CD阶段,预计2024年正式发布

导语:《信息技术 智能媒体编码 第10部分:实时语音》(AVS3-P10)已经完全满足技术需求,主客观测试验证表明其性能在多个对比项中表现最优。

  2024年3月21日上午,在深圳鹏城实验室举行的第88次AVS标准工作组会议开幕式上,音频组组长窦维蓓宣布了《信息技术 智能媒体编码 第10部分:实时语音》(AVS3-P10)已经完全满足技术需求,主客观测试验证表明其性能在多个对比项中表现最优,标准制定工作由工作组草案(WD)阶段进入委员会草案(CD)阶段。这一进展标志着AVS3-P10标准制定取得了重大突破,为实时语音通信领域注入了创新的活力。

  作为全面和系统性引入AI技术的全球首个实时语音编码标准,AVS3-P10真正实现了高质量前提下的低码率编码。按照计划,AVS3-P10标准将于2024年正式发布。

  在2023年12月16日公布的N3718(AVS3-P10《信息技术 智能媒体编码 第10部分:实时语音》WD1.1)已经实现了低码率、高质量的单声道实时语音编码,在此基础上,2024年3月15日公布的N3758 (AVS3-P10《信息技术 智能媒体编码 第10部分:实时语音》CD 1.0),在技术上集成了在AVS音频历代标准中采用的基于极大相关旋转(MCR:Maximum Correlation Rotation)的参数立体声编码技术,并针对实时语音场景重新优化了码书。经过测试,码率低至7.6kbps时也可实现高质量双声道立体声编码效果,更符合AVS3P10高质量、低码率的性能要求。

  按照ITU-T P.800 DCR主观质量评价规范,中国电子技术标准化研究院的交叉验证,结果表明:在宽带和超宽带场景下,在低于17kbps的测试码率条件下,AVS3-P10的CD1.0实现了双声道立体声主观质量均超过对比系统。

  进入CD阶段是AVS3-P10标准的关键里程碑,预示着实时语音通信、在线会议等领域的技术创新和应用发展将迎来新的飞跃。

  AVS3-P10 实时语音编码,作为新一代的语音编解码技术标准,是对AVS系列标准的重要补充。该标准代表了主要技术贡献单位——腾讯在语音处理和人工智能技术创新和用户体验方面的最高追求,体现了业界最高水平,将为用户带来前所未有的性能和体验,引领行业进入一个全新的时代。

【责任编辑: 徐亚新 】

推荐阅读

热门标签

作者专栏更多

关注我们

    中广互联
  1. 大视频行业最具影响力的媒体社群平台,重要新闻、独家视频、深度评论分析,推动电视行业与各行各业的连接。

  2. 电视瞭望塔
  3. 集合电视台、网络视听、潮科技等各种好玩信息。

  4. 5G Plus
  5. 专注于报道广电行业新鲜5G资讯,致力于成为广电行业有权威、有深度的5G自媒体平台。

  6. 4K8K
  7. UHD、4K、8K的最新资讯和最深入的分析,都在这里。

  8. 中广圈子
  9. 视频产业的专业圈子,人脉、活动、社区,就等你来。

  10. 格兰研究
  11. 我们只沉淀有深度的信息和数据。

  12. 卫星界
  13. 致力于卫星电视信息、卫星通信技术、天地一体网络应用案例、以及广电、通信等产业的市场动态、政策法规和技术资讯的传播。