腾讯主导的AVS3P10语音编码标准发布
keke
2024-06-27
6月27日,中国领先的科技公司腾讯宣布其主导的新一代实时语音编码行业标准AVS3P10已正式定稿并即将对外发布。此次标准的制定过程中,腾讯发挥了重要作用,其音频组采纳了腾讯会议自主研发的神经网络语音编解码器——Penguins AI语音引擎的技术方案。
这款引擎以其创新的AI技术为核心,突破了传统编码技术的限制,能够在低码率环境下提供高质量的语音通信。Penguins AI采用大数据驱动的深度学习算法,能够高效地提取语音特征并预测语音细节,从而生成逼真的音频波形。据多方测试显示,即便在网络条件极其恶劣,如2G网络,AVS3P10标准仍能保证清晰的通话质量,且主观评价接近于OPUS标准在20kbps的水平,相较于传统编码方式,编码效率有显著提升。
自2021年起,Penguins编码器已经在腾讯会议的多个功能模块,包括驾驶模式、弱网模式以及QQ语音通话中得到广泛应用。2023年3月,腾讯正式提出AVS3P10实时语音编码标准的提案,并在AVS音频组的推动下,腾讯的候选技术经过多方验证后被采纳。历经一年多的标准化过程,AVS3P10在2024年6月顺利完成了所有工作流程,进入了公示阶段。
值得注意的是,AVS(Advanced Video Coding)系列标准自2002年中国成立以来,已经成为我国自主知识产权的重要代表,特别是AVS3,它是首个适用于8K视频和5G应用的全球标准。AVS国际组长郑建铧表示,AVS团队正在积极筹备AVS4的后续标准,鼓励各成员机构共同参与,推动全球化的技术标准发展,促进国际化部署。
这一成果不仅提升了国内实时语音通信的技术水平,也为全球范围内的通信行业带来了新的可能性,展示了中国科技公司在音视频编码领域的实力和影响力。