2018年6月7日,中国第二代数字音频编码标准《信息技术 高效多媒体编码 第3部分:音频》(简称AVS2音频标准)由国家市场监督管理总局和国家标准化管理委员会颁布为国家标准(“中华人民共和国国家标准公告2018年第9号”),标准代号GB/T 33475.3-2018,将于2019年1月1日正式实施。AVS2音频国家标准适用于全景声电影、超高清电视、互联网宽带音视频业务、数字音视频广播、无线宽带多媒体通信、虚拟现实和增强现实及视频监控等领域,所服务的产业规模非常庞大。艺恩应邀专访了AVS音频组联合组长、北京全景声信息科技有限公司潘兴德博士,潘博士分享了他对AVS2音频标准的解读和观点。

什么是第二代数字音频编码标准(AVS2)?

潘兴德博士介绍说,近期颁布的我国第二代数字音频编码标准(简称AVS2音频标准),是立足于提供完整的高清三维视听技术方案,可与第二代AVS视频编码(AVS2视频)等视频标准配套,是更适合超高清、3D新一代视听系统需要的高质量、高效率音频编解码标准。该标准具有技术先进、内容全面、系统整合度高、适应面广、使用灵活等技术特点,且具有高压缩率、高音质和低复杂度的性能特点。将应用于全景声电影、超高清电视、互联网宽带音视频业务、数字音视频广播、无线宽带多媒体通信、虚拟现实和增强现实及视频监控等领域。

潘兴德博士介绍说,AVS2音频标准制定历时7载,共征集了93项提案,通过“打擂台”的模式保证标准的先进性,进行了多种试验和验证,包括技术提案的交叉验证,相同技术点不同技术方案的对比核心试验、标准文本与参考代码的一致性测试、无损压缩编码的客观压缩率测试、通用压缩编码的主观音质测试,以及解码复杂度分析等,并对比分析MPEG-2 AAC、MP3、某国际著名公司产品、IEEE 1857.2和AVS2音频五种编解码器的性能,多次测试表明,AVS2音频性能最优,压缩率最高且稳定性最好。

AVS2音频国家标准有什么意义?

潘兴德博士解读AVS2音频国家标准的意义时说,该标准适用于全景声电影、超高清电视、互联网宽带音视频业务、数字音视频广播、无线宽带多媒体通信、虚拟现实和增强现实及视频监控等领域,所服务的产业规模非常庞大,需要加速落地。

潘兴德博士引用了很多数据,根据工信部发布的《2017年电子信息制造业运行情况》,2017年我国手机产量19亿部、彩色电视机产量1.73亿台、计算机3.07亿台,中国视听相关产业总体规模超过4万亿元。根据原国家新闻出版广电总局《2016年新闻出版产业分析报告》,2016年,全国新闻出版产业营业收入2.36万亿元,较2015年加1939.9亿元,增长9.0%。其中,数字出版继续保持高速增长,对全行业营业收入增长贡献超过三分之二。根据国家广播电视总局《2017年全国广播电视行业统计公报》, 2017年全国广播电视服务业总收入6070.21亿元,比2016年(5039.77亿元)增加1030.44亿元,同比增长20.45%。根据国家电影局统计数据,2017年全国电影总票房559亿元,剔除服务费后,2017年全国电影总票房约为524亿元,同比增幅为13.45%,同样创下历史新高。但是潘兴德博士也强调,我国视听科技和文化相关产业大而不强,核心技术长期受制于人,我国不仅每年需要向国外企业支付大量的专利费用,同时也面临巨大的国际政治和经济风险。今年的中兴禁售事件及中美贸易战,突出的反应了我国在核心技术领域还受制于人,企业、行业和国家在国际环境风云突变时,将面临重大风险。AVS2音频国家标准的颁布,不仅为国家每年节省上百亿的西方技术授权费用,更将有力促进我国在视听科技产业、影视文化产业、数字出版产业等相关行业的国产化,降低甚至消除对外国技术的依赖。

AVS2音频国家标准的由来是什么?

潘兴德博士提起该标准制定过程,感慨良多,详述了其中的不易艰辛,但更多的是责任感和自豪感。他说,AVS2音频标准颁布,是我国数字音频技术长期积累的必然结果,是我国顶尖音频科学家历时近20载的集体智慧成果。AVS2音频标准的成功制定,离不开我国近20年来音视频技术及相关产业奋发图强的历史背景。

从“DVD专利费征收事件”到AVS2音频标准颁布,潘博士详细介绍了AVS2音频国家标准的风雨征程。他介绍说,1999年中国已成为DVD的最大生产国和出口国,并很快占据世界产量的90%。但产销量巨大背后存在的严重问题是:DVD的核心专利和技术标准全部为国外企业掌握,DVD的核心元器件都是从国外进口,在国内只是简单的组装,我国企业基本没有自己的知识产权。1999年开始,3C联盟(飞利浦、索尼、先锋,后来LG也加入)、6C联盟(东芝、三菱、日立、松下、JVC、时代华纳,后来IBM也加入)、汤姆逊、杜比、DTS等开始向DVD企业征收高昂的专利许可费用,这就是在我国科技和产业界影响深远的“DVD专利费征收事件”。鉴于严峻的国际产业竞争局面,原信息产业部积极响应DVD相关企业的迫切需求,于1999年10月,联合经贸委正式批准组建“中国数字光盘技术联合体”,并列专项拨款1000万,要求以企业为主体,产学研用联合,2001年完成“新一代高密度数字激光视盘系统技术”(即EVD)计划任务。潘兴德博士介绍说,AVS2音频标准的核心贡献者,除了自己之外还有陈笑天博士,都是EVD技术研发、标准化和产业化的核心成员。EVD是我国音视频原创技术从科研院所走向规模产业化应用的第一次尝试,并采用了我国第一代数字音频编码技术。

潘兴德博士介绍说,到了2002年3月,第178次香山科学会议在北京举行,旨在探讨宽带网络多媒体领域的重要科学问题和流媒体技术的标准化问题。作为此次会议的重要成果,2002年6月,原信息产业部批准成立“数字视音频编解码技术标准化工作组”(即AVS),以集中我国的科研开发力量,联合攻关,制定我国的数字音视频标准。AVS工作组组长为高文教授,秘书长为黄铁军博士,潘兴德博士则是当时的音频组召集人。

潘兴德博士总结说,从AVS成立到AVS2音频标准颁布,历时整整16载,在AVS总体组的领导下,AVS音频组历任组长(潘兴德博士、胡瑞敏教授、窦维蓓教授)及国内顶尖音频科学家经历16年的艰苦努力,终于推出了国际顶尖水平的中国第二代音频编码技术标准。

潘兴德博士进一步介绍,AVS2音频标准是产学研合作的成功案例,AVS2音频标准共采用全景声科技、清华大学、华为、北京大学、天籁传音和中科开元等单位贡献的27项专利技术。其中,潘兴德博士领导的全景声科技团队贡献了多数专利技术。

 

WANOS全景声音频处理器系列

 

WANOS全景声影音接收机系列

AVS2音频标准已全面投入市场,仍需多行业落地

潘兴德博士介绍说,在AVS2音频标准化的同时,全景声科技等核心企业已经将AVS2音频技术应用于数字电影制作、编码和还音领域,以及网络音乐和娱乐领域,产业化应用进一步促进了AVS2音频的快速成熟。潘兴德博士说,作为AVS2音频的核心贡献单位,全景声科技在AVS2音频的基础上,引进面向声音对象的全景声渲染和声场处理技术,推出完全自主知识产权的中国全景声(WANOS)系统解决方案。WANOS全景声可提供多达128 个声道和128 个声音对象的录音编辑、编码、解码和声场合成,可以支持任意扬声器配置的声场回放。WANOS全景声能够提供最真实的三维听觉体验,例如,当影片上出现飞机飞过的画面,观众就能身临其境的感受到头顶呼啸而过的飞机轰鸣,实现了真正的声画空间同步。

潘博士说,中国全景声(WANOS)首先应用于电影制作和影院放映领域,已成功制作了《拆弹专家》、《记忆大师》、《悟空传》、《低压槽》、《幸福马上来》和《龙虾刑警》等全景声影片,并在各大院线上映。在接下来的暑期档,中国全景声版《邪不压正》、《狄仁杰之四大天王》、《西虹市首富》、《解码游戏》、《一出好戏》、《大师兄》和《反贪风暴3》等更多票房佳作也将陆续进入影院热映。

WANOS全景声制作系统

此外,潘博士介绍说,中国全景声(WANOS)编解码设备已在上海星轶、完美世界、内蒙民族院线、明星时代、魔影影投、华夏U+等院线投入使用,覆盖100多个影厅, 影院遍布北京、上海、广州、石家庄、呼兰浩特、郑州等城市。随着产业链的完善、全景声影片的增加和市场口碑的树立,中国全景声(WANOS)在影院市场已进入快速增长阶段。

潘博士还介绍说,采用AVS2音频中低码率技术的中国全景声(WANOS)点播影院解决方案也于2018年6月上海电影节期间投放市场,以响应国家刚刚出台的《点播影院、点播院线管理规定》。目前,中国全景声(WANOS)点播影院解决方案已被众多主流点播影院品牌、集成商采用。而采用AVS2音频中低码率技术的中国全景声(WANOS)家庭影院、条形箱和电视解决方案也已投放市场,因其显著的性价比优势,为我国主要电视、机顶盒等整机厂商采用。目前,“天籁K歌”等大型网络音乐平台正在采用AVS2音频中低码率技术实现技术升级。AVS2音频可以提供更高的编码效率,能够有效提升现有大型音乐平台的音乐体验,并降低平台的带宽和运营成本。

除了影视领域,潘博士介绍说,AVS2音频应用行业其实非常广阔,已经被越来越多的通用DSP、电视芯片、机顶盒芯片和手机芯片采用,为AVS2音频的快速普及提供了良好的产业化基础。