音频编码技术

2020-06-02

音频压缩技术是在保证信号在听觉方面不产生失真的前提下，对音频数据信号进行尽可能大的压缩。

音频压缩分为：

1.有损压缩（消除冗余信息。如：人的听觉范围是20HZ~2WHZ，因此可以剔除20HZ以下，2WHZ以上的信息）

2.无损压缩

有损压缩：

音频冗余信息：包括人耳听觉范围外的音频信号以及被掩盖掉（遮蔽）的音频信号。其中，遮蔽包括频域遮蔽和时域遮蔽。时域转频域一般采用傅里叶变换和小波变换

编码：

1.哈夫曼编码（根据出现的频率进行编码）

2.算术编码

3.香农编码

常见的音频编码器包括OPUS（较新的编码器）、AAC、Ogg（收费）、Speex（包括回音消除功能）、iLBC、AMR、G.711等

注：OPUS存在延迟小，压缩率高的特点，现在广泛运用于实时通信的相关应用（WebRTC默认使用OPUS），如：音视频会议、在线教育；

AAC目前应用最广泛的一款编码器（用于取代MP3的），如：安卓系统、IOS、嵌入式系统都包含了硬件的AAC编解码器，FFmpeg中有很多AAC的软件编解码器；

固定电话一般用的是G.711系列（特点：属于窄带音频，编码后数据非常小，适合于在非常窄的网络上进行传输，但是声音损耗非常严重）

OPUS效果要好于AAC，因此今后可能会被取代，我网上看到评测结果：OPUS>AAC>Ogg

从上图可以看出OPUS的优势

从上图可以看出AAC延迟较高，而OPUS适用于低延时场景（实时通信场景）