音频压缩技术是在保证信号在听觉方面不产生失真的前提下,对音频数据信号进行尽可能大的压缩。
音频压缩分为:
1.有损压缩(消除冗余信息。如:人的听觉范围是20HZ~2WHZ,因此可以剔除20HZ以下,2WHZ以上的信息)
2.无损压缩
有损压缩:
音频冗余信息:包括人耳听觉范围外的音频信号以及被掩盖掉(遮蔽)的音频信号。其中,遮蔽包括频域遮蔽和时域遮蔽。时域转频域一般采用傅里叶变换和小波变换
无损压缩
编码:
1.哈夫曼编码(根据出现的频率进行编码)
2.算术编码
3.香农编码
常见的编码器
常见的音频编码器包括OPUS(较新的编码器)、AAC、Ogg(收费)、Speex(包括回音消除功能)、iLBC、AMR、G.711等
注:OPUS存在延迟小,压缩率高的特点,现在广泛运用于实时通信的相关应用(WebRTC默认使用OPUS),如:音视频会议、在线教育;
AAC目前应用最广泛的一款编码器(用于取代MP3的),如:安卓系统、IOS、嵌入式系统都包含了硬件的AAC编解码器,FFmpeg中有很多AAC的软件编解码器;
固定电话一般用的是G.711系列(特点:属于窄带音频,编码后数据非常小,适合于在非常窄的网络上进行传输,但是声音损耗非常严重)
OPUS效果要好于AAC,因此今后可能会被取代,我网上看到评测结果:OPUS>AAC>Ogg
从上图可以看出OPUS的优势
从上图可以看出AAC延迟较高,而OPUS适用于低延时场景(实时通信场景)