人耳20kHz封顶,为什么数字音频都要记录和解析到48kHz去?

知乎日报 知乎:马宏菩 260℃ 评论

作者:马宏菩,


基本原理两个:采样定理(
采样定理
)和实际的低通滤波器(
低通滤波器
)。

采样定理很多人都已经提到了,当采样频率大于信号频率两倍的情况下,可以完美地从这些离散采样里还原出原来的连续信号。这个定理很神奇,即使是看懂了数学证明很多人也还是觉得直觉上难以接受。没有从根本上理解这个定理是很多所谓的音频发烧友甚至是“工程师”经常犯错(例如鼓吹什么终端产品也要 96KHz 采样率)的根本原因。这里就不多扯了。

但是一个问题是,这个定理是有一个前提的——信号频率必须有限、小于采样频率的一半。然而现实中,麦克风所能接收、采集到的空气振动的频率范围是非常大的,远远超过人耳听力。如果直接把这样的信号采样,会导致出现混叠。所以必须要先使用一个低通滤波器,把高于阈值的信号过滤掉。然而我们并没有一个理想的低通滤波器!参考第一行的第二个链接,可以看到实际滤波器并不是以一条垂直的直线把信号拦腰砍断,而是一个快速下降的曲线。

音频采样率略高于 40KHz 的原因并不是考虑到“异常听力”——因为实际上 20KHz 这个频率已经有不少冗余了(看过一篇荟萃分析,这个数值是众多心理音响学实验的结果,互相交叉验证了)。再考虑到成年后高频率听力快速下降,不可能有人能听到 20KHz 以上的声音的。

原因其实是给实际低通滤波器留出空间!使得那一段不怎么完美的下降曲线落在 20KHz 之外,不影响音频效果。这个应该是个工程选择。 44.1KHz 被证明完全可以满足需要,另一种常见的 48KHz 也并不会在这一方面有优势。一开始的标准制定者在参考编码等因素后确定了这两大常见频率,也就一直沿用下来了。


c.f. CDDA


另外推荐两个很有帮助的视频:
Xiph.org: Video


查看知乎原文

转载请注明:微图摘 » 人耳20kHz封顶,为什么数字音频都要记录和解析到48kHz去?

喜欢 (0)or分享 (0)
发表我的评论