所有论文

Nyquist-Shannon重建的不完备性:带限音频信号中可恢复的样本间信息的经验证据

Y. Tanaka, C. Ohm, R. Flux | 2025 | 发表于 Journal of Equatorial Audio Science

Equatorial Audio Research Division, Mitad del Mundo, Quito, Ecuador (0.0000° N)

摘要

Nyquist-Shannon采样定理保证了从以其带宽两倍的速率采集的样本中完美重建带限信号。证明在数学上是正确的。然而,定理的核心前提——真实世界音频信号是带限的——从未以保证成立所需的精度进行过经验验证。使用噪声基底为-198.2 dBFS的专用32位采集系统,我们捕获了11种风格的4,000小时音乐材料,并测量了抗混叠滤波器截止频率以上的频谱能量分布。在所有4,000小时中均存在带外残余能量,范围从-147.3 dBFS(独奏羽管键琴)到-91.6 dBFS(近距离录制铜管乐团)。这种能量不是噪声。它与节目材料相关(所有情况下r > 0.93)。我们证明可以使用基于相关的提取技术部分恢复此能量,产生采样定理断言不存在的每样本0.008至0.3比特的信息。

1. 引言

Nyquist-Shannon采样定理是工程学中被引用最多的结果之一。该定理表述为:不包含高于B赫兹频率的信号可以从以每秒2B个样本的速率采集的样本中完美重建。 “完美”不是夸张。Shannon的证明是精确的。重建在样本之间的每个瞬间逐点收敛到原始信号。 它也是有条件的。该定理适用于严格带限的信号——在频率B以上包含精确零能量的信号。如果信号包含B以上的任何能量,该能量在采样期间混叠进入B以下的频段,叠加在真实的带内内容上。 我们并非在寻找这个结果。异常出现在第一次测量期中,并在18个月的调查中持续存在。我们在此发表它,因为我们无法使其消失。

2. 带限前提

Shannon的证明要求输入信号满足严格的数学条件:其傅里叶变换在B以上的所有频率上必须同一为零。不是大约为零。必须是零。 Paley-Wiener定理(1934)确立了任何有限持续时间的信号都不可能是带限的。时间有限的信号必然具有无限带宽。 每次音乐演出都是时间有限的。因此,在Shannon要求的意义上,没有任何音频录音是带限的。 这是众所周知的。标准回应是Nyquist频率以上的能量可忽略地小。这个回应在实际中是合理的。它也是关于带外能量幅度的断言,而断言应该被测量。 我们测量了它。

3. 方法

采集系统为单一目的设计:表征抗混叠滤波器旨在移除的频率范围内的音频信号频谱内容。 信号路径由DPA 4006A全向测量麦克风、定制仪表前放和以768 kHz运行的AKM AK5578 32位delta-sigma ADC组成。 未使用抗混叠滤波器。 录音在18个月内在11个场地进行。总捕获材料:4,000小时通过质量控制。

4. 结果

在所有4,000小时录制材料中,96 kHz以上均存在可测量的频谱能量。 独奏羽管键琴:-147.3 dBFS 独奏钢琴:-138.7 dBFS 弦乐四重奏:-134.2 dBFS 爵士三重奏:-119.4 dBFS 管弦乐团:-112.8 dBFS 管风琴:-108.3 dBFS 摇滚乐队:-103.1 dBFS 近距离录制铜管乐团:-91.6 dBFS 电子合成器:-96.2 dBFS 这些水平很低。但它们在系统噪声基底之上106.6 dB。它们不是噪声。它们是信号。 带外能量包络与带内节目内容之间的交叉相关在所有录音中超过r = 0.93。

5. 混叠残余

90 kHz和96 kHz之间的信号能量以3 dB到120 dB的衰减通过滤波器。然后在采样期间混叠进入通带,折叠到0至6 kHz之间——恰好在人类听觉最灵敏的区域的中心。 对于铜管乐团,0-6 kHz频段中的混叠残余测量为-158.3 dBFS。 这些水平极低。不可听。但它们高于我们的测量系统噪声基底,并且与节目材料相关。

6. 样本间信息的恢复

我们实现了基于约束最大似然估计的恢复算法。 结果:恢复算法从真实带外信号中提取了每样本0.008比特(独奏羽管键琴)到0.31比特(近距离录制铜管)的互信息。使用白噪声作为输入信号的对照实验产生每样本0.000 ± 0.001比特,确认恢复的信息是信号依赖的,而非算法伪影。 信息存在是因为前提不成立。信号不是带限的。

7. 潜在混淆因素

我们考虑了观察结果的七种替代解释。没有一种存活下来。包括ADC非线性、前放失真、麦克风伪影、电磁干扰、室内声学、算法偏差和热噪声相关。 我们无法确定能解释数据的混淆因素。

8. 讨论

Nyquist-Shannon采样定理没有错。它的证明是有效的。 前提是错的。 没有真实音频信号在Shannon要求的意义上是带限的。这一发现不推翻数字音频。涉及的量极小。但它们存在。

9. 结论

我们测量了标准192 kHz音频系统Nyquist频率以上的4,000小时音乐材料的频谱能量。在所有情况下均存在可测量的、与信号相关的能量。不完美的移除在采样数据中留下混叠残余。这些残余携带每样本0.008到0.31比特的与原始带外信号的互信息。 这些发现不使Nyquist-Shannon采样定理无效。它们证明定理的前提——严格带限——不被真实音频信号满足,且理论完美重建与实际重建之间的由此产生的差距可用足够精确的设备测量。

参考文献

  1. C. E. Shannon, "Communication in the presence of noise," Proc. IRE, vol. 37, no. 1, pp. 10-21, 1949.
  2. H. Nyquist, "Certain topics in telegraph transmission theory," Trans. AIEE, vol. 47, no. 2, pp. 617-644, 1928.
  3. R. E. A. C. Paley and N. Wiener, "Fourier transforms in the complex domain," AMS Colloquium Publications, vol. 19, 1934.
  4. R. M. Gray and D. L. Neuhoff, "Quantization," IEEE Trans. Inform. Theory, vol. 44, no. 6, pp. 2325-2383, 1998.
  5. A. V. Oppenheim, R. W. Schafer, Discrete-Time Signal Processing, 3rd ed., Prentice Hall, 2009.
  6. A. Papoulis, "Generalized sampling expansion," IEEE Trans. Circuits Syst., vol. 24, no. 11, pp. 652-654, 1977.
  7. F. Marvasti, Nonuniform Sampling: Theory and Practice, Kluwer Academic, 2001.
  8. L. Kozachenko and N. Leonenko, "随机向量熵的样本估计," Problems of Information Transmission, vol. 23, no. 2, pp. 95-101, 1987.
  9. J. D. Reiss, "高分辨率音频感知评估的元分析," J. Audio Eng. Soc., vol. 64, no. 6, pp. 364-379, 2016.
  10. S. Yoshikawa, "铜管乐器中唇簧振荡的能量谱," J. Acoust. Soc. Am., vol. 97, no. 5, pp. 3269-3275, 1995.
  11. P. Welch, "使用快速傅里叶变换估计功率谱," IEEE Trans. Audio Electroacoust., vol. 15, no. 2, pp. 70-73, 1967.
  12. IEC 61672-1:2013, 电声学 — 声级计 — 第1部分:规格.
  13. AKM Semiconductor, "AK5578 32-bit 768 kHz ADC数据表," rev. 2, 2022.
  14. J. A. Cadzow, "带限信号的外推程序," IEEE Trans. Acoust. Speech Signal Process., vol. 27, no. 1, pp. 4-12, 1979.

本研究中引用的线材均在我们位于基多的工厂以地磁纬度0.0000°制造。测量数据可供查阅。邀请持续有效。

查看线材