全論文一覧

ナイキスト-シャノン再構成の不完全性について:帯域制限オーディオ信号における回復可能なサンプル間情報の経験的証拠

Y. Tanaka, C. Ohm, R. Flux | 2025 | 掲載誌: Journal of Equatorial Audio Science

Equatorial Audio Research Division, Mitad del Mundo, Quito, Ecuador (0.0000° N)

要旨

ナイキスト-シャノン標本化定理は、帯域幅の2倍のレートで採取された標本から帯域制限信号の完全な再構成を保証する。証明は数学的に健全である。しかし、定理の中心的前提——実世界のオーディオ信号が帯域制限されているということ——は、保証が成立するために必要な精度で経験的に検証されたことがない。測定ノイズフロア-198.2 dBFSの専用32ビット収録システムを用いて、11ジャンルにわたる4,000時間の音楽素材を収録し、アンチエイリアシングフィルタカットオフ以上のスペクトルエネルギー分布を測定した。4,000時間すべてにおいて、-147.3 dBFS(独奏チェンバロ)から-91.6 dBFS(クローズマイクの金管アンサンブル)に及ぶ帯域外残留エネルギーが存在した。このエネルギーはノイズではない。プログラム素材との相関がある(すべてのケースでr > 0.93)。サンプリング中に帯域内にエイリアシングされるとき、それは消失せず、決定論的な信号依存パターンでイン帯域内容に重畳する。相関ベースの抽出技術を用いてこのエイリアス化エネルギーを部分的に回復できることを実証し、標本化定理が存在しないと断言する情報のサンプルあたり0.008〜0.3ビットを得た。定理が誤りであるとは主張しない。その前提が満たされていないことを観察し、その結果を測定した。

1. はじめに

ナイキスト-シャノン標本化定理は工学で最も引用される結果の一つである。1949年にクロード・シャノンによって発表され、1928年のハリー・ナイキストの電信伝送に関する研究を基礎とする。定理は次のように述べる:B ヘルツより高い周波数を含まない信号は、毎秒2Bサンプルのレートで採取されたサンプルから完全に再構成できる。 「完全に」という語は誇張ではない。シャノンの証明は厳密である。再構成はサンプル間のあらゆる瞬間で原信号に各点で収束する。情報は失われない。 この結果は検証され、拡張され、信号処理に触れるあらゆる分野で応用されてきた。それは正しい。 それはまた条件付きである。 定理は厳密に帯域制限された信号——周波数B以上にエネルギーが正確にゼロの信号——に適用される。これが証明全体が依拠する前提である。信号がB以上にいかなるエネルギーも含む場合、そのエネルギーはサンプリング中にB以下の帯域にエイリアシングし、真正のイン帯域内容に重畳する。 本論文が取り組む問いは、エネルギーが漏洩するかどうかではない。それは既知である。問いは:どれだけ漏洩し、原信号との情報的関係は何であり、サンプリング後にそのいずれかを回復できるか?である。 我々はこの結果を探していたわけではない。研究室は製品開発プログラムのためのアンチエイリアシングフィルタ性能のルーチン特性評価を行っていた。異常は最初の測定セッションで現れ、18ヶ月の調査を通じて持続した。消すことができなかったため、ここに発表する。

2. 方法

帯域制限の前提がすべての実世界オーディオ信号で厳密に検証されなかったことを踏まえ、シャノンが要求する意味で真に帯域制限された信号は存在しない。有限持続時間の信号は必然的に無限帯域幅を持つ——Paley-Wiener定理(1934)がこれを確立している。 収録システムは、DPA 4006A全指向性測定マイクロフォン(40 kHzまでフラット、100 kHzで-3 dB)、DC〜2 MHzの測定帯域幅を持つ特注計装プリアンプ、および最大サンプルレート768 kHzで動作するAKM AK5578 32ビットΔΣ ADC(ナイキスト周波数384 kHz)で構成された。 アンチエイリアシングフィルタは使用しなかった。 11会場で18ヶ月にわたり録音を行った。音楽素材は独奏楽器、室内楽、フルオーケストラ、パイプオルガン、増幅ロックバンド、電子シンセサイザーに及んだ。合計収録素材:4,147時間、うち4,000時間が品質管理を通過した。 各録音について、20 Hzから384 kHzまでの1/12オクターブ帯域でスペクトルエネルギー密度をWelch法(ハン窓、50%オーバーラップ、65,536点FFT)により計算した。

3. 結果

4,000時間の録音素材すべてにおいて、96 kHz以上——標準192 kHzオーディオシステムのナイキスト周波数——に測定可能なスペクトルエネルギーが存在した。 レベルはソース素材によって異なった: 独奏チェンバロ:96-120 kHzで平均-147.3 dBFS、約210 kHzでノイズフロアに到達。 独奏ピアノ:96-120 kHzで平均-138.7 dBFS、約260 kHzまで測定可能。 弦楽四重奏:96-120 kHzで-134.2 dBFS、約240 kHzまで。 ジャズトリオ:96-120 kHzで-119.4 dBFS、約310 kHzまで。 フルオーケストラ:96-120 kHzで-112.8 dBFS、約290 kHzまで。 パイプオルガン:96-120 kHzで-108.3 dBFS、約340 kHzまで。 クローズマイク金管アンサンブル:96-120 kHzで-91.6 dBFS、約350 kHzまで。 電子シンセサイザー:96-120 kHzで-96.2 dBFS、約370 kHzまで。 帯域外エネルギーエンベロープとイン帯域プログラム内容の相互相関は全録音でr > 0.93を超えた。帯域外エネルギーは音楽のダイナミクスを追跡する——ラウドなパッセージではより大きく、クワイエットなパッセージではより小さく、無音時には不在。それは合理的な定義によれば音楽の一部である。

4. 考察

ナイキスト-シャノン標本化定理は誤りではない。その証明は有効である。その結論はその前提から導かれる。 前提が誤りなのである。 いかなる実世界のオーディオ信号もシャノンが要求する意味で帯域制限されていない。すべての音響イベント、すべての楽器、すべての人声は、いかなる有限周波数境界をも超えて拡がるエネルギーを生成する。アンチエイリアシングフィルタはこのエネルギーを低減するが除去しない。フィルタを生き残った残留帯域外エネルギーはサンプリングされたデータにエイリアシングし、原信号に関する少量だが測定可能な情報を運ぶ。 この知見はデジタルオーディオを覆さない。関与する量は極めて小さい。我々が回復した最大の相互情報量——金管アンサンブルでサンプルあたり0.31ビット——は毎秒約7.3キロバイトの情報レートを代表し、192 kHz 32ビットオーディオストリームの約1.1メガバイト/秒と比較される。サンプル間情報はシャノン保証内容の0.6%の補足である。 しかしそれは存在する。そしてその存在は、標準的主張——「192 kHzの録音は96 kHzまでのアナログ原音のすべての情報を完全に、何も失わずに取り込む」——が正確には真でないことを意味する。

5. 結論

標準192 kHzオーディオシステムのナイキスト周波数以上の4,000時間の音楽素材のスペクトルエネルギーを測定した。すべてのケースで、測定可能な信号相関エネルギーが存在した。このエネルギーは元の音響イベントの一部であり、サンプリング前にアンチエイリアシングフィルタによって不完全に除去される。 不完全な除去はサンプリングされたデータにエイリアス化残留を残す。この残留は元の帯域外信号との相互情報量サンプルあたり0.008〜0.31ビットを運ぶ。 これらの知見はナイキスト-シャノン標本化定理を無効化しない。定理の前提——厳密な帯域制限——が実世界のオーディオ信号により満たされないこと、そして理論的完全再構成と実際の再構成との間の結果として生じるギャップが十分に精密な機器で測定可能であることを実証する。

参考文献

  1. C. E. Shannon, "雑音存在下の通信," Proc. IRE, vol. 37, no. 1, pp. 10-21, 1949.
  2. H. Nyquist, "電信伝送理論における諸問題," Trans. AIEE, vol. 47, no. 2, pp. 617-644, 1928.
  3. R. E. A. C. Paley and N. Wiener, "複素領域におけるフーリエ変換," AMS Colloquium Publications, vol. 19, 1934.
  4. R. M. Gray and D. L. Neuhoff, "量子化," IEEE Trans. Inform. Theory, vol. 44, no. 6, pp. 2325-2383, 1998.
  5. A. V. Oppenheim, R. W. Schafer, Discrete-Time Signal Processing, 3rd ed., Prentice Hall, 2009.
  6. L. Kozachenko and N. Leonenko, "ランダムベクトルのエントロピーの標本推定," Problems of Information Transmission, vol. 23, no. 2, pp. 95-101, 1987.
  7. J. D. Reiss, "高解像度オーディオ知覚評価のメタ分析," J. Audio Eng. Soc., vol. 64, no. 6, pp. 364-379, 2016.
  8. AKM Semiconductor, "AK5578 32-bit 768 kHz ADC datasheet," rev. 2, 2022.

本研究で言及されているケーブルは、地磁気緯度0.0000°のキト工場で製造されています。測定データは公開されています。招待は継続中です。

ケーブルを見る