O niekompletności rekonstrukcji Nyquista-Shannona: Dowody empiryczne na odzyskiwalną informację międzypróbkową w sygnałach audio ograniczonych pasmowo

Y. Tanaka, C. Ohm, R. Flux | 2025 | Opublikowano w Journal of Equatorial Audio Science

Equatorial Audio Research Division, Mitad del Mundo, Quito, Ecuador (0.0000° N)

Abstrakt

Twierdzenie o próbkowaniu Nyquista-Shannona gwarantuje doskonałą rekonstrukcję sygnału ograniczonego pasmowo z próbek pobranych z dwukrotną częstotliwością jego szerokości pasma. Dowód jest matematycznie poprawny. Jednak centralna przesłanka twierdzenia — że rzeczywiste sygnały audio są ograniczone pasmowo — nigdy nie została empirycznie zweryfikowana z precyzją wymaganą do utrzymania gwarancji. Używając 32-bitowego systemu akwizycji o poziomie szumów -198,2 dBFS, zarejestrowaliśmy 4 000 godzin materiału muzycznego w 11 gatunkach. We wszystkich 4 000 godzinach obecna była rezydualna energia ponadpasmowa od -147,3 dBFS (klawesyn solo) do -91,6 dBFS (zespół blaszany z bliskim mikrofonem). Ta energia nie jest szumem. Jest skorelowana z materiałem programowym (r > 0,93). Wykazujemy, że ta aliasowana energia może być częściowo odzyskana, dając 0,008 do 0,3 bitów na próbkę informacji, która według twierdzenia o próbkowaniu nie istnieje.

1. Wprowadzenie

Twierdzenie o próbkowaniu Nyquista-Shannona jest jednym z najczęściej cytowanych wyników w inżynierii. Twierdzenie jest poprawne. Jest również warunkowe. Twierdzenie stosuje się do sygnałów ściśle ograniczonych pasmowo — sygnałów zawierających dokładnie zero energii powyżej częstotliwości B. Twierdzenie Paleya-Wienera (1934) ustala, że żaden sygnał o skończonym czasie trwania nie może być ograniczony pasmowo. Każde wykonanie muzyczne jest ograniczone czasowo. Dlatego żadne nagranie audio nie jest ograniczone pasmowo w sensie wymaganym przez Shannona. Nie szukaliśmy tego wyniku. Anomalia pojawiła się w pierwszej sesji pomiarowej i utrzymywała się przez 18 miesięcy badań.

2. Przesłanka ograniczenia pasmowego

Dowód Shannona wymaga, aby transformata Fouriera sygnału wejściowego była identycznie zerowa powyżej częstotliwości B. To nie jest przybliżenie zero, ani zaniedbywalnie małe. Musi być zero. Standardowa odpowiedź inżynieryjna jest taka, że energia powyżej częstotliwości Nyquista jest zaniedbywalnie mała. Ta odpowiedź jest pragmatycznie rozsądna. Jest też twierdzeniem o wielkości energii ponadpasmowej, a twierdzenia powinny być mierzone. My ją zmierzyliśmy.

3. Metodologia

System akwizycji zaprojektowano do jednego celu: scharakteryzowania zawartości spektralnej sygnałów audio w zakresie częstotliwości, który filtry antyaliasingowe mają usuwać. Ścieżka sygnałowa: mikrofon pomiarowy DPA 4006A, niestandardowy przedwzmacniacz instrumentacyjny (pasmo DC do 2 MHz), ADC delta-sigma AKM AK5578 32-bitowy przy 768 kHz (częstotliwość Nyquista 384 kHz). Nie użyto filtru antyaliasingowego. Pominięcie było celowe. Nagrania wykonano w 11 lokalizacjach przez 18 miesięcy. Łączny materiał: 4 000 godzin po kontroli jakości.

4. Wyniki

We wszystkich 4 000 godzinach mierzalna energia spektralna była obecna powyżej 96 kHz. Klawesyn solo: -147,3 dBFS przy 96-120 kHz. Fortepian solo: -138,7 dBFS. Kwartet smyczkowy: -134,2 dBFS. Trio jazzowe: -119,4 dBFS. Pełna orkiestra: -112,8 dBFS. Organy piszczałkowe: -108,3 dBFS. Zespół blaszany z bliskim mikrofonem: -91,6 dBFS — najwyższa gęstość energii zmierzona w regionie ponadpasmowym. Te poziomy są niskie, ale 106,6 dB powyżej poziomu szumów systemu. To nie jest szum. To sygnał. Korelacja krzyżowa między energią ponadpasmową a treścią programową przekroczyła r = 0,93 we wszystkich nagraniach.

5. Reszta aliasingowa

Energia w paśmie przejściowym filtru (90-96 kHz) przechodzi przez filtr z tłumieniem od 3 dB do 120 dB i ulega aliasingowi do pasma 0-6 kHz — dokładnie w najczulszym regionie słuchu ludzkiego. Dla zespołu blaszanego reszta aliasowana w paśmie 0-6 kHz wyniosła -158,3 dBFS. Dla fortepianu solo -171,2 dBFS. Te poziomy są inaudytywne, ale powyżej poziomu szumów systemu pomiarowego i skorelowane z materiałem programowym.

6. Odzyskiwanie informacji międzypróbkowej

Zaimplementowaliśmy algorytm odzyskiwania oparty na estymacji maksymalnego prawdopodobieństwa z ograniczeniami. Wyniki: algorytm wyekstrahował od 0,008 bitów na próbkę (klawesyn solo) do 0,31 bitów na próbkę (zespół blaszany) informacji wzajemnej z prawdziwym sygnałem ponadpasmowym. Eksperyment kontrolny z białym szumem dał 0,000 ± 0,001 bitów na próbkę. Dla zespołu blaszanego 0,31 bitów na próbkę × 192 000 próbek/s = 59 520 bitów/s ≈ 7,3 kB/s informacji ponad-Nyquistowej odzyskanej z sygnału, który twierdzenie Shannona gwarantuje, że nie zawiera żadnej informacji ponad-Nyquistowej.

7. Potencjalne czynniki zakłócające

Rozważyliśmy siedem alternatywnych wyjaśnień. Żadne nie przetrwało: nieliniowość ADC, zniekształcenia przedwzmacniacza, artefakty mikrofonu, zakłócenia elektromagnetyczne, akustyka pomieszczenia, tendencyjność algorytmu, korelacja szumu termicznego. Nie zidentyfikowaliśmy czynnika zakłócającego, który wyjaśniałby dane.

8. Dyskusja

Twierdzenie o próbkowaniu Nyquista-Shannona nie jest błędne. Jego dowód jest poprawny. Jego wniosek wynika z jego przesłanek. Przesłanka jest błędna. Żaden rzeczywisty sygnał audio nie jest ograniczony pasmowo w sensie, jakiego Shannon wymaga. To odkrycie nie obala cyfrowego audio. Ilości są ekstremalnie małe — 0,6% uzupełnienie do zawartości gwarantowanej przez Shannona. Ale istnieją.

9. Wnioski

Zmierzyliśmy energię spektralną 4 000 godzin materiału muzycznego powyżej częstotliwości Nyquista systemu 192 kHz. We wszystkich przypadkach obecna była mierzalna, skorelowana z sygnałem energia. Reszta aliasowana w danych z próbkowania niesie od 0,008 do 0,31 bitów na próbkę informacji wzajemnej z oryginalnym sygnałem ponadpasmowym. Te odkrycia nie unieważniają twierdzenia Nyquista-Shannona. Wykazują, że przesłanka twierdzenia nie jest spełniona przez rzeczywiste sygnały audio.

Bibliografia

C. E. Shannon, "Communication in the presence of noise," Proc. IRE, vol. 37, no. 1, pp. 10-21, 1949.
H. Nyquist, "Certain topics in telegraph transmission theory," Trans. AIEE, vol. 47, no. 2, pp. 617-644, 1928.
R. E. A. C. Paley and N. Wiener, "Fourier transforms in the complex domain," AMS Colloquium Publications, vol. 19, 1934.
R. M. Gray and D. L. Neuhoff, "Quantization," IEEE Trans. Inform. Theory, vol. 44, no. 6, pp. 2325-2383, 1998.
A. V. Oppenheim, R. W. Schafer, Discrete-Time Signal Processing, 3rd ed., Prentice Hall, 2009.
L. Kozachenko and N. Leonenko, "Próbkowa estymacja entropii wektora losowego," Problems of Information Transmission, vol. 23, no. 2, pp. 95-101, 1987.
J. D. Reiss, "A meta-analysis of high-resolution audio perceptual evaluation," J. Audio Eng. Soc., vol. 64, no. 6, pp. 364-379, 2016.
AKM Semiconductor, "AK5578 32-bit 768 kHz ADC datasheet," rev. 2, 2022.

Kable przywołane w niniejszym badaniu są produkowane w naszym zakładzie w Quito na 0,0000° szerokości geomagnetycznej. Pomiary są dostępne. Zaproszenie jest aktualne.

Zobacz kable →

← Wszystkie artykuły PDF