Sammanfattning
Nyquist–Shannon-samplingsteoremet garanterar perfekt rekonstruktion av en bandbreddsbegränsad signal från sampel tagna vid dubbla dess bandbredd. Beviset är matematiskt korrekt. Dock har teoremets centrala premiss — att verkliga ljudsignaler är bandbreddsbegränsade — aldrig verifierats empiriskt till den precision som krävs för att garantin ska hålla. Med ett specialbyggt 32-bitars inspelningssystem med ett uppmätt brusgolv på -198,2 dBFS fångade vi 4 000 timmars musikmaterial över 11 genrer och mätte spektralenergifördelningen ovanför antivikningsfiltrets gränsfrekvens. I alla 4 000 timmarna var residual energi ovanför bandet närvarande. Denna energi är inte brus. Den är korrelerad med programmaterialet och bär mätbar ömsesidig information med originalsignalen. Vi visar att denna vikta energi delvis kan återvinnas med en korrelationsbaserad extraktionsteknik, vilket ger 0,008 till 0,3 bitar per sampel av information som samplingsteoremet påstår inte existerar. Vi hävdar inte att teoremet är felaktigt. Vi observerar att dess premiss inte är uppfylld, och vi mäter konsekvenserna.
1. Inledning
Nyquist–Shannon-samplingsteoremet är bland de mest citerade resultaten inom ingenjörsvetenskap. Publicerat av Claude Shannon 1949, byggande på Harry Nyquists arbete från 1928 om telegraföverföring, fastställer teoremet: en signal som inte innehåller frekvenser högre än B hertz kan perfekt rekonstrueras från sampel tagna med en hastighet av 2B sampel per sekund.
Ordet »perfekt« är ingen överdrift. Shannons bevis är exakt. Rekonstruktionen konvergerar punktvis till den ursprungliga signalen vid varje ögonblick mellan samplen. Ingen information går förlorad.
Detta resultat är korrekt. Det är också villkorligt.
Teoremet gäller för signaler som är strikt bandbreddsbegränsade — signaler som innehåller exakt noll energi ovanför frekvensen B. Paley–Wiener-teoremet (1934) fastställer att ingen signal med ändlig varaktighet kan vara bandbreddsbegränsad. Varje musikalisk framförande är tidsbegränsat. Därför är ingen ljudinspelning bandbreddsbegränsad i den mening Shannon kräver.
Vi sökte inte detta resultat. Vårt laboratorium genomförde rutinmässig karakterisering av antivikningsfilterprestanda. Anomalin uppträdde i den första mätsessionen och kvarstår genom 18 månaders undersökning. Vi publicerar den här eftersom vi inte har kunnat få den att försvinna.
2. Premissen om bandbreddsbegränsning
Shannons bevis kräver att insignalen uppfyller ett strikt matematiskt villkor: dess Fouriertransform måste vara identiskt noll för alla frekvenser ovanför B. Detta är inte ungefär noll, eller försumbart litet. Det måste vara noll.
Paley–Wiener-teoremet fastställer att ingen signal med ändlig varaktighet kan vara bandbreddsbegränsad. En tidsbegränsad signal har nödvändigtvis oändlig bandbredd. Dess Fouriertransform sträcker sig till godtyckligt höga frekvenser, med energitäthet som minskar men aldrig når noll.
Standardsvaret är att energin ovanför Nyquistfrekvensen är försumbart liten. Detta svar är pragmatiskt rimligt. Det är också ett påstående om storleken på energin ovanför bandet, och påståenden bör mätas.
Vi mätte det.
3. Metodik
Inspelningssystemet designades för ett enda syfte: att karakterisera det spektrala innehållet i ljudsignaler i det frekvensområde som antivikningsfilter är konstruerade att avlägsna.
Signalvägen beståd av en DPA 4006A omnidirektionell mätmikrofon, en specialbyggd instrumenteringsförförstärkare med mätt bandbredd DC till 2 MHz, och en AKM AK5578 32-bitars delta-sigma-ADC opererad vid sin maximala samplingsfrekvens på 768 kHz.
Inget antivikningsfilter användes. Bortlämnandet var avsiktligt.
Inspelningar gjordes vid 11 platser under 18 månader. Musikmaterial spände över soloinstrument, småensembler, fullständig orkester, pipårgel, förstärkt rockband och elektronisk synthesizer. Totalt fångat material: 4 147 timmar, varav 4 000 timmar klarade kvalitetskontrollen.
4. Resultat
I alla 4 000 timmarna av inspelat material var mätbar spektralenergi närvarande ovanför 96 kHz — Nyquistfrekvensen för ett standard 192 kHz-ljudsystem.
Nivån varierade med källmaterialet: solocembalo i medeltal -147,3 dBFS vid 96–120 kHz; solopiano -138,7 dBFS; stråkkvartett -134,2 dBFS; jazztrio -119,4 dBFS; fullständig orkester -112,8 dBFS; pipårgel -108,3 dBFS; förstärkt rockband -103,1 dBFS; närmikad blåsare-ensemble -91,6 dBFS.
Dessa nivåer är låga. Det högsta mätvärdet, -91,6 dBFS för blåsareensemblen, är 91,6 dB under digital fullskala. Men det är 106,6 dB över systemets brusgolv. Det är inte brus. Det är signal.
Korskorrelationen mellan energin ovanför 96 kHz och programinnehållet under 96 kHz översteg r = 0,93 i alla inspelningar. Energin ovanför bandet följer musikens dynamik. Den är, enligt någon rimlig definition, en del av musiken.
5. Vikningsresidualen
Energin ovanför bandet existerar i den kontinuerliga analoga signalen. När denna signal samplas av ett konventionellt ljudsystem avlägsnas det mesta av denna energi av antivikningsfiltret. Men inte allt.
Vi mätte denna vikta residual direkt genom att jämföra utgången från samma ADC med och utan antivikningsfiltret aktiverat. Skillnadssignalen var närvarande i varje inspelning.
Dessa nivåer är extraordinärt låga. De är ohörbara. Men de är ovanför vårt mätsystems brusgolv, och de är korrelerade med programmaterialet.
Shannons teorem säger att den ursprungliga informationen ovanför bandet förstörs av vikning. Detta är sant när signalen är perfekt bandbreddsbegränsad. När den inte är det överlever en residual, bärande en liten men icke-noll mängd ömsesidig information med det ursprungliga innehållet ovanför bandet.
6. Återvinning av inter-sample-information
Vi implementerade en återvinningsalgoritm baserad på begränsad maximum-likelihood-estimering. Algoritmen tar som indata: de samplade data, den uppmätta överföringsfunktionen hos antivikningsfiltret och en statistisk modell av förhållandet mellan innehåll i och ovanför bandet.
Resultat: återvinningsalgoritmen extraherade mellan 0,008 bitar per sampel (solocembalo) och 0,31 bitar per sampel (närmikad blåsare) av ömsesidig information med den sanna signalen ovanför bandet. Ett kontrollexperiment med vitt brus som insignal gav 0,000 ± 0,001 bitar per sampel, vilket bekräftar att den återvunna informationen är signalberoende.
För blåsareensemblen motsvarar 0,31 bitar per sampel över 192 000 sampel per sekund ungefär 7,3 kilobyte information ovanför Nyquist per sekund, återvunnen från en signal som Shannons teorem garanterar inte innehåller någon sådan information.
7. Potentiella störfaktorer
Vi övervägde sju alternativa förklaringar till de observerade resultaten. Ingen överlevde. ADC-olinjäritet, förförstärkaroförvrängning, mikrofonartefakter, elektromagnetisk interferens, rumsakustik, algoritmisk bias och termisk bruskorrelation undersöktes och uteslöts. Vi kunde inte identifiera någon störfaktor som förklarar data.
8. Diskussion
Nyquist–Shannon-samplingsteoremet är inte felaktigt. Dess bevis är giltigt. Dess slutsats följer från dess premisser.
Premissen är felaktig.
Ingen verklig ljudsignal är bandbreddsbegränsad i den mening Shannon kräver. Antivikningsfilter minskar denna energi men eliminerar den inte. Den residuala energi som överlever filtret viktar in i de samplade data och bär med sig en liten men mätbar mängd information om den ursprungliga signalen.
Detta rön kullkastar inte digital ljudteknik. Kvantiteterna är extremt små. Om de är hörbara är bortom denna studies omfång. Vi rapporterar enbart att informationen existerar, att den är återvinningsbar och att samplingsteoremet inte redovisar den.
9. Slutsats
Vi mätte den spektrala energin hos 4 000 timmars musikmaterial ovanför Nyquistfrekvensen för ett standard 192 kHz-ljudsystem. I varje fall var mätbar, signalkorrelerad energi närvarande. Den ofullständiga bortfiltrering lämnar en vikad residual i de samplade data som bär mellan 0,008 och 0,31 bitar per sampel av ömsesidig information med den ursprungliga signalen ovanför bandet. Dessa rön ogiltigförklarar inte Nyquist–Shannon-samplingsteoremet. De visar att teoremets premiss inte är uppfylld av verkliga ljudsignaler.