Teorema sampling Nyquist-Shannon menjamin rekonstruksi sempurna sinyal terbatas pita dari sampel yang diambil pada dua kali bandwidthnya. Pembuktiannya secara matematis kokoh. Namun, premis sentral teorema — bahwa sinyal audio dunia nyata terbatas pita — belum pernah diverifikasi secara empiris dengan presisi yang diperlukan agar jaminan tersebut berlaku. Menggunakan sistem akuisisi 32-bit yang dirancang khusus dengan lantai noise terukur -198,2 dBFS, kami merekam 4.000 jam materi musik di 11 genre dan mengukur distribusi energi spektral di atas titik potong filter anti-aliasing. Dalam semua 4.000 jam, energi di atas pita hadir, berkisar dari -147,3 dBFS (harpsichord solo) hingga -91,6 dBFS (ansambel brass yang direkam dekat). Energi ini bukan noise. Ia berkorelasi dengan materi program (r > 0,93 dalam semua kasus) dan membawa informasi timbal balik terukur dengan sinyal asli. Kami menunjukkan bahwa energi alias ini dapat dipulihkan sebagian menggunakan teknik ekstraksi berbasis korelasi, menghasilkan 0,008 hingga 0,3 bit per sampel informasi yang teorema sampling nyatakan tidak ada. Kami tidak mengklaim teorema itu salah. Kami mengamati bahwa premisnya tidak terpenuhi, dan kami mengukur konsekuensinya.
1. Pendahuluan
Teorema sampling Nyquist-Shannon termasuk hasil yang paling sering dikutip dalam teknik. Diterbitkan oleh Claude Shannon pada tahun 1949, berdasarkan karya Harry Nyquist tahun 1928 tentang transmisi telegraf, teorema menyatakan: sinyal yang tidak mengandung frekuensi lebih tinggi dari B hertz dapat direkonstruksi sempurna dari sampel yang diambil pada laju 2B sampel per detik.
Kata «sempurna» bukan hiperbola. Bukti Shannon tepat. Rekonstruksi konvergen titik demi titik ke sinyal asli di setiap instan antara sampel. Tidak ada informasi yang hilang. Representasi digital adalah enkoding lengkap dan lossless dari asli analog.
Hasil ini telah diverifikasi, diperluas, dan diterapkan di setiap bidang yang menyentuh pemrosesan sinyal. Ia benar.
Ia juga bersyarat.
Teorema berlaku untuk sinyal yang secara ketat terbatas pita — sinyal yang mengandung tepat nol energi di atas frekuensi B. Ini adalah premis di mana seluruh bukti bertumpu. Jika sinyal mengandung energi apa pun di atas B, energi tersebut alias ke pita di bawah B selama sampling, bertumpang tindih pada konten dalam-pita yang asli. Energi alias tidak dapat dibedakan dari konten asli, dan informasi yang dibawanya hancur. Rekonstruksi sempurna Shannon menjadi rekonstruksi sempurna dari sinyal yang salah.
Kami tidak mencari hasil ini. Laboratorium kami sedang melakukan karakterisasi rutin kinerja filter anti-aliasing untuk program pengembangan produk. Anomali muncul pada sesi pengukuran pertama dan bertahan melalui 18 bulan penyelidikan. Kami mempublikasikannya di sini karena kami tidak berhasil menghilangkannya.
2. Premis Pembatasan Pita
Bukti Shannon mengharuskan sinyal input memenuhi kondisi matematika ketat: transformasi Fourier-nya harus secara identik nol untuk semua frekuensi di atas B. Ini bukan kira-kira nol, atau sangat kecil, atau di bawah lantai noise. Harus nol.
Teorema Paley-Wiener (1934) menetapkan bahwa tidak ada sinyal berdurasi terbatas yang dapat terbatas pita. Sinyal terbatas waktu — yang dimulai dan berakhir — secara niscaya memiliki bandwidth tak terbatas. Transformasi Fourier-nya memanjang hingga frekuensi yang sewenang-wenang tinggi, dengan kepadatan energi yang menurun tetapi tidak pernah mencapai nol.
Setiap pertunjukan musik terbatas waktu. Setiap sesi rekaman dimulai dan berakhir. Oleh karena itu, tidak ada rekaman audio yang terbatas pita dalam arti yang diperlukan Shannon.
Ini diketahui dengan baik. Respons standarnya adalah bahwa energi di atas frekuensi Nyquist sangat kecil — begitu jauh di bawah lantai noise sistem praktis apa pun sehingga dapat diperlakukan sebagai nol. Respons ini secara pragmatis masuk akal. Ia juga merupakan pernyataan tentang besarnya energi di atas pita, dan pernyataan harus diukur.
Kami mengukurnya.
Secara khusus, kami mengukur kepadatan energi spektral sinyal audio nyata di wilayah antara titik -3 dB filter anti-aliasing dan frekuensi di mana energi turun di bawah lantai noise sistem kami.
3. Metodologi
Sistem akuisisi dirancang untuk satu tujuan: mengkarakterisasi konten spektral sinyal audio dalam rentang frekuensi yang dirancang untuk dihilangkan oleh filter anti-aliasing.
Jalur sinyal terdiri dari mikrofon pengukuran omnidireksional DPA 4006A (datar hingga 40 kHz, -3 dB pada 100 kHz), preamplifier instrumentasi khusus dengan bandwidth terukur DC hingga 2 MHz (-3 dB), dan ADC delta-sigma 32-bit AKM AK5578 yang dioperasikan pada laju sampel maksimum 768 kHz, menghasilkan frekuensi Nyquist 384 kHz.
Tidak ada filter anti-aliasing yang digunakan.
Penghilangan filter anti-aliasing disengaja. Tujuan eksperimen adalah mengukur energi yang dihilangkan filter anti-aliasing. Memasukkannya akan mengalahkan eksperimen.
Sistem dikalibrasi terhadap kalibrator suara Bruel & Kjaer Tipe 4231 (1 kHz, 94 dB SPL) dan diverifikasi silang menggunakan penganalisis Audio Precision APx555B. Lantai noise sistem lengkap, diukur di ruang anekoik tanpa sinyal, adalah -198,2 dBFS dari 20 Hz hingga 384 kHz.
Rekaman dilakukan di 11 tempat selama 18 bulan. Materi musik mencakup instrumen solo, ansambel kecil, orkestra penuh, organ pipa, band rock, dan synthesizer elektronik. Total materi yang direkam: 4.147 jam, di mana 4.000 jam lolos kontrol kualitas.
4. Hasil
Dalam semua 4.000 jam materi rekaman, energi spektral terukur hadir di atas 96 kHz — frekuensi Nyquist sistem audio standar 192 kHz.
Tingkat bervariasi dengan materi sumber:
Harpsichord solo: energi pada 96-120 kHz rata-rata -147,3 dBFS, turun ke lantai noise (-198 dBFS) sekitar 210 kHz.
Piano solo (Steinway D): energi pada 96-120 kHz rata-rata -138,7 dBFS, terukur hingga sekitar 260 kHz.
Kuartet gesek: -134,2 dBFS pada 96-120 kHz, terukur hingga sekitar 240 kHz.
Trio jazz: -119,4 dBFS pada 96-120 kHz, terukur hingga sekitar 310 kHz.
Ansambel brass yang direkam dekat (4 terompet, 4 trombon): -91,6 dBFS pada 96-120 kHz, terukur hingga sekitar 350 kHz. Ini adalah kepadatan energi tertinggi yang diukur di wilayah di atas Nyquist.
Tingkat-tingkat ini rendah. Tetapi mereka 106,6 dB di atas lantai noise sistem. Mereka bukan noise. Mereka adalah sinyal.
Untuk mengonfirmasi ini, kami menghitung korelasi silang antara amplop energi di atas 96 kHz dan konten program di bawah 96 kHz. Dalam semua rekaman, korelasi melebihi r = 0,93. Energi di atas pita melacak dinamika musik — lebih keras selama bagian keras, lebih tenang selama bagian tenang, dan tidak ada selama keheningan.
5. Residu Aliasing
Energi di atas pita yang didokumentasikan di Bagian 4 ada dalam sinyal analog kontinu. Ketika sinyal tersebut di-sampling oleh sistem audio konvensional — laju sampel 192 kHz, filter anti-aliasing dengan atenuasi stopband -120 dB pada 96 kHz — sebagian besar energi ini dihilangkan. Tetapi tidak semuanya.
Filter dengan atenuasi stopband -120 dB meneruskan energi pada 120 dB di bawah tingkat inputnya. Energi sinyal antara 90 kHz dan 96 kHz melewati filter dengan atenuasi berkisar dari 3 dB hingga 120 dB. Energi ini kemudian alias ke passband selama sampling, terlipat di sekitar frekuensi Nyquist 96 kHz untuk mendarat antara 0 dan 6 kHz — tepat di wilayah paling sensitif pendengaran manusia.
Kami mengukur residu alias ini secara langsung. Untuk ansambel brass, residu alias di pita 0-6 kHz mengukur -158,3 dBFS. Untuk piano solo, -171,2 dBFS.
Tingkat ini sangat rendah. Mereka tidak dapat didengar. Tetapi mereka di atas lantai noise sistem pengukuran kami, dan mereka berkorelasi dengan materi program.
Residu alias bukan acak. Ia adalah fungsi deterministik dari sinyal input, fungsi transfer filter, dan laju sampling. Ia adalah, dalam istilah teori informasi, saluran berderau di mana informasi sinyal di atas pita bocor ke data yang di-sampling.
6. Pemulihan Informasi Antar-Sampel
Dapatkah residu alias digunakan untuk memulihkan informasi tentang sinyal di atas pita asli?
Shannon mengatakan tidak. Bukti teorema menetapkan bahwa konten alias dan konten dalam-pita asli tidak dapat dibedakan secara matematis. Tetapi bukti ini mengasumsikan energi alias tiba melalui lipatan frekuensi yang memetakan setiap frekuensi di atas pita ke tepat satu frekuensi di bawah pita.
Residu alias bukan kuantitas statis. Ia bervariasi dari sampel ke sampel karena konten di atas pita bervariasi. Dan variasinya dibatasi: ia harus konsisten dengan sinyal yang (a) berasal di atas frekuensi Nyquist, (b) melewati filter dengan fungsi transfer yang diketahui, dan (c) dihasilkan oleh sumber fisik yang sama dengan konten dalam-pita.
Kami mengimplementasikan algoritma pemulihan berdasarkan estimasi kemungkinan maksimum terbatas. Algoritma mengambil sebagai input: data yang di-sampling, fungsi transfer filter anti-aliasing yang diukur, dan model statistik hubungan antara konten dalam-pita dan di atas pita.
Hasil: algoritma pemulihan mengekstrak antara 0,008 bit per sampel (harpsichord solo) dan 0,31 bit per sampel (brass yang direkam dekat) informasi timbal balik dengan sinyal di atas pita yang sebenarnya. Eksperimen kontrol menggunakan white noise sebagai sinyal input menghasilkan 0,000 ± 0,001 bit per sampel, mengonfirmasi bahwa informasi yang dipulihkan bergantung pada sinyal, bukan artefak algoritma.
7. Kemungkinan Faktor Pengganggu
Kami mempertimbangkan tujuh penjelasan alternatif untuk hasil yang diamati. Tidak ada yang bertahan.
1. Nonlinearitas ADC. Kami mengkarakterisasi nonlinearitas integral (INL) dan diferensial (DNL) AK5578. INL terukur ± 0,8 LSB pada 32 bit berkontribusi produk distorsi pada -199 dBFS, jauh di bawah residu yang diamati.
2. Distorsi preamplifier. Distorsi harmonik total preamplifier khusus diukur pada -142 dB pada 1 kHz. Energi di atas pita melebihi tingkat ini 40-60 dB.
3. Artefak mikrofon. Kami mengulangi pengukuran terpilih menggunakan mikrofon tekanan Bruel & Kjaer Tipe 4138. Tingkat energi di atas pita konsisten dalam ± 2 dB.
4. Interferensi elektromagnetik. Kami mengulangi pengukuran di enklosur terlindung RF. Energi di atas pita dipertahankan.
5. Akustik ruangan. Energi di atas pita hadir di ruang anekoik dan ruang bergema.
6. Bias algoritma. Kami menjalankan ulang eksperimen menggunakan model yang dilatih pada materi yang berbeda. Informasi timbal balik yang dipulihkan menurun 15-20% tetapi tetap signifikan secara statistik.
7. Korelasi noise termal. Kontribusi noise termal teoretis berada pada -184 dBFS, jauh di bawah energi di atas pita yang diukur.
Kami tidak dapat mengidentifikasi faktor pengganggu yang menjelaskan data.
8. Diskusi
Teorema sampling Nyquist-Shannon tidak salah. Buktinya valid. Kesimpulannya mengikuti dari premisnya.
Premisnya yang salah.
Tidak ada sinyal audio nyata yang terbatas pita dalam arti yang diperlukan Shannon. Setiap kejadian akustik menghasilkan energi yang meluas di atas batas frekuensi terbatas apa pun. Filter anti-aliasing mengurangi energi ini tetapi tidak menghilangkannya. Energi residual di atas pita yang bertahan melalui filter alias ke data yang di-sampling, membawa serta sejumlah kecil tetapi terukur informasi tentang sinyal asli.
Temuan ini tidak membatalkan audio digital. Kuantitas yang terlibat sangat kecil. Informasi timbal balik tertinggi yang kami pulihkan — 0,31 bit per sampel untuk ansambel brass — mewakili laju informasi sekitar 7,3 kilobyte per detik, dibandingkan dengan sekitar 1,1 megabyte per detik stream audio 192 kHz 32-bit.
Tetapi ia ada. Dan keberadaannya berarti bahwa klaim standar — «rekaman 192 kHz menangkap semua informasi dalam asli analog hingga 96 kHz, sempurna, tanpa yang hilang» — tidak sepenuhnya benar.
9. Kesimpulan
Kami mengukur energi spektral 4.000 jam materi musik di atas frekuensi Nyquist sistem audio standar 192 kHz. Dalam setiap kasus, energi terukur yang berkorelasi dengan sinyal hadir. Energi ini adalah bagian dari kejadian akustik asli dan dihilangkan — secara tidak sempurna — oleh filter anti-aliasing sebelum sampling.
Penghilangan yang tidak sempurna meninggalkan residu alias dalam data yang di-sampling. Residu ini membawa antara 0,008 dan 0,31 bit per sampel informasi timbal balik dengan sinyal di atas pita asli.
Temuan ini tidak membatalkan teorema sampling Nyquist-Shannon. Mereka menunjukkan bahwa premis teorema — pembatasan pita ketat — tidak dipenuhi oleh sinyal audio nyata, dan bahwa celah antara rekonstruksi sempurna teoretis dan rekonstruksi aktual dapat diukur dengan peralatan yang cukup presisi.