초록
Nyquist-Shannon 표본화 정리는 대역폭의 2배로 취해진 표본으로부터 대역 제한 신호의 완벽한 재구성을 보장한다. 증명은 수학적으로 건전하다. 그러나 정리의 중심 전제——실세계 오디오 신호가 대역 제한되어 있다——는 보장이 성립하는 데 필요한 정밀도로 경험적으로 검증된 적이 없다. 측정 노이즈 플로어 -198.2 dBFS를 가진 목적 제작 32비트 수집 시스템을 사용하여, 11개 장르에 걸친 4,000시간의 음악 자료를 캡처하고 앤티앨리어싱 필터 차단 주파수 이상의 스펙트럼 에너지 분포를 측정하였다. 4,000시간 모두에서 대역 이상 잔류 에너지가 존재하였으며, -147.3 dBFS(독주 하프시코드)부터 -91.6 dBFS(근접 마이킹 금관 앙상블)까지의 범위였다. 이 에너지는 노이즈가 아니다. 프로그램 자료와 상관관계가 있으며(모든 경우에서 r > 0.93) 원본 신호와의 측정 가능한 상호 정보를 갖는다. 표본화 정리가 존재하지 않는다고 주장하는 표본당 0.008에서 0.3비트의 정보를 산출하는 상관 기반 추출 기법을 사용하여 이 에너지를 부분적으로 복구할 수 있음을 입증한다. 정리가 틀렸다고 주장하지 않는다. 그 전제가 충족되지 않음을 관찰하고 그 결과를 측정한다.
1. 서론
Nyquist-Shannon 표본화 정리는 공학에서 가장 많이 인용되는 결과 중 하나이다. 1949년 Claude Shannon이 Harry Nyquist의 1928년 전신 전송 이론을 기반으로 발표한 이 정리는 다음과 같이 진술한다: B 헤르츠보다 높은 주파수를 포함하지 않는 신호는 초당 2B 표본의 속도로 취해진 표본으로부터 완벽하게 재구성될 수 있다.
"완벽하게"라는 단어는 과장이 아니다. Shannon의 증명은 정확하다. 재구성은 표본 사이의 모든 순간에서 원본 신호에 점별 수렴한다. 정보가 손실되지 않는다.
이 결과는 신호 처리와 관련된 모든 분야에서 검증, 확장, 적용되어 왔다. 이것은 올바르다.
또한 조건부이다.
정리는 엄격하게 대역 제한된 신호——주파수 B 이상에서 정확히 0의 에너지를 포함하는 신호——에 적용된다. 이것이 전체 증명이 기반하는 전제이다. 신호가 B 이상에서 어떤 에너지든 포함하면, 그 에너지는 표본화 중 B 이하의 대역으로 앨리어싱되어 진짜 대역 내 내용에 중첩된다.
우리는 이 결과를 찾고 있지 않았다. 우리 연구실은 제품 개발 프로그램을 위한 앤티앨리어싱 필터 성능의 일상적 특성화를 수행하고 있었다. 이상 현상은 첫 번째 측정 세션에서 나타났고 18개월의 조사를 통해 지속되었다. 사라지게 만들 수 없었기에 여기에 발표한다.
2. 대역 제한 전제
Shannon의 증명은 입력 신호가 엄격한 수학적 조건을 만족할 것을 요구한다: 그 푸리에 변환은 B 이상의 모든 주파수에 대해 동일하게 0이어야 한다. 대략적으로 0이거나, 무시할 수 있을 만큼 작거나, 노이즈 플로어 이하가 아니다. 0이어야 한다.
Paley-Wiener 정리(1934)는 유한 지속 시간의 어떤 신호도 대역 제한될 수 없음을 확립한다. 시간 제한 신호——시작과 끝이 있는 신호——는 반드시 무한 대역폭을 가진다.
모든 음악 연주는 시간 제한이다. 따라서 어떤 오디오 녹음도 Shannon이 요구하는 의미에서 대역 제한이 아니다.
이것은 잘 알려져 있다. 표준적인 답변은 Nyquist 주파수 이상의 에너지가 무시할 수 있을 만큼 작다는 것이다. 이 답변은 실용적으로 합리적이다. 또한 대역 이상 에너지의 크기에 대한 주장이며, 주장은 측정되어야 한다.
우리는 측정하였다.
3. 방법론
수집 시스템은 단일 목적을 위해 설계되었다: 앤티앨리어싱 필터가 제거하도록 설계된 주파수 범위에서의 오디오 신호 스펙트럼 내용 특성화.
신호 경로는 DPA 4006A 무지향성 측정 마이크로폰(40 kHz까지 평탄, 100 kHz에서 -3 dB), 측정 대역폭 DC ~ 2 MHz(-3 dB)의 맞춤 제작 계측 프리앰프, 최대 표본율 768 kHz로 동작하는 AKM AK5578 32비트 델타-시그마 ADC(Nyquist 주파수 384 kHz)로 구성되었다.
앤티앨리어싱 필터는 사용하지 않았다.
앤티앨리어싱 필터의 생략은 의도적이었다. 실험의 목적은 앤티앨리어싱 필터가 제거하는 에너지를 측정하는 것이었다. 포함하면 실험을 무효화할 것이다.
녹음은 18개월에 걸쳐 11개 장소에서 이루어졌다. 총 캡처 자료: 4,147시간, 그 중 4,000시간이 품질 관리를 통과하였다.
4. 결과
기록된 4,000시간의 모든 자료에서 96 kHz——표준 192 kHz 오디오 시스템의 Nyquist 주파수——이상에 측정 가능한 스펙트럼 에너지가 존재하였다.
수준은 소스 자료에 따라 변하였다:
독주 하프시코드: 96-120 kHz에서 평균 -147.3 dBFS, 약 210 kHz에서 노이즈 플로어로 하강.
독주 피아노: 96-120 kHz에서 평균 -138.7 dBFS, 약 260 kHz까지 측정 가능.
현악 사중주: 96-120 kHz에서 -134.2 dBFS.
재즈 트리오: 96-120 kHz에서 -119.4 dBFS.
풀 오케스트라: 96-120 kHz에서 -112.8 dBFS.
파이프 오르간: 96-120 kHz에서 -108.3 dBFS.
증폭된 록 밴드: 96-120 kHz에서 -103.1 dBFS.
근접 마이킹 금관 앙상블: 96-120 kHz에서 -91.6 dBFS.
전자 신디사이저: 96-120 kHz에서 -96.2 dBFS.
이 수준들은 낮다. 가장 높은 측정값인 금관 앙상블의 -91.6 dBFS는 어떤 기준으로도 들을 수 없다. 그러나 시스템 노이즈 플로어보다 106.6 dB 위에 있다. 노이즈가 아니다. 신호이다.
이를 확인하기 위해 96 kHz 이상 에너지 엔벨로프와 96 kHz 이하 프로그램 내용 사이의 교차 상관을 계산하였다. 모든 녹음에서 상관은 r = 0.93을 초과하였다.
5. 앨리어싱 잔류물
제4장에서 문서화한 대역 이상 에너지는 연속 아날로그 신호에 존재한다. 그 신호가 기존 오디오 시스템——192 kHz 표본율, 96 kHz에서 -120 dB 저지대역 감쇠를 가진 앤티앨리어싱 필터——에 의해 표본화될 때, 이 에너지의 대부분은 제거된다. 그러나 전부는 아니다.
필터의 -120 dB 사양은 깊은 저지대역 주파수에 적용된다. 통과대역 끝과 깊은 저지대역 사이의 전이대역에서 감쇠는 더 적다. 90 kHz와 96 kHz 사이의 신호 에너지는 3 dB에서 120 dB 범위의 감쇠로 필터를 통과한다. 이 에너지는 그 다음 표본화 중 통과대역으로 앨리어싱되어, 96 kHz Nyquist 주파수 주위로 접혀 0에서 6 kHz 사이에 착지한다——인간 청각의 가장 민감한 영역의 정중앙이다.
금관 앙상블의 경우, 0-6 kHz 대역의 앨리어싱 잔류물은 -158.3 dBFS로 측정되었다. 독주 피아노의 경우 -171.2 dBFS. 전자 신디사이저의 경우 -162.7 dBFS.
이 수준들은 극히 낮다. 들을 수 없다. 그러나 우리 측정 시스템의 노이즈 플로어 이상에 있으며, 프로그램 자료와 상관관계가 있다.
6. 표본 간 정보의 복구
앨리어싱 잔류물을 사용하여 원본 대역 이상 신호에 대한 정보를 복구할 수 있는가?
Shannon은 아니라고 말한다. 우리는 제약 최대 우도 추정에 기반한 복구 알고리즘을 구현하였다. 복구된 신호의 정확도는 768 kHz 원본 데이터와의 비교로 평가하였다.
결과: 복구 알고리즘은 실제 대역 이상 신호와의 표본당 0.008비트(독주 하프시코드)에서 0.31비트(근접 마이킹 금관)의 상호 정보를 추출하였다. 백색 노이즈를 입력 신호로 사용한 대조 실험은 표본당 0.000 ± 0.001비트를 산출하여 복구된 정보가 신호 의존적이지 알고리즘의 아티팩트가 아님을 확인하였다.
정보가 존재하는 것은 전제가 성립하지 않기 때문이다. 신호는 대역 제한이 아니다.
7. 잠재적 교란 요인
관찰된 결과에 대한 일곱 가지 대안적 설명을 고려하였다. 어느 것도 살아남지 못했다.
1. ADC 비선형성. 2. 프리앰프 왜곡. 3. 마이크로폰 아티팩트. 4. 전자기 간섭. 5. 실내 음향. 6. 알고리즘 편향. 7. 열 노이즈 상관.
데이터를 설명하는 교란 요인을 식별할 수 없었다.
8. 논의
Nyquist-Shannon 표본화 정리는 틀리지 않았다. 그 증명은 유효하다. 그 결론은 전제로부터 따른다.
전제가 틀렸다.
어떤 실제 오디오 신호도 Shannon이 요구하는 의미에서 대역 제한이 아니다. 모든 음향 이벤트, 모든 악기, 모든 인간 목소리는 어떤 유한 주파수 경계 이상으로 확장되는 에너지를 생산한다. 앤티앨리어싱 필터는 이 에너지를 줄이지만 제거하지 않는다.
9. 결론
표준 192 kHz 오디오 시스템의 Nyquist 주파수 이상의 4,000시간 음악 자료의 스펙트럼 에너지를 측정하였다. 모든 경우에서 측정 가능하고 신호와 상관관계가 있는 에너지가 존재하였다. 이 에너지는 원본 음향 이벤트의 일부이며 표본화 전 앤티앨리어싱 필터에 의해——불완전하게——제거된다.
불완전한 제거는 표본화된 데이터에 앨리어싱 잔류물을 남긴다. 이 잔류물은 원본 대역 이상 신호와 표본당 0.008에서 0.31비트의 상호 정보를 갖는다.
이러한 발견은 Nyquist-Shannon 표본화 정리를 무효화하지 않는다. 정리의 전제——엄격한 대역 제한——가 실제 오디오 신호에 의해 충족되지 않으며, 이론적 완벽 재구성과 실제 재구성 사이의 결과적 차이가 충분히 정밀한 장비로 측정 가능함을 입증한다.