(초보자를 위한) 디더링(dithering)의 이해/ 비디오 움직임 단차 생길때 이유
컨텐츠 정보
- 8,254 조회
- 0 추천
- 목록
본문
(초보자를 위한) 디더링(dithering)의 이해
Digit - 부호, 숫자의 자릿수
Digital - 부호화된, 계량기 바늘의 위치 따위 등 아날로그 방식 대신 계수화된 숫자들로 정보를 보여주는 방식의
Digitize - (정보를) 계수화/부호화하다. (특히 이진수로)
Digital - 부호화된, 계량기 바늘의 위치 따위 등 아날로그 방식 대신 계수화된 숫자들로 정보를 보여주는 방식의
Digitize - (정보를) 계수화/부호화하다. (특히 이진수로)
우리는 화면이건 음성이건 모두 디지타이즈 시켜 유통하는 세상에 살고 있습니다. 화면의 경우 가로 넓이와 세로 넓이를 칸을 나눠 격자로 만들어 개별 위치가 갖는 색상과 명암을 숫자로 바꾸고, 소리의 경우 시간의 경과를 가로(sampling rate)로, 음압의 변화폭을 세로(bit depth)로 한 격자를 만들어 수치화(양자화)하고 있죠.
디지털 방식은, 아무리 그 격자를 촘촘하게 만들어도 결국은 위 그래프에서 처럼 원본과는 같은 것이 될 수 없습니다. 사진으로 치면 '계단 현상'이고 오디오 쪽에서는 'quantization noise' 겠죠. 퀀타이즈, 퀀타이제이션, 양자화... 미디 찍다 보면 많이 접하는 말이죠. 원래의 정보를 정해진 격자 칸(grid)에 맞춰 끼워 넣는 것입니다.
여기서 녹색 선이 원래의 정현파라면 빨간 부분이 그것을 양자화한 소리, 그리고 파란 놈은 원래 소리와 양자화된 소리와의 차이를 나타냅니다.
그런데, 우리의 뇌는 저 빨간 계단식 신호를 들으면, 이렇게 해석하게 됩니다.
"이런 매끈한 음파에..."
"요런 잡음이 끼어 있구나!"
즉, 원본과의 차이 부분을 잡음으로 생각하면서 실제의 각진 계단을 매끈한 정현파로 해석하려 한다는 말입니다. 이렇게 인간의 감각이 만들어 내는 잡음을 quantization noise(양자화 잡음)이라 합니다.
한번 들어 보죠 (▷ 버튼 꾸욱)
왜곡된 소리로 느끼건 잡음이 낀 소리로 느끼건 어쨌든 듣기 싫은 건 사실이고 자연스럽지 않습니다. (우리가 보통 접하는 건 44kHz/16bit 이지만 알기쉬운 예를 위해 저질을 택했습니다)
방금 들은 이 소리는 원래 +20dB에서 -20dB으로 점차 감쇄하는 정현파인데, 해상도가 너무 낮다 보니(8비트 WAV이지만 유효 해상도는 3비트 남짓), 왜곡은 물론이요 음량이 줄어드는 것 조차도 1단계->2단계->3단계->아예 무음 이렇게 각진 모습을 보입니다.
"Can't resolve between the steps" -- 즉, 격자에서 하나의 칸과 다음 칸 사이에 존재하는 정보는 반올림/내림 되어 버린다... 디지털 오디오를 비판하는 좋은 구실이 되고 있습니다.
자, 여기서 모종의 잡음을 일부러 넣어서 양자화시켜 봅니다. TPDF라는 종류의 디더링 노이즈입니다. 일부러 좀 크게(4.8dB) 넣습니다.
"Can't resolve between the steps" -- 즉, 격자에서 하나의 칸과 다음 칸 사이에 존재하는 정보는 반올림/내림 되어 버린다... 디지털 오디오를 비판하는 좋은 구실이 되고 있습니다.
자, 여기서 모종의 잡음을 일부러 넣어서 양자화시켜 봅니다. TPDF라는 종류의 디더링 노이즈입니다. 일부러 좀 크게(4.8dB) 넣습니다.
새로운 잡음 덕분에 감각기관이 만들어 낸 잡음은 들리지 않고, 따라서 매우 매끈한 정현파가 있다고 인식하게 됩니다. 첫번째 예에서 완전 무음이 되어 버리던 후반부까지도 점차 작아지는 사인 파형의 존재를 인식할 수 있습니다.
이번에는 좀 더 고음쪽의 에너지가 많은, first-order noise shaper라는 걸 넣어서 양자화 해 봅니다. 무려 7.8dB 입니다.
노이즈 플로어가 굉장히 높아져서 시끄럽지만, 점차 작아지는 사인파의 소리는 오히려 먼저 번 보다 더 오래 잘 들립니다.
이번에는 좀 더 고음쪽의 에너지가 많은, first-order noise shaper라는 걸 넣어서 양자화 해 봅니다. 무려 7.8dB 입니다.
노이즈 플로어가 굉장히 높아져서 시끄럽지만, 점차 작아지는 사인파의 소리는 오히려 먼저 번 보다 더 오래 잘 들립니다.
디더링 노이즈라는 것은 이렇게, 양자화 잡음을 제거하고, 낮은 음량으로 들어가서 제한된 해상도(낮은 유효 비트 수)만을 사용하게 돼 버리는 소리에 해상도를 더해 주는 역할을 합니다. 여기 예제들에서는 시끄럽게 넣었지만 실제 사용시에는 거의 들을 수 없는 음량으로 들어가게 됩니다.
(여기에 사용된 WAV는 모두 1995년 9월 Christopher M Hicks에 의해 작성된 Simple demo of quantisation, dither and noise shaping 이라는 문서의 일부분이며, 여태까지의 내용도 상당 부분 거기에 기초하고 있습니다. Hicks씨는 ZIP 파일 통째로 내용 수정 없이 배포만 허가했지만 한국말이 아니라서 무단 발췌합니다...)
디지털의 세계에서, 높은 해상도(비트수)의 소리를 그보다 낮은 해상도로 바꿀 때에는, 반드시 디더링을 첨가하는 것이 상식입니다. 가령 마이크로 받은 아날로그 신호(즉 무한대의 비트수)를 24비트 디지털로 처음 변환할 때에도 디더링이 들어가고, 큐베이스/누엔도 작업시 32비트 부동소수점 연산의 내부 믹서에서 24비트의 오디오카드로 소리를 넘겨 줄 때에도 디더링이 자동으로 들어갑니다. 단, export 할 때에는 디더링을 직접 넣어야 하는데, 이 때는 uv22hr, L2 등 디더링의 종류를 선택할 수 있습니다. 엑스포트 옵션 중에 어느 페이더에서 추출할 것이냐를 선택하게 돼 있는데, 마스터 믹스를 엑스포트한다면 마스터단의 인서트 7이나 8에 디더링 플러그인을 넣고 마스터단을 선택하여 추출합니다.
만약 큐베이스 내부 믹서와 똑같은 형식, 즉 32bit 부동소수점 방식의 WAV로 Export 한다면 디더링은 필요 없습니다.
디지털의 세계에서, 높은 해상도(비트수)의 소리를 그보다 낮은 해상도로 바꿀 때에는, 반드시 디더링을 첨가하는 것이 상식입니다. 가령 마이크로 받은 아날로그 신호(즉 무한대의 비트수)를 24비트 디지털로 처음 변환할 때에도 디더링이 들어가고, 큐베이스/누엔도 작업시 32비트 부동소수점 연산의 내부 믹서에서 24비트의 오디오카드로 소리를 넘겨 줄 때에도 디더링이 자동으로 들어갑니다. 단, export 할 때에는 디더링을 직접 넣어야 하는데, 이 때는 uv22hr, L2 등 디더링의 종류를 선택할 수 있습니다. 엑스포트 옵션 중에 어느 페이더에서 추출할 것이냐를 선택하게 돼 있는데, 마스터 믹스를 엑스포트한다면 마스터단의 인서트 7이나 8에 디더링 플러그인을 넣고 마스터단을 선택하여 추출합니다.
만약 큐베이스 내부 믹서와 똑같은 형식, 즉 32bit 부동소수점 방식의 WAV로 Export 한다면 디더링은 필요 없습니다.
■ ▶ ☞ ♠ 정보찾아 공유 드리며 출처는 링크 참조 바랍니다. https://11q.kr ♠
관련자료
댓글 0
등록된 댓글이 없습니다.