오디오 입문/이론

음악 파일 포맷과 음질

AdultKid(오디오/스피커) 2009. 3. 15.

음악파일 포맷에 대해 이야기 하기 전에 먼저 짚고 넘어가야 할 단어가 있는데..
바로... Hi-Fi(High Fidelity)라는 말입니다.
이를 해석하면 고충실도(高忠實度)라고 표현할 수 있습니다.
근래는 Hi-Fi라는 말을 미니콤퍼넌트에도 사용하다보니 차별성이 많이 희석되어 졌습니다.
그리하여 생겨난 말이 바로 Hi-End입니다.
우리 식으로 표현하자면... 갈때 까지 간... 고음질을 말하는 것입니다.
그러나 오디오파일들에 따라 약간씩 해석상의 차이가 발생하는데...
첫번째 Hi-Fi는
이미 녹음되어진 CD등을 얼마나 충실히 재생하느냐를 기준으로 합니다.
녹음 당시의 환경보다는 말 그대로 재생시점에서의 고충실도를 의미합니다.
두번째 Hi-End는
녹음실또는 연주회장의 현장감까지 살린다는 의미로 해석할 때
음악이 녹음되어지는 순간부터 소비자가 듣는 시점까지
모든 음향기기의 품질과 모든 녹음방식을 아우르는 말로 이해되기도 합니다.
이에 대해서는 견해차가 있을 수 있으므로 여기서 줄이도록하겠으나..
두단어를 비슷한 의미로 본다면.....
Hi-Fi(또는 Hi-End)는 모든 오디오 기기가 추구하는 궁극의 목표입니다.
mp3 플레이어라고 예외일 수는 없다는점 염두에 두시고 읽어나가시기 바랍니다.
(글쓴후 자주가는 사이트에 계신 분께서 몇가지 지적을 해주셨는데...
Hi-Fi / Hi-End라는 말은 마케팅 차원에서 만들어진 말이며 리뷰어들에 의해서 퍼지게 된 단어라고 합니다.)
▶ 최고의 음질을 가진 매체(또는 파일 포맷)는...?
mp3를 비롯한 파일포맷을 얘기하려면 비교대상이 있어야 하겠죠.
원본의 중요성은 길게 말하지 않아도 알고계시리라 믿지만 현재 나와있는 모든 미디어 중에서...
쉽게 구할 수 있으면서도 가장 음질이 좋은 매체로 알려진 CD 와 DVD에 대해 언급하도록 하겠습니다.
CD는 일반CD와 XRCD / SACD / HDCD 나누어 지며 DVD 포맷을 이용한 DVD Audio도 있습니다.
1. 96KHz/24Bit 리마스터링
CD의 음질을 높이기 위한 방법에는 여러가지가 있는데... 그중 가장 간단하면서
생산비용이 적게 드는 방법은...녹음 자체를 96KHz/24Bit 로 리마스터링하는 것입니다.
CD 포맷은44.1kHz의 샘플링 주파수, 16비트의 양자화(Quantization)를 기준으로 제작되며
96KHz/24Bit 리마스터링은 이로 인한 음손실을 보완해 줍니다만.. 큰 의미는 없다고도 볼 수 있습니다.
4번 내용을 참조하시면 이해가 쉬우실겁니다.
CD는 44.1KHz이 기준이며 DVD는 48KHz가 기준입니다.
(96KHz/24Bit는 24비트의 샘플 사이즈로 초당 96,000번의 샘플화가 됨을 의미합니다.)
소매 가격은 일반적으로 판매되는 CD가격과 동일합니다.
2. XRCD(Extended Resolution Compact Disk)
XRCD는 JVC 가 개발한 새로운 녹음 방식으로 이것은 CD 의 제작과정과
마스터링 과정중의 효율성을 극대화시켜 녹음을 위한 모든 프로세스중에서
음질저하를 일으킬 수 있는 부분을 최소화 한것입니다.
일반 CD에 비해 3~4배정도 비싼가격이나 일반적으로 사용되는 CD플레이어로도
고품질의 음악 재생이 가능하다는 이점이 있습니다.
3. SACD(Super Audio Compact Disc)
SACD는 DSD(Direct Stream Ditital)라고 하는 방식으로 녹음되는데..
1bit 데이터는 1bit포맷으로 직접 디스크에 수록하는것을 의미합니다.
수록해야할 데이타도 많아서 용량도 4.7G나 됩니다.
DVD의 기록양과 맞먹는거죠.. SACD가 DVD기반 기술인지는 모르겠으나
SACD를 재생하기 위해서는 전용 플레이어가 있어야만 합니다.
이러한 불편을 해소하기 위해 두개의 레이어를 가진 하이브리드 타입의 SACD도 있습니다.
이러한 하이브리드 타입은 SACD전용플레어에서는 고품질의 음악을...
일반 플레이어에서는 일반CD처럼 재생합니다.
4. HDCD(High Definition Compatible Digital)
고음질 음반들은 20비트 이상의 하이비트로 녹음이 되지만 결국 CD포맷인 16Bit로 압축하게 됩니다.
20Bit 이상 녹음 ▷ 16Bit 인코딩(압축) ▷ 원래대로 20Bit 디코딩~ 의 순으로 재생이 되는데..
인코딩과 디코딩 과정에서 생기는 음손실을 피할 수는 없습니다.
24Bit이상으로 녹음되었다 하더라도 CD라는 포맷의 특성상 16Bit로 압축되어 있으므로
결국 이를 풀어낼 디코딩 칩의 성능에 따라 음질이 달라지게 된다는 뜻입니다.
HDCD는 레퍼런스 레코딩스와 퍼시픽 마이크로소닉스에서 개발한 방식이며 비압축 방식입니다.
그로인해 음손실을 줄일 수 있게 되었으며 더구나 HDCD의 디코더 칩은 HDCD 개발사인
퍼시픽 마이크로소닉스의 PMD100이 유일하므로 완벽에 가까운 재생력을 보이게 된 것입니다.
5. DVD-Audio
DVD-Audio는 스테레오(2채널)인 경우 192KHz/24Bit,
5.1채널인경우 96KHz/24Bit의 고음질을 구현할 수 있습니다.
또한 텍스트나 동영상이나 사진등도 담을 수 있으므로 멀티미디어적인 방식이라 할 수 있습니다.
DVD포맷을 이용하므로 DTS등도 담을 수 있는 효용성이 높은 방식입니다.
이러한 매체는 모두 디지털 방식이므로 이를 재생하기 위해 반드시 DAC가 필요하게 됩니다.
DAC은 쉽게 말해 디지털(D) 신호를 아날로그(A) 신호로 변환하는 컨버팅칩(C)을 말하는 것입니다.
24비트를 재생할 수 있는 칩이 당연히 좋겠지만 엄밀히 말하면 20비트까지가
음악신호를 처리하는 부분이고 4비트는 노이즈신호를 처리하는 부분입니다.
그래서 인지 CDP중에는 오히려 1Bit DAC을 사용하는 경우도 있습니다.
Bit-for-Bit 라고 표현하는데.. 들어오는 입력신호를 Bit단위로 다이렉트 처리하여 음손실을 줄이는 방식입니다.
고급CDP에 채용되면서 24Bit DAC와 비교대상이 되다 보니 논란의 여지를 만든 방식이기도 합니다.
▶ 무손실 비압축포맷
바로 웨이브(wave) 파일을 말합니다. 물론 원본에 비해 전혀 손실이 없는 것은 아니지만...
디지털화 한 파일중 가장 아날로그적인 음악포맷이라고 할 수 있습니다.
MS사와 IBM사가 만든 사운드 파일이며 녹음기로 녹음하듯 아날로그 오디오를 녹음하여 디지털화 한 것으로
8비트 16비트의 분해능과 초당 얼마만큼 세밀하게 디지털화하는지에 따라 22KHZ,44KHZ로 나뉘고,
스테레오와 모노, 압축도 가능합니다. 윈도우를 사용한다면 가장 간편하게 사용할 수 있는 포맷이기도 합니다.
CD음질 웨이브 파일이라고 하면...  44.1kHz 16bit stereo 로 만들어진 파일입니다.
▶ 손실 압축포맷
wav라는 확장자를 가진 웨이브 파일은 압축되지 않은 파일이며 원음과 가장 비슷하다고 볼 수 있습니다.
하지만 부담스러운 용량으로 인해 거의 사용되지 않고 있죠...
이를 해결하기 위해 압축된 형식의 파일이 필요하게 되면서 생겨난 것이 mp3와 같은 손실압축 포맷입니다.
이것은 필요가 없다고 생각되는 audio 정보를 버리는 손실압축방식인데 해당 파일의 포맷이 가지는 고유의
압축알고리즘으로 인해 불가피하게 잘려나가는 주파수 대역이 생기게 되므로 원본과 동일하게
다시 복구 할 수 없다는 의미에서 손실압축이라고 합니다.
1. mp3 (MPEG Audio Layer-3)
손실압축포맷의 대표적인 방식으로 확장자는 'mp3'이며 CD에 가까운 음질을 유지하면서
일반 CD의 10분의 1 이상으로 압축이 가능합니다. 사람은 모든 소리를 들을 수 없습니다..
심리 음향학(pycho-acoustics)에 의하면 큰소리 이후에 작은 소리를 인식하지 못하는..
사람의 특성을 기준으로 인지 하지 못하는 주파수 대역과 실재로 소리가 나도 듣지 못하게 되는 부분을
유추해서 고유의 알고리즘을 이용해 압축할때 이를 삭제하게 됩니다.
그래서 이런 압축 방식을 '인지 압축 방식(Perceptual Coding)'이라 부르기도 합니다.
당연히 한번 손실이 이루어진 mp3파일은 원래상태로 디코딩을 해도 다시 음질이 좋아지지는 않습니다.
mp3의 알고리즘에 대한 원천 특허는 브라운 호퍼사와 톰슨멀티미디어에서 가지고 있으며
윈앰프를 만든 nullsoft에서도 mp3에 관한 특허를 가지고 있습니다.
mp3로 인코딩 하기위한 모든 코덱은 특허료를 지불해야 하며현재 mp3에 관한 특허는 20여개가 훨씬 넘습니다.
2. OGG (Ogg Vorbis)
위에 언급한것처럼.. mp3에는 특허료를 비롯한 비용이 발생하게 되므로
mp3유료화에 반대하는 사람들이 미국 MIT의 학생이었던 크리스토퍼 몽고메리를
중심으로 mp3를 대체할 목적으로 만든 파일포맷이 바로 ogg(오그보비스)입니다.
ogg의 개발 목표는 mp3보다 더 높은 압축률과 더 뛰어난 음질...
그리고 오픈소스 형식으로 사용 및 배포,개발에 제한 없어야 한다는 것입니다.
무엇보다 ogg포맷을 상업용으로 사용한다 하더라도 제한이 없다는 점이 가장 큰 장점입니다.
다만 mp3에 비해 음질이 더 좋아지긴 했어도 이역시 손실 압축방식입니다.
3. WMA (Windows Media Audio)
윈도우를 만드는 Microsoft에서 개발한 음악포맷으로 최대의 장점은 스트리밍 서비스가
가능하다는것입니다. 스트리밍 서비스는 해당 음악을 하드디스크에 저장하고 듣는 것이 아니라
메모리(버퍼메모리 또는 가상메모리)에 저장하면서 실시간으로 음악을 재생하도록 하는 서비스 입니다.
'버퍼링중'이라는 말은 재생하기에 충분할만큼 파일이 전송되지 않았으니 잠시 기다리라는 뜻입니다.
이러한 서비스는 전송속도가 열악하던 모뎀시절에 원활한 서비스를위해 개발된것입니다.
하지만 스트리밍 서비스를 좀더 완벽하게 하기 위해서는 용량을 줄이는게 우선이었기 때문에..
wma포맷은 다른 음악포맷에 비해 용량이 상당히 작습니다.
mp3파일이 44100Hz, 16bit, Stereo를 저장하기 위해 128 Kbps가 소용되며
한곡에 약 3.5 ~ 4 MB의 용량을 필요로 하는데 반해 WMA는 동질의 사운드를 저장하기 위해
65Kbps 만을 필요로 하므로 약 절반의 용량인 1.6~1.8 MB 정도로 음악파일 하나를 표현할 수 있습니다.
4. ASF (Advanced Streaming Format)
1996년 인텔이 만든 차세대 멀티미디어 파일 포맷입니다. 역시 스트리밍이 가능하다는 점이 장점이며
ASF는 통합 멀티미디어 파일로 오디오뿐 아니라 비디오, 이미지등도 포함시킬 수 있습니다.
음질은 가장 떨어지지만 용량은 가장 작습니다.
5. RAM, RM
리얼원 플레이어를 개발한 리얼네트워크에서 좀더 완벽한 스트리밍 서비스를 위해 개발한 포맷이지만
우리나라에서는 많이 사용되고 있지는 않습니다. 한때 XXX동영상을 서비스하는 거시기한 회사들이
이 포맷을 많이 사용했었으나 근래는 많이 사용되지 않습니다.
다만 외국에서는 라디오 방송등에 적극 활용하고 있다고 합니다.
▶ 무손실 압축포맷...?
위와 같은 파일들의 가장 큰 장점은 원본과 비슷한 음질에 비해 용량이 작다는것이지만
반면에 가장큰 단점은 음질저하는 어쩔 수 없다는 것과 원래대로 복원이 불가능하다는 점입니다...
이를 해결하기 위해 개발된 포맷이 바로 무손실압축포맷이며
zip파일과 같이 데이타 압축에 사용하는 알고리즘을 이용하므로 원본과 동일하게 복원이 가능합니다.
1. APE (http://www.monkeysaudio.com 참조)
홈페이지에서 a fast and powerful lossless audio compressor 라고 밝히고 있는것 처럼
빠르고 강력하며 손실이 없는 압축음악포맷입니다. CD에서 바로 추출하거나
웨이브 파일을 손실없이 압축한 것이며 압축된 파일자체가 음악포맷이므로 바로 재생이 가능합니다.
보통 푸바를 이용해 재생을 하게 되며 Monkey's Audio설치시 Winamp를 위한 플러그인도 함께 설치되므로
윈앰프에서도 재생이 가능합니다. APE는 WAVE로 복원이 가능하고 압축과 복원을 반복해도
음질저하가 일어나지 않습니다. 즉 용량이 작은 웨이브파일이라고 보셔도 무방합니다.
Monkey's Audio라는 프로그램으로 CD에서 추출이 가능하며 Wave파일로 복원도 가능합니다.
다만 압축률이 약 50%정도이므로 웨이브 파일에 비하면 획기적으로 용량이 줄어들었다고 볼수 있지만..
mp3에 비하면 대단히 큰 용량이라 일부 고음질을 추구하는 유저들사이에서 많이 사용되고 있습니다.
독특한 점은 cue파일을 생성하므로 ape파일로 CD이미지를 추출후 다시 wav형식으로 바꾸면 함께 생성된
cue파일을 이용해 데몬에서 인식시키거나 네로를 이용해 원본과 동일한 CD를 만들 수 있습니다.
2. Flac (http://flac.sourceforge.net 참조)
EAC를 이용해 변환이 가능하며 APE와 동일하게 cue파일을 생성하고 대부분의 특성이 ape와 같습니다.
zip나 rar이 특성이 조금 다르긴 하지만 같은 압축파일인것 처럼 압축 알고리즘만 조금 다른 오디오포맷으로
이해하면 간단할 듯합니다. 역시 푸바와 윈앰프로 재생이 가능하며 EAC를 이용해 CD에서 변환할때 ape보다
변환(압축)속도가 느리고 압축률이 조금 떨어지지만 개인적으로는 가장 만족스러워 하는 파일 포맷이기도 합니다.
이외에도...
LPAC나..OptimFROG등의 무손실 압축포맷이 있으며 네로 버닝롬에는 이를 위한
LPAC와 OptimFROG 플러그인이 있습니다. 우리나라에서는 거의 사용되지 않으며 저역시 잘 모릅니다.
따라서 그냥 넘어가겠습니다.(^^ )
▶ Bitrate...?
동일한 곡을 128Kbps와 320Kbps로 변환했다면.. 어느게 더 음질이 좋을까요?
당연히 320Kbps를 선택하셨을 겁니다. 그렇다면 왜 음질이 좋을 까요?
Kbps는 용량을 뜻합니다. 128kbps라는 말은 초당 128kilobit를 할당한다는 말입니다.
동일한 시간안에 동일한 소리를 더 많은 양의 정보로 표현하므로 소리가 좋은것입니다.
그러나 이것은 용량의 단위일뿐이므로 서로 다른 포맷인경우 Kbps차이가 음질의 차이가 될 수는 없습니다.
다시 한번 말하자면 비트레이트가 높다는 것은 같은 시간안에 사용하는 데이타 양이 많아서 음질이 좋은거지
비트레이트자체가 음질을 나타내는 수치는 아니라는것이며 비트레이트는 용량 수치라는 점입니다.
참고 삼아 말씀 드리면 일반적인 44.1kHz/16Bit 오디오 CD의 비트레이트는 1411Kbps입니다.
▶ Sampling Rate..?
비트레이트가 용량을 나타낸다면 음질을 나타내는 sampling rate에 대해서도 알아야 겠죠.^^*
앞에서도 언급했지만.. 심화 학습을 위해 반복해서 설명하겠습니다.
CD는 sampling rate가 44.1kHz 이고 DVD는 sampling rate가 48kHz입니다.
이 말은 CD의 경우 소리에 대한 정보가 초당 44,100번씩 기록이 되어 있다는 뜻입니다.
DVD는 당연히 초당 48,000번이겠죠. 96KHz/24Bit 는 초당 96,000번을 24비트로 기록했다는 뜻이므로
당연히 더 고음질이 되는겁니다. 그래서 사운드 카드의 경우 96KHz/24Bit 또는 192KHz/24Bit까지
재생가능하다는 점을 강조하는 거구요.
같은 곡을 각각 320Kbps와 128Kbps로 변환한 mp3파일이 있다고 할때...
320Kbps의 파일정보를 보면 비트레이트는 320Kbps이고 샘플링 레이트는 44.1kHz로 되어 있습니다.
풀어서 설명하면 초당 44100번 정보를 기록하는데 320Kbps를 사용한다는 말입니다.
128Kbps짜리 파일은 같은 곡이지만.. 초당 44100번 정보를 기록하는데 128Kbps만 사용한 것이므로
320에 비해 음질이 떨어지는 것입니다. 만일 동일한 곡이지만 샘플링 레이트가 44.1과 96이라면
같은 비트레이트라 하더라도 음질의 차이가 있게 되는겁니다.
▶ VBR?  ABR?  CBR?
mp3파일을 보면.. VBR로 인코딩 했다거나 옵션을 ABR로 했다거나 하는 내용을 간간히 볼 수 있습니다.
VBR/CBR/ABR등은 음악파일 변환을 위한 비트레이트의 몇가지 기준입니다.
1. VBR
VBR(Vraiable Bitrate)은 소리바다에서 많이 보셨을겁니다.
가변비트레이트를 얘기하는 것으로 매초당 기록하는 정보의 양이 변하는 것입니다.
다시말해 기록해야할 음악정보가 많은 경우 많은 비트를 할당하고 그 반대인 경우는
사용할 비트를 줄여 용량을 줄이는 방식입니다.
2. ABR
"가용비트율"을 말하는 것으로 원래는 ATM포럼에서 정의한 전송서비스 관련용어 입니다.
통신망상태에 따라 서비스품질이 정해지는 방식인데..
음악파일 포맷에서는 평균비트레이트를 얘기한다고 합니다.
사용가능한 최상의 평균 비트레이트값을 구해서 그 값으로 변환하는거라고 할 수 있는데..
사실 잘 모르니.. 여기까지만 설명합니다.  
3. CBR
CBR은 사용자가 임의로 일정한 비트레이트 값을 정해 그 값으로 고정해서 기록하는 것이며
만약 128Kbps로 기록한다고 할때 기록해야할 소리가 많은 부분에도 128Kbps로
반대로 음악은 없이 목소리만 흘러나오는 부분을 기록할때도 역시 초당 128Kbps를
사용하므로 효율이 떨어지게 됩니다.
음질은 위에 기술한 순서대로  VBR - ABR - CBR입니다.

댓글