声卡采样率,越高越好吗(上)
采样率,可能是我们刚接触专业录音声卡时,最先接触到的专业名词之一了,时至今日,也可能是被讨论最多的话题之一。
高采样率下,音质一定更好吗?所谓的过采样技术,在音乐制作中有何意义?
今天,我们来稍微详细聊一聊有关采样率的话题!
#高采样率带来的“错觉”
我们先从解析度说起:
720x576分辨率的电视,以前看起来还不错,但跟现在的1920x1080比起来,区别显而易见!
音频标准也在进化,过去的CD标准是44.1kHz/16bit,现代的高清音频解析度可以高达96kHz/24bit,看上去似乎是个不小的提升。
但事实却并不简单!
Hi-Res(High Resolutio) Audio即高解析音频,一般指96kHz/24bit或更高解析度的音频;
HD(High Definition)Audio即高保真音频,如44.1 kHz/24-bit, 48 kHz/24-bit等。
#数学的智慧
我们结合实际测试,以便深入浅出。
如下图,在SoundForge里加载一个100Hz的正弦波,波形表示出在播放时,喇叭会进行怎样的振动:
【100Hz正弦波】
当放大到可以看清每一个采样点时:
【100Hz正弦波放大】
可以看到,每一个采样点之间,都是用直线连接的,但因为有足够多的采样点,所以在缩放到正常大小时,看起来是完美平滑的正弦波!
当然,我们听到的,自然也是标准的正弦波声音。
当我们换一个10kHz的正弦波,同理放大:
【10kHz正弦波放大】
看起来很糟糕,没有一点正弦波的样子,因为我们目前的采样率设置为48kHz,声波每半个振动周期只分到最少两个采样点,本应顺滑的波形,变得崎岖不平。
讲道理,这样的波形播放出来,应该不是地道的正弦波声音了!
但是,我们听到的依然是一个地道的正弦波声音!
因为实际上,在大多数音频编辑软件和DAW中,你并不能通过放大波形掌握真实情况!
对于计算机来说,通过直线连接每个采样点,又快又好,大多数情况下也没什么问题,但当数字信号真正转变成模拟信号时,这些点会被以平滑的曲线连接起来,而且并不是随随便便的曲线,这条曲线在数学理论上,是具有唯一性的!
我们换一个软件,它的显示方式并不会以过于数字的形式呈现波形。
如下图所见,即便每半个振动周期最少只有两个采样点,也已经足够去重现一个完美平滑的正弦波了!
【10kHz正弦波】
我们再进一步,下面是20kHz的正弦波放大之后:
【20kHz正弦波】
现在每半个周期只能分到不少于一个采样点,但依然足够重现出一个完美的正弦波!
如果声波频率增大到不够“半个周期至少一个采样点”,就会有问题!
信号的频率,如果快到足够在两个采样点之间从正到负走完一个周期,那么负的那半部分就会整个消失,电脑在解码计算时只看到两个位于正半部分的采样点,就会错误地将信号重建为一个更低频率的信号。
#采样定理
奈奎斯特采样定理告诉我们:在数字系统中,当采样率大于信号本身频率的两倍时,便可以完整地保留原始信号中的所有信息。
这就是为什么在数模转换中,存在连接所有采样点的唯一完美曲线!
因为20kHz,比CD的标准44.1kHz的一半小,所以CD的音质标准,足够还原一个20kHz的正弦波。
如果我们提高采样率,比如96kHz,那么我们就能记录最高48kHz的声音,但20kHz的正弦波,并不会因此变得更加精准!
【20kHz正弦波@48kHz采样率】
【20kHz正弦波@96kHz采样率】
#高采样率的意义
20kHz通常被认为是人耳听觉的上限,而事实上,大部分人成年之后,都会失去能听到如此高频声音的听觉。
44.1kHz的CD标准采样率,已经足够覆盖人耳的听觉范围,那为何我们还要采用更高的采样率呢?
从消费者的角度来说,过采样实际上没有多大意义:
【有关高采样率的辩论】
一些人声称那些极高的频率,哪怕从传统意义上讲听不见,依然会造成切实可以听得见的声音差异。
但这已经是学术领域的事了,大部分非科学研究的喇叭是没法重现那些超过20kHz的频率的。
此外大部分消费者对此也并不关心。
所以,即便是音乐制作,行业的录音标准依然是48kHz/24bit,这一标准当然会随着科技的进步,市场的需要而逐渐提高,但我们需要知道的是:在0-20kHz之间,无论是录音还是播放,更高的采样率并不会让声音更加精确!
但是高采样率并非没有意义,下期我们会继续聊聊过采样在实际音频处理和音乐制作中的具体意义!