44.1Khz16bitの音質について
44.1Kとか48Kとか96Kとか、いろいろあるけど何が違うのか疑問に思ってことはありませんか?これらについて少し考えてみることにします
結論から言うと、アナログ時代の最高のアンプで普通の人が聞こえる最高音を出せる一番小さい値が44.1Khz16bitなのです
長い説明の前に、簡単にわかりたい人のために最初に結論をかいています。ここでは二つの数値、44.1Khzと16bitの2個の数字があります。
16bit
まず最初に16bitです。この数字はS/N比というものに関係しています。S/N比のSはシグナル、Nはノイズを表します。つまり一番大きな音を最小のノイズで割り算したときの比率です。どれだけ細かいニュアンスまたは、小さい音の違いを感じることができるかという数字です。普通はデシベルであらわされます。16ビットだとおよそ100デシベル弱のダイナミックレンジに相当します。
昔の最高級のアナログアンプ。たとえばマッキントッシュのS/N比がおよそ100デシベル弱です。マッキントッシュは普通の人には買えないくらい高価なアンプです。そのようなアンプの最高性能と16bitが一致しているわけです。
44.1Khz
44.1Khzで出せる最高音は、22.05Khzです。人間の耳で聞こえる最高音は20Khzです。もちろん音楽をやってる貴方はもっと高音も聞こえるのでしょうが、普通の人は10Khzくらいが限界です。44.1Khzというサンプリングレートは普通の人にとって十分な周波数ということになります。ちなみにマッキントッシュなどのアンプは40Khzでも普通に再生可能でした。でも40Khzの音が聞こえる人は稀ですから20Khzまで再生できれば十分というわけです。
PCMとは
さて、サンプリング周波数とかレートの原理ですが、これらはPCMと呼ばれる技法に基づいています。PCMはパルスコードモジュレーションの略です。パルスコードとはデジタルな値という意味です。量子化とも言います。モジュレーションは変調と言って、信号を別の形式に変えることです。AM変調とかFM変調とかはラジオではおなじみの言葉ですね。PCMは音をデジタルな値に変換するという意味ですね。
電圧をADコンバーターで数値にする
インピーダンスとかそいう話を脇においといて、たとえばコンデンサーマイクロフォンは振動版の位置によって静電容量が変わるので、回路側で振動版の位置をアナログに知ることができます。その静電容量の変化を電圧に変換したものを原音と考えることにします。つまり原音は空気の動きによって生じる電圧の変化と考えることにします。
ある瞬間を考えます。その瞬間に原音は「ある電圧」だっとします。電圧は空気の振動に従って変化しますが、時間を止めて、特定の瞬間を考え、その時の電圧が「ある電圧」であると考えることにします。この電圧をADコンバーターを使ってデジタルな数値に置き換えます。すると「ある瞬間」の「ある電圧」は「ある数値」だということになります。この数値を連続して記録すれば、電圧がどのように変化したかということがわかります。電圧の変化は空気の振動の変化ですから、数値からどのように空気が動いたかがわかるわけです。この空気の動きはもちろん、音です。
ADコンバーターとは
ADコンバーターとはアナログをデジタルに変換する装置です。いろいろなやり方があるのですが、理解しやすい逐次比較という方式を考えてみます。実は、アナログをデジタルにするよりデジタルをアナログにする方が簡単なのです。一番簡単なのはラダー抵抗という回路を使うのですが、それは置いておきます。デジタルからアナログは超簡単と理解します。アナログの電圧をデジタルにするには、デジタルで0からたとえば128Kの数字を順番に生成して、それをデジタルアナログコンバーターでアナログ電圧にします。それを入力電圧と比較します。両方の電圧が同じ電圧になった時のデジタルの値が、ADコンバーターの入力電圧となります。出力のデジタルの数値は先の同じになったデジタルの値ということになります。ADコンバーターはデジタルの値を作り出す回路とDAコンバーターとコンパレーター(比較回路)が基本構造ということになります。
ダイナミックレンジ
ダイナミックレンジは信号と最小ノイズの比です。最小ノイズの値が1として計算するとたとえば16ビットで表せる最大数は符号付で64Kですから、デシベルで表すと100デシベル弱になります。デシベルは対数で20デシベルが10倍を表します。100デシベルは20x5ですから十進数で5桁の表現ということになります。対数については深入りしませんが掛け算が足し算になるという性質があります。昔はエンジニアの神器であった計算尺はこの性質を利用して瞬間的に掛け算をする魔法の道具です。
サンプリングレート
さて、先のとこで「ある瞬間」という言葉がでてきました。1秒間にこの「ある瞬間」を幾つ作るかというのがサンプリングレートになります。Hzは周波数の単位で、「非常に速い電気振動について」という論文を書いたハインリッヒ・ヘルツの名前からきています。1秒間に繰り返される回数のことです。44.1Kは 44,100ですから毎秒44100回繰り返されるわけです。表現できる最高の周波数は、その値がサンプリング毎に繰り返される値になりますから、最高周波数はサンプリングレートの半分になります。
ADコンバーターのコスト
サンプリングレートが高くなると、電圧を数値に変換するための時間が短くなります。世の中、高速で動くものは低速で動くものより高価になります。だから可能な限りサンプリングレートは高くしたくないのです。また、ビット数が増えると、たくさんの数値を作り出さなければならなくなります。同じ時間の中でたくさんの数値を作るということは1個の数値をつくるのに必要な時間が少なくなる。つまり高速に数値を作り出す必要があります。そのため先の理由と同じでビット数が増えると高価になります。なるべく安いADコンバーターで作業できるようにするために、なるべくサンプリングレートは小さくしたいし、ビット数も小さくしたいわけです。そこで、どこまで小さい値にできるかという検討に入ることになります
冒頭に戻って結論
議論は冒頭に戻ります。CDができた当時の、普通の人が買えない高級アンプで、普通の人が聞こえない高音まで再生できる規格が44.1Khz16bitということなのです。